検索拡張生成に基づいてQAシステム
RAG-based QA System は、RAG アーキテクチャを Python でゼロから実装した質問応答システムです。 ユーザーが提供するドキュメント(PDF / Markdown / テキスト)を読み込み、ベクトルデータベースとして保存し、自然言語の質問に対して 関連するコンテキストを検索 → LLM が回答を生成 するパイプラインを実現します。 主な機能: 1.ドキュメントの自動読み込み・チャンク分割 — PDF、Markdown、テキストファイルに対応 2.ベクトル化 & 類似度検索 — コサイン類似度による高精度な関連文書検索 3.マルチ LLM 対応 — ZhipuAI GLM-4 / OpenAI GPT / InternLM を選択可能 4.多言語サポート — 中国語 🇨🇳 と日本語 🇯🇵 のプロンプトテンプレートを内蔵 5.ベクトルデータベースの永続化 — JSON 形式で保存・再利用が可能 6.ローカル & API 両対応 — API モード(ZhipuAI / OpenAI)とローカルモデル(Jina / InternLM)を柔軟に切替