大学院工学研究科 博士前期課程 知識社会基礎工学専攻 知能システム科学コース2年、工学部 機械・システム工学科4年
松原 佳寛さん、糀谷 斗和さん
近年、生成 AIが広く普及し、多くの人が Chat GPT などのサービスを活用するようになりました。しかし、それらのサービスは、汎用的な知識に関する質問には正確な返答を行うことができますが、社内文書や研究論文などの専門的な知識には回答できません。また、機密性の高い文書をクラウドサービスに提供することは、情報漏洩のリスクにつながります。そこで、私たちは機密性の高い独自文書の知識をオンプレミスで獲得し、それらに関する質問に正確に答えるチャットボットアプリを開発しました。
本システムでは、初めにユーザがチャットアプリに質問します。次に、機密文書などのデータベースから質問文と機密データの類似度計算をもとにデータ検索を行います。その後、独自の類似度評価をもとにデータを取得します。そして、質問とデータを組み合わせてコマンドプロンプトを作成し、大規模言語モデルであるLLMエンジンが回答文を生成します。最後にユーザがその回答を受け取ることができます。
主要機能として、社内文書などの pdf をアップロードする機能、ユーザの質問をもとに文書を検索し、LLMに質問と検索結果を入力する機能、チャットの履歴を保存する機能に加えて、チャット履歴をトピックとして保存する機能を提供します。
以上のことから、今後多くの企業や学校、研究機関で活用でき、さらに誰もが使いやすいという成果を実現することができました。
最新の技術を扱ったことから、情報の少なさや環境による格差など想像以上の難しさを痛感し、開発にあたって紆余曲折を強いられました。今後は、今まで以上に新しい技術や情報を吸収していく必要があると感じました。
最後に、常日頃熱心にご指導していただいた黒岩教授、松田助教、どんなときも相談に乗ってくれた研究室の先輩方や同期のメンバーに深く感謝します。