ドキュメント管理機能
チャット機能でAIが回答を作成する際に参考にする、参照用のドキュメント登録を行う機能を説明します。
ドキュメントを参照するためには、ファイルを登録し、リトリーバーを作成する必要があります。 リトリーバーは登録されたファイルの断片と検索データ用のデータを保存します。
登録されたドキュメントの内容は、チャット作成時にリトリーバー設定することで、その内容を参照した回答をAIにさせることが出来ます。
利用可能なファイルフォーマット
以下のファイルフォーマットが利用可能です
- テキスト文書 (.txt)
- PDF ファイル (.pdf)
- Microsoft Word 文書 (.docx)
- Microsoft PowerPoint プレゼンテーション (.pptx)
- HTML (.html)
- Markdown ファイル (.md)
- CSV ファイル (.csv)
- Microsoft Excel 文書 (.xlsx)
Warning
CSVファイルとExcel 文書は、特定のフォーマットのものに限られます。
具体的には、一列目に各カラムのタイトル、2列目以降にデータが含まれているようなファイルとなります。 これは、リトリーバー登録時のファイルの分割を手動で行い、リトリーバーに登録することを目的に作られた機能であり、それ以外の用途で利用については動作を保証しません。
一般的なテーブルデータとしてのCSVファイルやExcelデータを登録してもうまくいかない可能性が高いことに留意してください。
ファイルの登録
サイドバー左下の 「Data Processing」をクリックし、ドキュメント管理ページに移動します。
ドキュメント管理ページが表示されます。
「Add Documents」をクリックするとアップロード用のウィンドウが表示されます。
ファイルアップローダーを使用して、登録したいドキュメントを選択します。
選択したドキュメントが表示されます。
必要に応じてドキュメント名を変更することが出来ます(設定しない場合、元のファイル名がそのまま使われます)。 また、複数のファイルを同時に登録することが出来ます。アップローダーで複数のファイルを選択してください。
リトリーバーを作成する必要がない場合は、「Upload File」 ボタンをクリックすれば、ドキュメントが登録されます。
リトリーバーの登録
リトリーバーを作成する場合は、Create Retrieverにチェックを入れます。 リトリーバーは、登録しようとしているファイル群に対して新しく作成するか、既存のリトリーバーに対して、登録しようとしているファイル群を追加するか選択できます。
リトリーバーを作成する場合にキーワードマスク機能の利用が可能です。 キーワードマスク機能の詳細については、キーワードマスク機能のページを参照してください。
登録が完了すると、登録したファイルが「File List」タブに、リトリーバーが「Retriever List」タブに表示されます。
Internal Error が表示される場合
リトリーバーの登録は、Azure OpenAI の embedding APIを利用して行われています。 一度に多くのファイルを登録したり、大きなファイルを登録した場合に、Azure OpenAI側のレートリミットに起因するエラーが起こる場合があります。
リトリーバーの登録に失敗する場合は、時間をおいてから再度実行するか、大きなファイルは分割して既存のリトリーバーに追加する方法をお試しください。
URLからのドキュメントの作成
URLを指定して、その内容からドキュメントを作成できます。
「Add Url」 ボタンをクリックします。
URLを指定します。必要に応じてドキュメントに名前を付けます(指定しない場合、URLがそのまま名前となります)。
「Create File From URL」 ボタンをクリックし、ドキュメントを登録します。
リトリーバーの登録に関してはファイルを登録する場合と同一です。
Note
登録が可能なURLは静的なサイトになります。javascriptなどを用いて動的にページを生成するようなサイトに関しては、登録がうまくいかない可能性がありますのでご注意ください。
ドキュメントの一覧、削除
登録されたファイル、およびリトリーバーはそれぞれ「File List」「Retriever List」タブで確認できます。
登録したファイル、リトリーバーはゴミ箱アイコンをクリックすることで削除できます。
ファイルを削除した場合でも、それを含むリトリーバーからそのファイルの内容は失われません。
リトリーバーを削除すると、それらを参照しているチャットは新しい会話を続けられなくなります。 ただし、会話の履歴は引き続き参照できます。