Google Cloudは、Vertex AIに新しいテキスト埋め込みモデル「text-embedding-004」と「text-multilingual-embedding-002」を発表しました。これらのモデルは、「タスクタイプ」に基づいて最適化された埋め込みを生成できます。これは、Retrieval Augmented Generation(RAG)アプリケーションにとって重要な開発です。

従来のセマンティック類似性検索は、RAGでは正確な結果を返すのに苦労することがよくありました。これは、質問と回答は本質的に異なるためです。たとえば、「空はなぜ青いのですか?」という質問と、「太陽光の散乱が青い色の原因です」という回答は、異なる意味を持っています。

「タスクタイプ」は、モデルがクエリとその回答の関係を理解できるようにすることで、このギャップを埋めます。クエリテキストに「QUESTION_ANSWERING」、回答テキストに「RETRIEVAL_DOCUMENT」を指定することで、モデルは埋め込み空間で埋め込みを互いに近くに配置できるようになり、より正確な検索結果が得られます。

これらの新しいモデルは、「LLM蒸留」を活用しています。LLM蒸留とは、大規模言語モデル(LLM)からより小さなモデルをトレーニングするプロセスです。これにより、埋め込みモデルはLLMの推論能力の一部を継承し、レイテンシとコストを削減しながら検索品質を向上させることができます。

結論として、Vertex AI Embeddingsの「タスクタイプ」は、RAGシステムの精度と効率を向上させるための重要なステップです。セマンティック検索を簡素化することで、この機能は開発者がよりインテリジェントで言語を認識したアプリケーションを構築できるようにします。