定義
エンベディングは高次元ベクトル — 通常256〜3072次元 — で、コンテンツの意味的意味を表します。類似した意味のテキストは、ベクトル空間で近いエンベディングを生成します。エンベディングはセマンティック検索、推奨、分類、RAGの検索ステップを支えます。
例
「青いランニングシューズ」と「アジュールのアスレチックスニーカー」の2つの製品説明は、単語がほとんど重複していなくても、非常に近いエンベディングを生成します。
Vedwixでの使用方法
プロジェクトごとに複数のエンベディングモデル — text-embedding-3-large、voyage-3、gte — をベンチマークします。適切なモデルはドメインに依存するためです。