定義
コンテキストウィンドウはモデルのワーキングメモリです — 1回の推論で処理できるトークンの合計(プロンプト+応答)です。最新のフロンティアモデルは200kから2Mトークンをサポートしますが、品質は数十万トークンを超えると劣化することがよくあります。長文脈の使用例には、ドキュメント分析、コードベース推論、マルチターンエージェントが含まれます。
例
Claudeの200kコンテキストウィンドウは約500ページのテキストを保持でき、完全な法的契約や医療記録に十分です。
Vedwixでの使用方法
コーパスが100kトークンを超える場合、長文脈上のRAGを設計します — チャンキングと検索は依然としてブルートフォースのコンテキストに勝ります。