用語集 · 日本語

教師あり微調整 (SFT)

ラベル付き入出力ペアでモデルをファインチューニングすること。

日本語 · Japanese

定義

SFTは最も一般的なファインチューニングアプローチです: 入力と望ましい出力のペアを集め、それらの出力を生成するようにモデルを訓練します。クリーンで高品質のデータがある場合に最も効果的です — 通常、意味のある効果のために1,000ペア以上です。SFTは多くの場合LoRAと組み合わされてコンピューティングコストを削減します。

Llama 3 8Bモデルをファインチューニングするために使用される、理想的な応答とペアになった5,000のカスタマーサポートクエリの例。

Vedwixでの使用方法

モデルサイズよりもデータセットキュレーションに投資します。質のあるデータ > より多くのパラメータ。

プロジェクトでお困りですか 教師あり微調整 (SFT)?

教師あり微調整 (SFT).

3つの文章でプロジェクトについてお聞かせください。

プロジェクトを開始

教師あり微調整 (SFT)

3つの文章でプロジェクトについてお聞かせください。

プロジェクトを開始