定義
SFTは最も一般的なファインチューニングアプローチです: 入力と望ましい出力のペアを集め、それらの出力を生成するようにモデルを訓練します。クリーンで高品質のデータがある場合に最も効果的です — 通常、意味のある効果のために1,000ペア以上です。SFTは多くの場合LoRAと組み合わされてコンピューティングコストを削減します。
例
Llama 3 8Bモデルをファインチューニングするために使用される、理想的な応答とペアになった5,000のカスタマーサポートクエリの例。
Vedwixでの使用方法
モデルサイズよりもデータセットキュレーションに投資します。質のあるデータ > より多くのパラメータ。