Definition
SFT ist der gängigste Feinabstimmungsansatz: Sammeln Sie Paare von Eingaben und gewünschten Ausgaben und trainieren Sie dann das Modell, um diese Ausgaben zu produzieren. Es funktioniert am besten, wenn Sie saubere, hochwertige Daten haben — typischerweise 1.000+ Paare für eine signifikante Wirkung. SFT wird oft mit LoRA kombiniert, um die Rechenkosten zu reduzieren.
Beispiel
5.000 Beispiele von Kundensupport-Anfragen gepaart mit idealen Antworten, verwendet zur Feinabstimmung eines Llama-3-8B-Modells.
Wie Vedwix das verwendet
Wir investieren mehr in Datensatz-Kuration als in Modellgröße. Qualitätsdaten > mehr Parameter.
Sie arbeiten an einem Projekt rund um Supervised Fine-Tuning (SFT)?
Supervised Fine-Tuning (SFT).
Beschreiben Sie Ihr Projekt in drei Sätzen oder weniger.
Projekt starten