Définition
SFT est l'approche de fine-tuning la plus courante : rassemblez des paires d'entrées et de sorties désirées, puis entraînez le modèle à produire ces sorties. Cela fonctionne mieux quand vous avez des données propres et de haute qualité — typiquement 1 000+ paires pour un effet significatif. SFT est souvent combiné avec LoRA pour réduire le coût en compute.
Exemple
5 000 exemples de requêtes de support client appariées avec des réponses idéales, utilisées pour fine-tuner un modèle Llama 3 8B.
Comment Vedwix utilise ceci
Nous investissons plus dans la curation de jeux de données que dans la taille de modèle. Données de qualité > plus de paramètres.
Vous travaillez sur un projet de Fine-tuning supervisé (SFT)?
Fine-tuning supervisé (SFT).
Décrivez votre projet en trois phrases ou moins.
Démarrer un projet