Definición
SFT es el enfoque de ajuste fino más común: reúna pares de entradas y salidas deseadas, luego entrene al modelo para producir esas salidas. Funciona mejor cuando se tienen datos limpios y de alta calidad — típicamente 1.000+ pares para un efecto significativo. SFT a menudo se combina con LoRA para reducir el costo de cómputo.
Ejemplo
5.000 ejemplos de consultas de soporte al cliente emparejadas con respuestas ideales, utilizadas para ajustar finamente un modelo Llama 3 8B.
Cómo Vedwix usa esto
Invertimos en curación de conjuntos de datos más que en tamaño del modelo. Datos de calidad > más parámetros.
Trabajando en un proyecto de Ajuste fino supervisado (SFT)?
Ajuste fino supervisado (SFT).
Cuéntanos sobre tu proyecto en tres frases o menos.
Iniciar un proyecto