Instruction Tuning
Instruction Tuning
Auch bekannt als:
Anweisungs-Training
Instruction Tuning verbessert die Fähigkeit von Sprachmodellen, natürlichsprachliche Anweisungen zu befolgen.
Prozess
- Sammlung von Anweisung-Antwort-Paaren
- Fine-Tuning des Basismodells
- Evaluation und Iteration