Feinabstimmung von Hyperparametern in generativer KI

OCI Generative AI optimiert jedes Basismodell mit den folgenden Hyperparametern, die auf dem vortrainierten Basismodell basieren.

Tipp

Beginnen Sie mit dem Training jedes Modells mit seinen Standardhyperparameterwerten. Nachdem das Modell erstellt wurde, prüfen Sie auf der Detailseite des Modells unter Modellperformance die Werte auf Genauigkeit und Verlust. Wenn Sie mit den Ergebnissen nicht zufrieden sind, erstellen Sie ein anderes Modell mit einem größeren Dataset oder anderen Hyperparametern, bis sich die Performance verbessert.

meta.llama-3.3-70b-instruct

In der folgenden Tabelle werden die Hyperparameter beschrieben, die OCI Generative AI zum Trainieren eines meta.llama-3.3-70b-instruct-Basismodells mit der Methode LoRA verwendet.


Hyperparameter	Beschreibung	gültiger Bereich	Standardwert
Trainingsepochen gesamt	Gibt an, wie oft das Training durch das gesamte Trainings-Dataset iteriert. Beispiel: 1 `epoch` bedeutet, dass das Modell durch einmaliges Verwenden des gesamten Trainings-Datasets trainiert wird.	1 oder eine höhere Ganzzahl	3
Lernrate	Die Geschwindigkeit, mit der die Modellgewichtungen dem Fehlergradienten gegenüber aktualisiert werden.	Eine Zahl zwischen 0 und 1.0	0
Trainingsbatchgröße	Die Anzahl der Samples in einem Mini-Batch, die durchlaufen werden sollen, bevor die Parameter des Modells aktualisiert werden.	Eine Ganzzahl zwischen 8 und 16	8
Wartezeit für frühzeitiges Stoppen	Definiert die Anzahl der Nachfristen zum Fortsetzen des Bewertungszyklus, nachdem der Schwellenwert für das frühe Stoppen ausgelöst wurde. Das Training stoppt, wenn sich die Verlustmetrik bei so vielen Auswertungen nicht über den Schwellenwert für das frühe Stoppen hinaus verbessert.	0 zum Deaktivieren und 1 oder eine höhere Ganzzahl zum Hinzufügen einer Kulanzfrist	15
Schwellenwert für frühzeitiges Stoppen	Der Verlust verbessert sich, wenn er im nächsten Trainingszyklus abnimmt. Wenn der Verlust nicht genug verbessert, können Sie das Training stoppen. Definieren Sie die minimale Verbesserung des Bewertungsverlusts, die den frühen Stoppzähler auslösen soll. Wenn sich der Verlust während der Geduldszeit nicht über den Mindestwert hinaus verbessert, stoppt das Training. Andernfalls wird das Training fortgesetzt und der Zähler wird zurückgesetzt.	0 oder eine positive Zahl	0
Modellmetrikintervall schrittweise protokollieren	Die Anzahl der Schritte pro Logging. Modellkennzahlen wie Trainingsverlust und Lernrate werden protokolliert. Wenn der Trainingsverlust nicht wie erwartet abnimmt, überprüfen Sie die Trainingsdaten oder die Trainingsrate.	Auf 10 voreingestellt	10
`LoRA r` (nur für Methode `LoRA`)	Die Aufmerksamkeitsdimension (Rang) der Aktualisierungsmatrizen. Ein niedrigerer Rang führt zu kleineren Update-Matrizen mit weniger trainierbaren Parametern.	Eine Ganzzahl zwischen 1 und 64	8
`LoRA alpha` (nur für Methode `LoRA`)	Der Parameter `alpha` für die `LoRA`-Skalierung. Die Gewichtsmatrizen `LoRA` werden durch Division von `LoRA` alpha durch `LoRA r` skaliert. Der Parameter `alpha` definiert die Gewichtungen `LoRA`, bei denen es sich um eine kleinere Anzahl neuer Gewichtungen handelt und die einzigen Gewichtungen sind, die im Modell trainiert werden.	Eine Ganzzahl zwischen 1 und 128	8
`LoRA dropout` (nur für Methode `LoRA`)	Die Ausfallwahrscheinlichkeit für Neuronen in den `LoRA`-Schichten. Das Dropout-Verfahren verhindert ein Überfitting durch zufälliges Ignorieren (Auslassen) von Neuronen innerhalb einer Schicht. Ein 10% Dropout bedeutet, dass jedes Neuron eine 10%ige Chance hat, fallen gelassen zu werden.	Eine Dezimalzahl kleiner als 1 für den Prozentsatz, z.B. 0,1 für 10%	0,1

Die folgende Gleichung zeigt, wie das Modell den Parameter totalTrainingSteps berechnet.

totalTrainingSteps = (totalTrainingEpochs * size(trainingDataset)) / trainingBatchSize