Update on "[fix] float8 should be applied on all model_parts"

tianyu-l · tianyu-l · commit 65f979116188 · 2024-08-05T15:49:44.000-07:00
[ghstack-poisoned]
diff --git a/train_configs/llama3_405b.toml b/train_configs/llama3_405b.toml
@@ -23,7 +23,7 @@ tokenizer_path = "./torchtitan/datasets/tokenizer/original/tokenizer.model"
 
 [optimizer]
 name = "AdamW"
-lr = 0.8e-4
+lr = 8e-5
 
 [training]
 batch_size = 2