emre
/

wav2vec2-large-xls-r-300m-tr

+{
+    "epoch": 100.0,
+    "eval_loss": 0.22239123284816742,
+    "eval_runtime": 238.7764,
+    "eval_samples": 8339,
+    "eval_samples_per_second": 34.924,
+    "eval_steps_per_second": 1.093,
+    "eval_wer": 0.2869353988587666,
+    "train_loss": 1.2247810986577248,
+    "train_runtime": 113701.5353,
+    "train_samples": 25058,
+    "train_samples_per_second": 22.038,
+    "train_steps_per_second": 0.69
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 100.0,
+    "eval_loss": 0.22239123284816742,
+    "eval_runtime": 238.7764,
+    "eval_samples": 8339,
+    "eval_samples_per_second": 34.924,
+    "eval_steps_per_second": 1.093,
+    "eval_wer": 0.2869353988587666
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 100.0,
+    "train_loss": 1.2247810986577248,
+    "train_runtime": 113701.5353,
+    "train_samples": 25058,
+    "train_samples_per_second": 22.038,
+    "train_steps_per_second": 0.69
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,2365 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 100.0,
+  "global_step": 78400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.9880000000000003e-05,
+      "loss": 6.8222,
+      "step": 500
+    },
+    {
+      "epoch": 0.64,
+      "eval_loss": 3.502612352371216,
+      "eval_runtime": 238.4374,
+      "eval_samples_per_second": 34.974,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 1.987240051347882e-05,
+      "loss": 3.2136,
+      "step": 1000
+    },
+    {
+      "epoch": 1.28,
+      "eval_loss": 3.0592851638793945,
+      "eval_runtime": 239.7957,
+      "eval_samples_per_second": 34.775,
+      "eval_steps_per_second": 1.088,
+      "eval_wer": 0.9999770836675298,
+      "step": 1000
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 1.9744030808729143e-05,
+      "loss": 2.8882,
+      "step": 1500
+    },
+    {
+      "epoch": 1.91,
+      "eval_loss": 2.4670279026031494,
+      "eval_runtime": 236.3109,
+      "eval_samples_per_second": 35.288,
+      "eval_steps_per_second": 1.104,
+      "eval_wer": 0.9938584228979994,
+      "step": 1500
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 1.9615661103979463e-05,
+      "loss": 2.3743,
+      "step": 2000
+    },
+    {
+      "epoch": 2.55,
+      "eval_loss": 1.1843628883361816,
+      "eval_runtime": 239.6417,
+      "eval_samples_per_second": 34.798,
+      "eval_steps_per_second": 1.089,
+      "eval_wer": 0.8656873753924422,
+      "step": 2000
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 1.9487291399229784e-05,
+      "loss": 1.9456,
+      "step": 2500
+    },
+    {
+      "epoch": 3.19,
+      "eval_loss": 0.8227887153625488,
+      "eval_runtime": 238.3867,
+      "eval_samples_per_second": 34.981,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.7397162958040195,
+      "step": 2500
+    },
+    {
+      "epoch": 3.83,
+      "learning_rate": 1.9358921694480104e-05,
+      "loss": 1.7781,
+      "step": 3000
+    },
+    {
+      "epoch": 3.83,
+      "eval_loss": 0.6826250553131104,
+      "eval_runtime": 237.1431,
+      "eval_samples_per_second": 35.164,
+      "eval_steps_per_second": 1.101,
+      "eval_wer": 0.6752984852304237,
+      "step": 3000
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 1.9230551989730427e-05,
+      "loss": 1.6848,
+      "step": 3500
+    },
+    {
+      "epoch": 4.46,
+      "eval_loss": 0.5885177254676819,
+      "eval_runtime": 235.3547,
+      "eval_samples_per_second": 35.432,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.6139743795402983,
+      "step": 3500
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 1.9102182284980744e-05,
+      "loss": 1.6228,
+      "step": 4000
+    },
+    {
+      "epoch": 5.1,
+      "eval_loss": 0.527351975440979,
+      "eval_runtime": 237.0762,
+      "eval_samples_per_second": 35.174,
+      "eval_steps_per_second": 1.101,
+      "eval_wer": 0.5788894745284965,
+      "step": 4000
+    },
+    {
+      "epoch": 5.74,
+      "learning_rate": 1.8973812580231068e-05,
+      "loss": 1.5768,
+      "step": 4500
+    },
+    {
+      "epoch": 5.74,
+      "eval_loss": 0.48999691009521484,
+      "eval_runtime": 235.6055,
+      "eval_samples_per_second": 35.394,
+      "eval_steps_per_second": 1.108,
+      "eval_wer": 0.5518711185461879,
+      "step": 4500
+    },
+    {
+      "epoch": 6.38,
+      "learning_rate": 1.8845699614890885e-05,
+      "loss": 1.5431,
+      "step": 5000
+    },
+    {
+      "epoch": 6.38,
+      "eval_loss": 0.45079049468040466,
+      "eval_runtime": 235.5935,
+      "eval_samples_per_second": 35.396,
+      "eval_steps_per_second": 1.108,
+      "eval_wer": 0.5237986112702523,
+      "step": 5000
+    },
+    {
+      "epoch": 7.02,
+      "learning_rate": 1.871732991014121e-05,
+      "loss": 1.5019,
+      "step": 5500
+    },
+    {
+      "epoch": 7.02,
+      "eval_loss": 0.42483240365982056,
+      "eval_runtime": 235.975,
+      "eval_samples_per_second": 35.338,
+      "eval_steps_per_second": 1.106,
+      "eval_wer": 0.5021426770859592,
+      "step": 5500
+    },
+    {
+      "epoch": 7.65,
+      "learning_rate": 1.858921694480103e-05,
+      "loss": 1.4684,
+      "step": 6000
+    },
+    {
+      "epoch": 7.65,
+      "eval_loss": 0.4009439945220947,
+      "eval_runtime": 236.3695,
+      "eval_samples_per_second": 35.28,
+      "eval_steps_per_second": 1.104,
+      "eval_wer": 0.4827096271512707,
+      "step": 6000
+    },
+    {
+      "epoch": 8.29,
+      "learning_rate": 1.846084724005135e-05,
+      "loss": 1.4635,
+      "step": 6500
+    },
+    {
+      "epoch": 8.29,
+      "eval_loss": 0.3830302357673645,
+      "eval_runtime": 234.8449,
+      "eval_samples_per_second": 35.509,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.4700139789628068,
+      "step": 6500
+    },
+    {
+      "epoch": 8.93,
+      "learning_rate": 1.833247753530167e-05,
+      "loss": 1.4291,
+      "step": 7000
+    },
+    {
+      "epoch": 8.93,
+      "eval_loss": 0.3707072138786316,
+      "eval_runtime": 237.9649,
+      "eval_samples_per_second": 35.043,
+      "eval_steps_per_second": 1.097,
+      "eval_wer": 0.45947246602653713,
+      "step": 7000
+    },
+    {
+      "epoch": 9.57,
+      "learning_rate": 1.820410783055199e-05,
+      "loss": 1.4271,
+      "step": 7500
+    },
+    {
+      "epoch": 9.57,
+      "eval_loss": 0.3570108115673065,
+      "eval_runtime": 236.9986,
+      "eval_samples_per_second": 35.186,
+      "eval_steps_per_second": 1.101,
+      "eval_wer": 0.4514059169970438,
+      "step": 7500
+    },
+    {
+      "epoch": 10.2,
+      "learning_rate": 1.807573812580231e-05,
+      "loss": 1.3938,
+      "step": 8000
+    },
+    {
+      "epoch": 10.2,
+      "eval_loss": 0.34792855381965637,
+      "eval_runtime": 234.9447,
+      "eval_samples_per_second": 35.493,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.4378394481747141,
+      "step": 8000
+    },
+    {
+      "epoch": 10.84,
+      "learning_rate": 1.794762516046213e-05,
+      "loss": 1.3914,
+      "step": 8500
+    },
+    {
+      "epoch": 10.84,
+      "eval_loss": 0.3395732045173645,
+      "eval_runtime": 235.1285,
+      "eval_samples_per_second": 35.466,
+      "eval_steps_per_second": 1.11,
+      "eval_wer": 0.4368082132135573,
+      "step": 8500
+    },
+    {
+      "epoch": 11.48,
+      "learning_rate": 1.7819255455712454e-05,
+      "loss": 1.3767,
+      "step": 9000
+    },
+    {
+      "epoch": 11.48,
+      "eval_loss": 0.3253381848335266,
+      "eval_runtime": 238.3808,
+      "eval_samples_per_second": 34.982,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.42622086761234734,
+      "step": 9000
+    },
+    {
+      "epoch": 12.12,
+      "learning_rate": 1.7690885750962775e-05,
+      "loss": 1.3641,
+      "step": 9500
+    },
+    {
+      "epoch": 12.12,
+      "eval_loss": 0.32509171962738037,
+      "eval_runtime": 234.3424,
+      "eval_samples_per_second": 35.585,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.4178105735958017,
+      "step": 9500
+    },
+    {
+      "epoch": 12.76,
+      "learning_rate": 1.7562772785622595e-05,
+      "loss": 1.355,
+      "step": 10000
+    },
+    {
+      "epoch": 12.76,
+      "eval_loss": 0.3138255476951599,
+      "eval_runtime": 234.3344,
+      "eval_samples_per_second": 35.586,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.4135710520888237,
+      "step": 10000
+    },
+    {
+      "epoch": 13.39,
+      "learning_rate": 1.7434403080872915e-05,
+      "loss": 1.336,
+      "step": 10500
+    },
+    {
+      "epoch": 13.39,
+      "eval_loss": 0.31212833523750305,
+      "eval_runtime": 238.4088,
+      "eval_samples_per_second": 34.978,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.40694823200494995,
+      "step": 10500
+    },
+    {
+      "epoch": 14.03,
+      "learning_rate": 1.7306033376123236e-05,
+      "loss": 1.3292,
+      "step": 11000
+    },
+    {
+      "epoch": 14.03,
+      "eval_loss": 0.30410972237586975,
+      "eval_runtime": 233.9502,
+      "eval_samples_per_second": 35.644,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.4014483122121136,
+      "step": 11000
+    },
+    {
+      "epoch": 14.67,
+      "learning_rate": 1.7177663671373556e-05,
+      "loss": 1.3249,
+      "step": 11500
+    },
+    {
+      "epoch": 14.67,
+      "eval_loss": 0.3013543486595154,
+      "eval_runtime": 234.7846,
+      "eval_samples_per_second": 35.518,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.3931296835254486,
+      "step": 11500
+    },
+    {
+      "epoch": 15.31,
+      "learning_rate": 1.704929396662388e-05,
+      "loss": 1.3156,
+      "step": 12000
+    },
+    {
+      "epoch": 15.31,
+      "eval_loss": 0.301371306180954,
+      "eval_runtime": 237.6831,
+      "eval_samples_per_second": 35.085,
+      "eval_steps_per_second": 1.098,
+      "eval_wer": 0.39294635286568735,
+      "step": 12000
+    },
+    {
+      "epoch": 15.94,
+      "learning_rate": 1.69209242618742e-05,
+      "loss": 1.313,
+      "step": 12500
+    },
+    {
+      "epoch": 15.94,
+      "eval_loss": 0.29687899351119995,
+      "eval_runtime": 234.864,
+      "eval_samples_per_second": 35.506,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.39679629672067285,
+      "step": 12500
+    },
+    {
+      "epoch": 16.58,
+      "learning_rate": 1.679255455712452e-05,
+      "loss": 1.3068,
+      "step": 13000
+    },
+    {
+      "epoch": 16.58,
+      "eval_loss": 0.2965061664581299,
+      "eval_runtime": 239.4104,
+      "eval_samples_per_second": 34.831,
+      "eval_steps_per_second": 1.09,
+      "eval_wer": 0.39663588239338177,
+      "step": 13000
+    },
+    {
+      "epoch": 17.22,
+      "learning_rate": 1.666444159178434e-05,
+      "loss": 1.2785,
+      "step": 13500
+    },
+    {
+      "epoch": 17.22,
+      "eval_loss": 0.29434436559677124,
+      "eval_runtime": 241.1756,
+      "eval_samples_per_second": 34.576,
+      "eval_steps_per_second": 1.082,
+      "eval_wer": 0.38497146916607466,
+      "step": 13500
+    },
+    {
+      "epoch": 17.86,
+      "learning_rate": 1.653607188703466e-05,
+      "loss": 1.2867,
+      "step": 14000
+    },
+    {
+      "epoch": 17.86,
+      "eval_loss": 0.291163831949234,
+      "eval_runtime": 234.1726,
+      "eval_samples_per_second": 35.61,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.37821115108737996,
+      "step": 14000
+    },
+    {
+      "epoch": 18.49,
+      "learning_rate": 1.640770218228498e-05,
+      "loss": 1.2714,
+      "step": 14500
+    },
+    {
+      "epoch": 18.49,
+      "eval_loss": 0.281938374042511,
+      "eval_runtime": 233.7302,
+      "eval_samples_per_second": 35.678,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.3746820358869766,
+      "step": 14500
+    },
+    {
+      "epoch": 19.13,
+      "learning_rate": 1.6279332477535305e-05,
+      "loss": 1.2844,
+      "step": 15000
+    },
+    {
+      "epoch": 19.13,
+      "eval_loss": 0.28400421142578125,
+      "eval_runtime": 234.7428,
+      "eval_samples_per_second": 35.524,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.3740403785778124,
+      "step": 15000
+    },
+    {
+      "epoch": 19.77,
+      "learning_rate": 1.6150962772785625e-05,
+      "loss": 1.2684,
+      "step": 15500
+    },
+    {
+      "epoch": 19.77,
+      "eval_loss": 0.2913394272327423,
+      "eval_runtime": 238.9443,
+      "eval_samples_per_second": 34.899,
+      "eval_steps_per_second": 1.092,
+      "eval_wer": 0.38279441758141025,
+      "step": 15500
+    },
+    {
+      "epoch": 20.41,
+      "learning_rate": 1.6022849807445445e-05,
+      "loss": 1.26,
+      "step": 16000
+    },
+    {
+      "epoch": 20.41,
+      "eval_loss": 0.27389487624168396,
+      "eval_runtime": 235.3865,
+      "eval_samples_per_second": 35.427,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.3674404748264088,
+      "step": 16000
+    },
+    {
+      "epoch": 21.05,
+      "learning_rate": 1.5894736842105266e-05,
+      "loss": 1.2543,
+      "step": 16500
+    },
+    {
+      "epoch": 21.05,
+      "eval_loss": 0.2739649713039398,
+      "eval_runtime": 234.6769,
+      "eval_samples_per_second": 35.534,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.36909045076425967,
+      "step": 16500
+    },
+    {
+      "epoch": 21.68,
+      "learning_rate": 1.5766367137355586e-05,
+      "loss": 1.2532,
+      "step": 17000
+    },
+    {
+      "epoch": 21.68,
+      "eval_loss": 0.2709480822086334,
+      "eval_runtime": 236.2528,
+      "eval_samples_per_second": 35.297,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.37562160551825285,
+      "step": 17000
+    },
+    {
+      "epoch": 22.32,
+      "learning_rate": 1.5637997432605906e-05,
+      "loss": 1.2409,
+      "step": 17500
+    },
+    {
+      "epoch": 22.32,
+      "eval_loss": 0.266906201839447,
+      "eval_runtime": 233.9016,
+      "eval_samples_per_second": 35.652,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.35932809313197517,
+      "step": 17500
+    },
+    {
+      "epoch": 22.96,
+      "learning_rate": 1.5509627727856227e-05,
+      "loss": 1.2404,
+      "step": 18000
+    },
+    {
+      "epoch": 22.96,
+      "eval_loss": 0.2673003077507019,
+      "eval_runtime": 235.0288,
+      "eval_samples_per_second": 35.481,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.35763228452918394,
+      "step": 18000
+    },
+    {
+      "epoch": 23.6,
+      "learning_rate": 1.538125802310655e-05,
+      "loss": 1.2347,
+      "step": 18500
+    },
+    {
+      "epoch": 23.6,
+      "eval_loss": 0.2678009271621704,
+      "eval_runtime": 234.3074,
+      "eval_samples_per_second": 35.59,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.36427802094552786,
+      "step": 18500
+    },
+    {
+      "epoch": 24.23,
+      "learning_rate": 1.5252888318356869e-05,
+      "loss": 1.2351,
+      "step": 19000
+    },
+    {
+      "epoch": 24.23,
+      "eval_loss": 0.2715151607990265,
+      "eval_runtime": 239.5626,
+      "eval_samples_per_second": 34.809,
+      "eval_steps_per_second": 1.089,
+      "eval_wer": 0.36498842725210257,
+      "step": 19000
+    },
+    {
+      "epoch": 24.87,
+      "learning_rate": 1.512451861360719e-05,
+      "loss": 1.2409,
+      "step": 19500
+    },
+    {
+      "epoch": 24.87,
+      "eval_loss": 0.2636788487434387,
+      "eval_runtime": 234.5142,
+      "eval_samples_per_second": 35.559,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.3570822925499003,
+      "step": 19500
+    },
+    {
+      "epoch": 25.51,
+      "learning_rate": 1.4996148908857511e-05,
+      "loss": 1.2152,
+      "step": 20000
+    },
+    {
+      "epoch": 25.51,
+      "eval_loss": 0.2785368859767914,
+      "eval_runtime": 234.4552,
+      "eval_samples_per_second": 35.568,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.36088640373994546,
+      "step": 20000
+    },
+    {
+      "epoch": 26.15,
+      "learning_rate": 1.4868035943517332e-05,
+      "loss": 1.2046,
+      "step": 20500
+    },
+    {
+      "epoch": 26.15,
+      "eval_loss": 0.2610293924808502,
+      "eval_runtime": 233.6859,
+      "eval_samples_per_second": 35.685,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.3508032174530788,
+      "step": 20500
+    },
+    {
+      "epoch": 26.79,
+      "learning_rate": 1.4739666238767652e-05,
+      "loss": 1.2082,
+      "step": 21000
+    },
+    {
+      "epoch": 26.79,
+      "eval_loss": 0.26189225912094116,
+      "eval_runtime": 234.8807,
+      "eval_samples_per_second": 35.503,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.3460595366317575,
+      "step": 21000
+    },
+    {
+      "epoch": 27.42,
+      "learning_rate": 1.4611296534017974e-05,
+      "loss": 1.2109,
+      "step": 21500
+    },
+    {
+      "epoch": 27.42,
+      "eval_loss": 0.2596839666366577,
+      "eval_runtime": 235.2549,
+      "eval_samples_per_second": 35.447,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.3501615601439146,
+      "step": 21500
+    },
+    {
+      "epoch": 28.06,
+      "learning_rate": 1.4482926829268294e-05,
+      "loss": 1.2014,
+      "step": 22000
+    },
+    {
+      "epoch": 28.06,
+      "eval_loss": 0.2608143091201782,
+      "eval_runtime": 234.8521,
+      "eval_samples_per_second": 35.507,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.3468386919357426,
+      "step": 22000
+    },
+    {
+      "epoch": 28.7,
+      "learning_rate": 1.4354813863928115e-05,
+      "loss": 1.1948,
+      "step": 22500
+    },
+    {
+      "epoch": 28.7,
+      "eval_loss": 0.2573413550853729,
+      "eval_runtime": 233.0487,
+      "eval_samples_per_second": 35.782,
+      "eval_steps_per_second": 1.12,
+      "eval_wer": 0.3456699589797649,
+      "step": 22500
+    },
+    {
+      "epoch": 29.34,
+      "learning_rate": 1.4226444159178435e-05,
+      "loss": 1.205,
+      "step": 23000
+    },
+    {
+      "epoch": 29.34,
+      "eval_loss": 0.2619355320930481,
+      "eval_runtime": 236.4546,
+      "eval_samples_per_second": 35.267,
+      "eval_steps_per_second": 1.104,
+      "eval_wer": 0.3463803652863396,
+      "step": 23000
+    },
+    {
+      "epoch": 29.97,
+      "learning_rate": 1.4098074454428757e-05,
+      "loss": 1.2019,
+      "step": 23500
+    },
+    {
+      "epoch": 29.97,
+      "eval_loss": 0.2558630406856537,
+      "eval_runtime": 235.5761,
+      "eval_samples_per_second": 35.398,
+      "eval_steps_per_second": 1.108,
+      "eval_wer": 0.34738868391502625,
+      "step": 23500
+    },
+    {
+      "epoch": 30.61,
+      "learning_rate": 1.3969704749679077e-05,
+      "loss": 1.1917,
+      "step": 24000
+    },
+    {
+      "epoch": 30.61,
+      "eval_loss": 0.2601245045661926,
+      "eval_runtime": 235.3838,
+      "eval_samples_per_second": 35.427,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.34619703462657836,
+      "step": 24000
+    },
+    {
+      "epoch": 31.25,
+      "learning_rate": 1.3841591784338897e-05,
+      "loss": 1.1939,
+      "step": 24500
+    },
+    {
+      "epoch": 31.25,
+      "eval_loss": 0.2575133740901947,
+      "eval_runtime": 235.7288,
+      "eval_samples_per_second": 35.375,
+      "eval_steps_per_second": 1.107,
+      "eval_wer": 0.33874922657377915,
+      "step": 24500
+    },
+    {
+      "epoch": 31.89,
+      "learning_rate": 1.3713478818998718e-05,
+      "loss": 1.1882,
+      "step": 25000
+    },
+    {
+      "epoch": 31.89,
+      "eval_loss": 0.2534877359867096,
+      "eval_runtime": 235.7724,
+      "eval_samples_per_second": 35.369,
+      "eval_steps_per_second": 1.107,
+      "eval_wer": 0.33675550564887596,
+      "step": 25000
+    },
+    {
+      "epoch": 32.53,
+      "learning_rate": 1.3585109114249038e-05,
+      "loss": 1.191,
+      "step": 25500
+    },
+    {
+      "epoch": 32.53,
+      "eval_loss": 0.24889491498470306,
+      "eval_runtime": 236.163,
+      "eval_samples_per_second": 35.31,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.336457593326764,
+      "step": 25500
+    },
+    {
+      "epoch": 33.16,
+      "learning_rate": 1.345673940949936e-05,
+      "loss": 1.1767,
+      "step": 26000
+    },
+    {
+      "epoch": 33.16,
+      "eval_loss": 0.2501368224620819,
+      "eval_runtime": 236.8496,
+      "eval_samples_per_second": 35.208,
+      "eval_steps_per_second": 1.102,
+      "eval_wer": 0.3347159520590325,
+      "step": 26000
+    },
+    {
+      "epoch": 33.8,
+      "learning_rate": 1.332836970474968e-05,
+      "loss": 1.167,
+      "step": 26500
+    },
+    {
+      "epoch": 33.8,
+      "eval_loss": 0.25037434697151184,
+      "eval_runtime": 233.4394,
+      "eval_samples_per_second": 35.722,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.33469303572656234,
+      "step": 26500
+    },
+    {
+      "epoch": 34.44,
+      "learning_rate": 1.3200000000000002e-05,
+      "loss": 1.1678,
+      "step": 27000
+    },
+    {
+      "epoch": 34.44,
+      "eval_loss": 0.24800854921340942,
+      "eval_runtime": 233.3087,
+      "eval_samples_per_second": 35.742,
+      "eval_steps_per_second": 1.119,
+      "eval_wer": 0.33783257327497307,
+      "step": 27000
+    },
+    {
+      "epoch": 35.08,
+      "learning_rate": 1.3071630295250321e-05,
+      "loss": 1.1803,
+      "step": 27500
+    },
+    {
+      "epoch": 35.08,
+      "eval_loss": 0.24871966242790222,
+      "eval_runtime": 235.3613,
+      "eval_samples_per_second": 35.431,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.33448678873433096,
+      "step": 27500
+    },
+    {
+      "epoch": 35.71,
+      "learning_rate": 1.2943260590500643e-05,
+      "loss": 1.167,
+      "step": 28000
+    },
+    {
+      "epoch": 35.71,
+      "eval_loss": 0.24418053030967712,
+      "eval_runtime": 232.8217,
+      "eval_samples_per_second": 35.817,
+      "eval_steps_per_second": 1.121,
+      "eval_wer": 0.3318514105002635,
+      "step": 28000
+    },
+    {
+      "epoch": 36.35,
+      "learning_rate": 1.2814890885750963e-05,
+      "loss": 1.1661,
+      "step": 28500
+    },
+    {
+      "epoch": 36.35,
+      "eval_loss": 0.24953289330005646,
+      "eval_runtime": 237.0041,
+      "eval_samples_per_second": 35.185,
+      "eval_steps_per_second": 1.101,
+      "eval_wer": 0.3333868047757637,
+      "step": 28500
+    },
+    {
+      "epoch": 36.99,
+      "learning_rate": 1.2686521181001285e-05,
+      "loss": 1.164,
+      "step": 29000
+    },
+    {
+      "epoch": 36.99,
+      "eval_loss": 0.24715770781040192,
+      "eval_runtime": 233.2505,
+      "eval_samples_per_second": 35.751,
+      "eval_steps_per_second": 1.119,
+      "eval_wer": 0.32923894859866626,
+      "step": 29000
+    },
+    {
+      "epoch": 37.63,
+      "learning_rate": 1.2558151476251605e-05,
+      "loss": 1.1578,
+      "step": 29500
+    },
+    {
+      "epoch": 37.63,
+      "eval_loss": 0.24420544505119324,
+      "eval_runtime": 239.1685,
+      "eval_samples_per_second": 34.867,
+      "eval_steps_per_second": 1.091,
+      "eval_wer": 0.3242431881201732,
+      "step": 29500
+    },
+    {
+      "epoch": 38.27,
+      "learning_rate": 1.2430038510911426e-05,
+      "loss": 1.1584,
+      "step": 30000
+    },
+    {
+      "epoch": 38.27,
+      "eval_loss": 0.243063285946846,
+      "eval_runtime": 235.3653,
+      "eval_samples_per_second": 35.43,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.3314389165158008,
+      "step": 30000
+    },
+    {
+      "epoch": 38.9,
+      "learning_rate": 1.2301668806161746e-05,
+      "loss": 1.1526,
+      "step": 30500
+    },
+    {
+      "epoch": 38.9,
+      "eval_loss": 0.2440960705280304,
+      "eval_runtime": 238.3272,
+      "eval_samples_per_second": 34.99,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.3347159520590325,
+      "step": 30500
+    },
+    {
+      "epoch": 39.54,
+      "learning_rate": 1.2173299101412068e-05,
+      "loss": 1.1542,
+      "step": 31000
+    },
+    {
+      "epoch": 39.54,
+      "eval_loss": 0.2436649352312088,
+      "eval_runtime": 236.1705,
+      "eval_samples_per_second": 35.309,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.3330430597887114,
+      "step": 31000
+    },
+    {
+      "epoch": 40.18,
+      "learning_rate": 1.2044929396662388e-05,
+      "loss": 1.1508,
+      "step": 31500
+    },
+    {
+      "epoch": 40.18,
+      "eval_loss": 0.24334189295768738,
+      "eval_runtime": 234.2613,
+      "eval_samples_per_second": 35.597,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.3294222792584275,
+      "step": 31500
+    },
+    {
+      "epoch": 40.82,
+      "learning_rate": 1.191655969191271e-05,
+      "loss": 1.1406,
+      "step": 32000
+    },
+    {
+      "epoch": 40.82,
+      "eval_loss": 0.24340486526489258,
+      "eval_runtime": 233.0368,
+      "eval_samples_per_second": 35.784,
+      "eval_steps_per_second": 1.12,
+      "eval_wer": 0.3270618970140019,
+      "step": 32000
+    },
+    {
+      "epoch": 41.45,
+      "learning_rate": 1.178870346598203e-05,
+      "loss": 1.1514,
+      "step": 32500
+    },
+    {
+      "epoch": 41.45,
+      "eval_loss": 0.24264076352119446,
+      "eval_runtime": 238.874,
+      "eval_samples_per_second": 34.91,
+      "eval_steps_per_second": 1.093,
+      "eval_wer": 0.32552650273850176,
+      "step": 32500
+    },
+    {
+      "epoch": 42.09,
+      "learning_rate": 1.166033376123235e-05,
+      "loss": 1.1418,
+      "step": 33000
+    },
+    {
+      "epoch": 42.09,
+      "eval_loss": 0.2431638389825821,
+      "eval_runtime": 238.255,
+      "eval_samples_per_second": 35.0,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.3232807021564269,
+      "step": 33000
+    },
+    {
+      "epoch": 42.73,
+      "learning_rate": 1.1531964056482671e-05,
+      "loss": 1.1365,
+      "step": 33500
+    },
+    {
+      "epoch": 42.73,
+      "eval_loss": 0.2436181753873825,
+      "eval_runtime": 234.1309,
+      "eval_samples_per_second": 35.617,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.32399110846300155,
+      "step": 33500
+    },
+    {
+      "epoch": 43.37,
+      "learning_rate": 1.1403594351732992e-05,
+      "loss": 1.1348,
+      "step": 34000
+    },
+    {
+      "epoch": 43.37,
+      "eval_loss": 0.2482648491859436,
+      "eval_runtime": 238.6079,
+      "eval_samples_per_second": 34.949,
+      "eval_steps_per_second": 1.094,
+      "eval_wer": 0.3257327497307331,
+      "step": 34000
+    },
+    {
+      "epoch": 44.01,
+      "learning_rate": 1.1275224646983314e-05,
+      "loss": 1.1301,
+      "step": 34500
+    },
+    {
+      "epoch": 44.01,
+      "eval_loss": 0.24202857911586761,
+      "eval_runtime": 232.8764,
+      "eval_samples_per_second": 35.809,
+      "eval_steps_per_second": 1.121,
+      "eval_wer": 0.3271077296789422,
+      "step": 34500
+    },
+    {
+      "epoch": 44.64,
+      "learning_rate": 1.1146854942233634e-05,
+      "loss": 1.1268,
+      "step": 35000
+    },
+    {
+      "epoch": 44.64,
+      "eval_loss": 0.24715635180473328,
+      "eval_runtime": 233.1436,
+      "eval_samples_per_second": 35.768,
+      "eval_steps_per_second": 1.119,
+      "eval_wer": 0.3224786305199716,
+      "step": 35000
+    },
+    {
+      "epoch": 45.28,
+      "learning_rate": 1.1018485237483956e-05,
+      "loss": 1.1224,
+      "step": 35500
+    },
+    {
+      "epoch": 45.28,
+      "eval_loss": 0.2381853461265564,
+      "eval_runtime": 238.9288,
+      "eval_samples_per_second": 34.902,
+      "eval_steps_per_second": 1.092,
+      "eval_wer": 0.3204849095950684,
+      "step": 35500
+    },
+    {
+      "epoch": 45.92,
+      "learning_rate": 1.0890115532734276e-05,
+      "loss": 1.1224,
+      "step": 36000
+    },
+    {
+      "epoch": 45.92,
+      "eval_loss": 0.23876558244228363,
+      "eval_runtime": 243.8522,
+      "eval_samples_per_second": 34.197,
+      "eval_steps_per_second": 1.07,
+      "eval_wer": 0.3184224396727548,
+      "step": 36000
+    },
+    {
+      "epoch": 46.56,
+      "learning_rate": 1.0762002567394097e-05,
+      "loss": 1.1198,
+      "step": 36500
+    },
+    {
+      "epoch": 46.56,
+      "eval_loss": 0.23819147050380707,
+      "eval_runtime": 238.5089,
+      "eval_samples_per_second": 34.963,
+      "eval_steps_per_second": 1.094,
+      "eval_wer": 0.32016408094048626,
+      "step": 36500
+    },
+    {
+      "epoch": 47.19,
+      "learning_rate": 1.0633632862644417e-05,
+      "loss": 1.1274,
+      "step": 37000
+    },
+    {
+      "epoch": 47.19,
+      "eval_loss": 0.24040183424949646,
+      "eval_runtime": 237.5269,
+      "eval_samples_per_second": 35.108,
+      "eval_steps_per_second": 1.099,
+      "eval_wer": 0.31720787405183676,
+      "step": 37000
+    },
+    {
+      "epoch": 47.83,
+      "learning_rate": 1.0505263157894739e-05,
+      "loss": 1.1147,
+      "step": 37500
+    },
+    {
+      "epoch": 47.83,
+      "eval_loss": 0.23944656550884247,
+      "eval_runtime": 235.5135,
+      "eval_samples_per_second": 35.408,
+      "eval_steps_per_second": 1.108,
+      "eval_wer": 0.3164287187478516,
+      "step": 37500
+    },
+    {
+      "epoch": 48.47,
+      "learning_rate": 1.0377150192554558e-05,
+      "loss": 1.121,
+      "step": 38000
+    },
+    {
+      "epoch": 48.47,
+      "eval_loss": 0.2405969202518463,
+      "eval_runtime": 233.9426,
+      "eval_samples_per_second": 35.645,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.3202099136054266,
+      "step": 38000
+    },
+    {
+      "epoch": 49.11,
+      "learning_rate": 1.024878048780488e-05,
+      "loss": 1.1109,
+      "step": 38500
+    },
+    {
+      "epoch": 49.11,
+      "eval_loss": 0.23839789628982544,
+      "eval_runtime": 240.6944,
+      "eval_samples_per_second": 34.646,
+      "eval_steps_per_second": 1.084,
+      "eval_wer": 0.31537456745422465,
+      "step": 38500
+    },
+    {
+      "epoch": 49.74,
+      "learning_rate": 1.0120410783055198e-05,
+      "loss": 1.1164,
+      "step": 39000
+    },
+    {
+      "epoch": 49.74,
+      "eval_loss": 0.2374895066022873,
+      "eval_runtime": 237.3857,
+      "eval_samples_per_second": 35.128,
+      "eval_steps_per_second": 1.099,
+      "eval_wer": 0.31686412906478445,
+      "step": 39000
+    },
+    {
+      "epoch": 50.38,
+      "learning_rate": 9.992041078305522e-06,
+      "loss": 1.1105,
+      "step": 39500
+    },
+    {
+      "epoch": 50.38,
+      "eval_loss": 0.23865096271038055,
+      "eval_runtime": 232.9433,
+      "eval_samples_per_second": 35.798,
+      "eval_steps_per_second": 1.12,
+      "eval_wer": 0.31729953938171734,
+      "step": 39500
+    },
+    {
+      "epoch": 51.02,
+      "learning_rate": 9.86392811296534e-06,
+      "loss": 1.1054,
+      "step": 40000
+    },
+    {
+      "epoch": 51.02,
+      "eval_loss": 0.23617714643478394,
+      "eval_runtime": 233.5533,
+      "eval_samples_per_second": 35.705,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.31200586658111235,
+      "step": 40000
+    },
+    {
+      "epoch": 51.66,
+      "learning_rate": 9.735558408215663e-06,
+      "loss": 1.0893,
+      "step": 40500
+    },
+    {
+      "epoch": 51.66,
+      "eval_loss": 0.23990453779697418,
+      "eval_runtime": 234.1326,
+      "eval_samples_per_second": 35.617,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.31299126887732887,
+      "step": 40500
+    },
+    {
+      "epoch": 52.3,
+      "learning_rate": 9.607188703465983e-06,
+      "loss": 1.0913,
+      "step": 41000
+    },
+    {
+      "epoch": 52.3,
+      "eval_loss": 0.2356649786233902,
+      "eval_runtime": 238.2462,
+      "eval_samples_per_second": 35.002,
+      "eval_steps_per_second": 1.096,
+      "eval_wer": 0.3087517473703508,
+      "step": 41000
+    },
+    {
+      "epoch": 52.93,
+      "learning_rate": 9.478818998716303e-06,
+      "loss": 1.1017,
+      "step": 41500
+    },
+    {
+      "epoch": 52.93,
+      "eval_loss": 0.23450981080532074,
+      "eval_runtime": 233.807,
+      "eval_samples_per_second": 35.666,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.3083621697183583,
+      "step": 41500
+    },
+    {
+      "epoch": 53.57,
+      "learning_rate": 9.350449293966625e-06,
+      "loss": 1.0937,
+      "step": 42000
+    },
+    {
+      "epoch": 53.57,
+      "eval_loss": 0.23296880722045898,
+      "eval_runtime": 238.7521,
+      "eval_samples_per_second": 34.927,
+      "eval_steps_per_second": 1.093,
+      "eval_wer": 0.31395375484107524,
+      "step": 42000
+    },
+    {
+      "epoch": 54.21,
+      "learning_rate": 9.222079589216945e-06,
+      "loss": 1.0945,
+      "step": 42500
+    },
+    {
+      "epoch": 54.21,
+      "eval_loss": 0.23989614844322205,
+      "eval_runtime": 233.2848,
+      "eval_samples_per_second": 35.746,
+      "eval_steps_per_second": 1.119,
+      "eval_wer": 0.3106767192978436,
+      "step": 42500
+    },
+    {
+      "epoch": 54.85,
+      "learning_rate": 9.093966623876766e-06,
+      "loss": 1.0933,
+      "step": 43000
+    },
+    {
+      "epoch": 54.85,
+      "eval_loss": 0.23831374943256378,
+      "eval_runtime": 234.0959,
+      "eval_samples_per_second": 35.622,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.31338084652932147,
+      "step": 43000
+    },
+    {
+      "epoch": 55.48,
+      "learning_rate": 8.965596919127086e-06,
+      "loss": 1.0912,
+      "step": 43500
+    },
+    {
+      "epoch": 55.48,
+      "eval_loss": 0.2371690571308136,
+      "eval_runtime": 234.0624,
+      "eval_samples_per_second": 35.627,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.30769759607672387,
+      "step": 43500
+    },
+    {
+      "epoch": 56.12,
+      "learning_rate": 8.837227214377408e-06,
+      "loss": 1.0898,
+      "step": 44000
+    },
+    {
+      "epoch": 56.12,
+      "eval_loss": 0.23387998342514038,
+      "eval_runtime": 233.2957,
+      "eval_samples_per_second": 35.744,
+      "eval_steps_per_second": 1.119,
+      "eval_wer": 0.30829342072094784,
+      "step": 44000
+    },
+    {
+      "epoch": 56.76,
+      "learning_rate": 8.708857509627728e-06,
+      "loss": 1.0903,
+      "step": 44500
+    },
+    {
+      "epoch": 56.76,
+      "eval_loss": 0.23673543334007263,
+      "eval_runtime": 236.1402,
+      "eval_samples_per_second": 35.314,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.3065288631207462,
+      "step": 44500
+    },
+    {
+      "epoch": 57.4,
+      "learning_rate": 8.58048780487805e-06,
+      "loss": 1.0947,
+      "step": 45000
+    },
+    {
+      "epoch": 57.4,
+      "eval_loss": 0.23515641689300537,
+      "eval_runtime": 235.6322,
+      "eval_samples_per_second": 35.39,
+      "eval_steps_per_second": 1.108,
+      "eval_wer": 0.31035589064326147,
+      "step": 45000
+    },
+    {
+      "epoch": 58.04,
+      "learning_rate": 8.45211810012837e-06,
+      "loss": 1.0751,
+      "step": 45500
+    },
+    {
+      "epoch": 58.04,
+      "eval_loss": 0.23344124853610992,
+      "eval_runtime": 236.1866,
+      "eval_samples_per_second": 35.307,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.3084309187157687,
+      "step": 45500
+    },
+    {
+      "epoch": 58.67,
+      "learning_rate": 8.32374839537869e-06,
+      "loss": 1.09,
+      "step": 46000
+    },
+    {
+      "epoch": 58.67,
+      "eval_loss": 0.2327876091003418,
+      "eval_runtime": 233.0944,
+      "eval_samples_per_second": 35.775,
+      "eval_steps_per_second": 1.12,
+      "eval_wer": 0.3100350619886793,
+      "step": 46000
+    },
+    {
+      "epoch": 59.31,
+      "learning_rate": 8.195378690629013e-06,
+      "loss": 1.0876,
+      "step": 46500
+    },
+    {
+      "epoch": 59.31,
+      "eval_loss": 0.22762973606586456,
+      "eval_runtime": 232.6706,
+      "eval_samples_per_second": 35.84,
+      "eval_steps_per_second": 1.122,
+      "eval_wer": 0.3049705525127758,
+      "step": 46500
+    },
+    {
+      "epoch": 59.95,
+      "learning_rate": 8.067008985879333e-06,
+      "loss": 1.076,
+      "step": 47000
+    },
+    {
+      "epoch": 59.95,
+      "eval_loss": 0.23087561130523682,
+      "eval_runtime": 233.5675,
+      "eval_samples_per_second": 35.703,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.304695556523134,
+      "step": 47000
+    },
+    {
+      "epoch": 60.59,
+      "learning_rate": 7.938896020539153e-06,
+      "loss": 1.086,
+      "step": 47500
+    },
+    {
+      "epoch": 60.59,
+      "eval_loss": 0.229255810379982,
+      "eval_runtime": 234.5783,
+      "eval_samples_per_second": 35.549,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.304695556523134,
+      "step": 47500
+    },
+    {
+      "epoch": 61.22,
+      "learning_rate": 7.810526315789474e-06,
+      "loss": 1.082,
+      "step": 48000
+    },
+    {
+      "epoch": 61.22,
+      "eval_loss": 0.232817605137825,
+      "eval_runtime": 239.1878,
+      "eval_samples_per_second": 34.864,
+      "eval_steps_per_second": 1.091,
+      "eval_wer": 0.3027476682631712,
+      "step": 48000
+    },
+    {
+      "epoch": 61.86,
+      "learning_rate": 7.682413350449294e-06,
+      "loss": 1.0714,
+      "step": 48500
+    },
+    {
+      "epoch": 61.86,
+      "eval_loss": 0.22896084189414978,
+      "eval_runtime": 234.6636,
+      "eval_samples_per_second": 35.536,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.3019914292916562,
+      "step": 48500
+    },
+    {
+      "epoch": 62.5,
+      "learning_rate": 7.554043645699616e-06,
+      "loss": 1.0746,
+      "step": 49000
+    },
+    {
+      "epoch": 62.5,
+      "eval_loss": 0.2313106656074524,
+      "eval_runtime": 234.936,
+      "eval_samples_per_second": 35.495,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.30586428947911176,
+      "step": 49000
+    },
+    {
+      "epoch": 63.14,
+      "learning_rate": 7.425673940949937e-06,
+      "loss": 1.076,
+      "step": 49500
+    },
+    {
+      "epoch": 63.14,
+      "eval_loss": 0.23419487476348877,
+      "eval_runtime": 235.1421,
+      "eval_samples_per_second": 35.464,
+      "eval_steps_per_second": 1.11,
+      "eval_wer": 0.3050393015101863,
+      "step": 49500
+    },
+    {
+      "epoch": 63.78,
+      "learning_rate": 7.297304236200257e-06,
+      "loss": 1.0648,
+      "step": 50000
+    },
+    {
+      "epoch": 63.78,
+      "eval_loss": 0.22855186462402344,
+      "eval_runtime": 233.6212,
+      "eval_samples_per_second": 35.695,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.30247267227352936,
+      "step": 50000
+    },
+    {
+      "epoch": 64.41,
+      "learning_rate": 7.169191270860078e-06,
+      "loss": 1.0586,
+      "step": 50500
+    },
+    {
+      "epoch": 64.41,
+      "eval_loss": 0.23375432193279266,
+      "eval_runtime": 233.8132,
+      "eval_samples_per_second": 35.665,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.30435181153608176,
+      "step": 50500
+    },
+    {
+      "epoch": 65.05,
+      "learning_rate": 7.040821566110398e-06,
+      "loss": 1.0753,
+      "step": 51000
+    },
+    {
+      "epoch": 65.05,
+      "eval_loss": 0.23079071938991547,
+      "eval_runtime": 238.4184,
+      "eval_samples_per_second": 34.976,
+      "eval_steps_per_second": 1.095,
+      "eval_wer": 0.30446639319843255,
+      "step": 51000
+    },
+    {
+      "epoch": 65.69,
+      "learning_rate": 6.912451861360719e-06,
+      "loss": 1.0664,
+      "step": 51500
+    },
+    {
+      "epoch": 65.69,
+      "eval_loss": 0.22733470797538757,
+      "eval_runtime": 233.5628,
+      "eval_samples_per_second": 35.703,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.3009372779980292,
+      "step": 51500
+    },
+    {
+      "epoch": 66.33,
+      "learning_rate": 6.78408215661104e-06,
+      "loss": 1.0739,
+      "step": 52000
+    },
+    {
+      "epoch": 66.33,
+      "eval_loss": 0.2298172414302826,
+      "eval_runtime": 234.5885,
+      "eval_samples_per_second": 35.547,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.30272475193070103,
+      "step": 52000
+    },
+    {
+      "epoch": 66.96,
+      "learning_rate": 6.655712451861361e-06,
+      "loss": 1.0695,
+      "step": 52500
+    },
+    {
+      "epoch": 66.96,
+      "eval_loss": 0.2247009128332138,
+      "eval_runtime": 234.2623,
+      "eval_samples_per_second": 35.597,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.29958521438229024,
+      "step": 52500
+    },
+    {
+      "epoch": 67.6,
+      "learning_rate": 6.5273427471116825e-06,
+      "loss": 1.06,
+      "step": 53000
+    },
+    {
+      "epoch": 67.6,
+      "eval_loss": 0.22762586176395416,
+      "eval_runtime": 238.2043,
+      "eval_samples_per_second": 35.008,
+      "eval_steps_per_second": 1.096,
+      "eval_wer": 0.30148726997731284,
+      "step": 53000
+    },
+    {
+      "epoch": 68.24,
+      "learning_rate": 6.399229781771502e-06,
+      "loss": 1.0742,
+      "step": 53500
+    },
+    {
+      "epoch": 68.24,
+      "eval_loss": 0.22798208892345428,
+      "eval_runtime": 234.5841,
+      "eval_samples_per_second": 35.548,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.2974081627976259,
+      "step": 53500
+    },
+    {
+      "epoch": 68.88,
+      "learning_rate": 6.270860077021823e-06,
+      "loss": 1.0618,
+      "step": 54000
+    },
+    {
+      "epoch": 68.88,
+      "eval_loss": 0.2291172742843628,
+      "eval_runtime": 233.7512,
+      "eval_samples_per_second": 35.675,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.2988518917432454,
+      "step": 54000
+    },
+    {
+      "epoch": 69.52,
+      "learning_rate": 6.142490372272144e-06,
+      "loss": 1.062,
+      "step": 54500
+    },
+    {
+      "epoch": 69.52,
+      "eval_loss": 0.23021718859672546,
+      "eval_runtime": 236.2703,
+      "eval_samples_per_second": 35.294,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.2970873341430437,
+      "step": 54500
+    },
+    {
+      "epoch": 70.15,
+      "learning_rate": 6.0141206675224654e-06,
+      "loss": 1.0572,
+      "step": 55000
+    },
+    {
+      "epoch": 70.15,
+      "eval_loss": 0.22801047563552856,
+      "eval_runtime": 232.8765,
+      "eval_samples_per_second": 35.809,
+      "eval_steps_per_second": 1.121,
+      "eval_wer": 0.2989893897380663,
+      "step": 55000
+    },
+    {
+      "epoch": 70.79,
+      "learning_rate": 5.885750962772786e-06,
+      "loss": 1.055,
+      "step": 55500
+    },
+    {
+      "epoch": 70.79,
+      "eval_loss": 0.22775860130786896,
+      "eval_runtime": 234.9515,
+      "eval_samples_per_second": 35.492,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.29834773242890206,
+      "step": 55500
+    },
+    {
+      "epoch": 71.43,
+      "learning_rate": 5.757381258023107e-06,
+      "loss": 1.0553,
+      "step": 56000
+    },
+    {
+      "epoch": 71.43,
+      "eval_loss": 0.22817462682724,
+      "eval_runtime": 233.8475,
+      "eval_samples_per_second": 35.66,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.29905813873547676,
+      "step": 56000
+    },
+    {
+      "epoch": 72.07,
+      "learning_rate": 5.629011553273428e-06,
+      "loss": 1.0509,
+      "step": 56500
+    },
+    {
+      "epoch": 72.07,
+      "eval_loss": 0.2261197566986084,
+      "eval_runtime": 235.4495,
+      "eval_samples_per_second": 35.417,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.29591860118706603,
+      "step": 56500
+    },
+    {
+      "epoch": 72.7,
+      "learning_rate": 5.500641848523749e-06,
+      "loss": 1.0469,
+      "step": 57000
+    },
+    {
+      "epoch": 72.7,
+      "eval_loss": 0.22159287333488464,
+      "eval_runtime": 233.6081,
+      "eval_samples_per_second": 35.697,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.29188532667231937,
+      "step": 57000
+    },
+    {
+      "epoch": 73.34,
+      "learning_rate": 5.37227214377407e-06,
+      "loss": 1.0476,
+      "step": 57500
+    },
+    {
+      "epoch": 73.34,
+      "eval_loss": 0.22673606872558594,
+      "eval_runtime": 233.9171,
+      "eval_samples_per_second": 35.649,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.2988518917432454,
+      "step": 57500
+    },
+    {
+      "epoch": 73.98,
+      "learning_rate": 5.24415917843389e-06,
+      "loss": 1.0494,
+      "step": 58000
+    },
+    {
+      "epoch": 73.98,
+      "eval_loss": 0.22603431344032288,
+      "eval_runtime": 234.549,
+      "eval_samples_per_second": 35.553,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.2960102665169466,
+      "step": 58000
+    },
+    {
+      "epoch": 74.62,
+      "learning_rate": 5.115789473684211e-06,
+      "loss": 1.0517,
+      "step": 58500
+    },
+    {
+      "epoch": 74.62,
+      "eval_loss": 0.2297457605600357,
+      "eval_runtime": 234.3971,
+      "eval_samples_per_second": 35.576,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.29894355707312603,
+      "step": 58500
+    },
+    {
+      "epoch": 75.26,
+      "learning_rate": 4.987419768934532e-06,
+      "loss": 1.0458,
+      "step": 59000
+    },
+    {
+      "epoch": 75.26,
+      "eval_loss": 0.2246260643005371,
+      "eval_runtime": 233.0094,
+      "eval_samples_per_second": 35.788,
+      "eval_steps_per_second": 1.12,
+      "eval_wer": 0.2923436533217224,
+      "step": 59000
+    },
+    {
+      "epoch": 75.89,
+      "learning_rate": 4.859306803594352e-06,
+      "loss": 1.0382,
+      "step": 59500
+    },
+    {
+      "epoch": 75.89,
+      "eval_loss": 0.22546544671058655,
+      "eval_runtime": 233.7397,
+      "eval_samples_per_second": 35.676,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.2921603226619612,
+      "step": 59500
+    },
+    {
+      "epoch": 76.53,
+      "learning_rate": 4.730937098844673e-06,
+      "loss": 1.0462,
+      "step": 60000
+    },
+    {
+      "epoch": 76.53,
+      "eval_loss": 0.22583839297294617,
+      "eval_runtime": 233.483,
+      "eval_samples_per_second": 35.716,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.29539152554025255,
+      "step": 60000
+    },
+    {
+      "epoch": 77.17,
+      "learning_rate": 4.602567394094994e-06,
+      "loss": 1.0375,
+      "step": 60500
+    },
+    {
+      "epoch": 77.17,
+      "eval_loss": 0.22505535185337067,
+      "eval_runtime": 239.1762,
+      "eval_samples_per_second": 34.866,
+      "eval_steps_per_second": 1.091,
+      "eval_wer": 0.2928707289685359,
+      "step": 60500
+    },
+    {
+      "epoch": 77.81,
+      "learning_rate": 4.474197689345315e-06,
+      "loss": 1.0332,
+      "step": 61000
+    },
+    {
+      "epoch": 77.81,
+      "eval_loss": 0.22773370146751404,
+      "eval_runtime": 237.0288,
+      "eval_samples_per_second": 35.181,
+      "eval_steps_per_second": 1.101,
+      "eval_wer": 0.2939936292595733,
+      "step": 61000
+    },
+    {
+      "epoch": 78.44,
+      "learning_rate": 4.345827984595636e-06,
+      "loss": 1.0423,
+      "step": 61500
+    },
+    {
+      "epoch": 78.44,
+      "eval_loss": 0.22426965832710266,
+      "eval_runtime": 233.5981,
+      "eval_samples_per_second": 35.698,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.28961660975777437,
+      "step": 61500
+    },
+    {
+      "epoch": 79.08,
+      "learning_rate": 4.217458279845957e-06,
+      "loss": 1.0379,
+      "step": 62000
+    },
+    {
+      "epoch": 79.08,
+      "eval_loss": 0.2274049073457718,
+      "eval_runtime": 234.6064,
+      "eval_samples_per_second": 35.545,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.29280197997112545,
+      "step": 62000
+    },
+    {
+      "epoch": 79.72,
+      "learning_rate": 4.089345314505777e-06,
+      "loss": 1.0398,
+      "step": 62500
+    },
+    {
+      "epoch": 79.72,
+      "eval_loss": 0.22373217344284058,
+      "eval_runtime": 234.7196,
+      "eval_samples_per_second": 35.527,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.29280197997112545,
+      "step": 62500
+    },
+    {
+      "epoch": 80.36,
+      "learning_rate": 3.960975609756098e-06,
+      "loss": 1.0395,
+      "step": 63000
+    },
+    {
+      "epoch": 80.36,
+      "eval_loss": 0.22652971744537354,
+      "eval_runtime": 233.8582,
+      "eval_samples_per_second": 35.658,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.2956206888649541,
+      "step": 63000
+    },
+    {
+      "epoch": 80.99,
+      "learning_rate": 3.832605905006419e-06,
+      "loss": 1.0397,
+      "step": 63500
+    },
+    {
+      "epoch": 80.99,
+      "eval_loss": 0.22396665811538696,
+      "eval_runtime": 235.3841,
+      "eval_samples_per_second": 35.427,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.29202282466714025,
+      "step": 63500
+    },
+    {
+      "epoch": 81.63,
+      "learning_rate": 3.7042362002567396e-06,
+      "loss": 1.0262,
+      "step": 64000
+    },
+    {
+      "epoch": 81.63,
+      "eval_loss": 0.22437626123428345,
+      "eval_runtime": 239.3117,
+      "eval_samples_per_second": 34.846,
+      "eval_steps_per_second": 1.091,
+      "eval_wer": 0.2933748882828792,
+      "step": 64000
+    },
+    {
+      "epoch": 82.27,
+      "learning_rate": 3.5758664955070607e-06,
+      "loss": 1.0335,
+      "step": 64500
+    },
+    {
+      "epoch": 82.27,
+      "eval_loss": 0.22651708126068115,
+      "eval_runtime": 234.0011,
+      "eval_samples_per_second": 35.637,
+      "eval_steps_per_second": 1.115,
+      "eval_wer": 0.2936269679400509,
+      "step": 64500
+    },
+    {
+      "epoch": 82.91,
+      "learning_rate": 3.4474967907573813e-06,
+      "loss": 1.0385,
+      "step": 65000
+    },
+    {
+      "epoch": 82.91,
+      "eval_loss": 0.22380606830120087,
+      "eval_runtime": 236.2381,
+      "eval_samples_per_second": 35.299,
+      "eval_steps_per_second": 1.105,
+      "eval_wer": 0.29284781263606574,
+      "step": 65000
+    },
+    {
+      "epoch": 83.55,
+      "learning_rate": 3.3191270860077024e-06,
+      "loss": 1.0289,
+      "step": 65500
+    },
+    {
+      "epoch": 83.55,
+      "eval_loss": 0.221877783536911,
+      "eval_runtime": 233.6081,
+      "eval_samples_per_second": 35.697,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.2911520040332745,
+      "step": 65500
+    },
+    {
+      "epoch": 84.18,
+      "learning_rate": 3.1910141206675225e-06,
+      "loss": 1.0372,
+      "step": 66000
+    },
+    {
+      "epoch": 84.18,
+      "eval_loss": 0.22357773780822754,
+      "eval_runtime": 234.3938,
+      "eval_samples_per_second": 35.577,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.2898457730824759,
+      "step": 66000
+    },
+    {
+      "epoch": 84.82,
+      "learning_rate": 3.0626444159178436e-06,
+      "loss": 1.0279,
+      "step": 66500
+    },
+    {
+      "epoch": 84.82,
+      "eval_loss": 0.22185130417346954,
+      "eval_runtime": 235.3542,
+      "eval_samples_per_second": 35.432,
+      "eval_steps_per_second": 1.109,
+      "eval_wer": 0.2902124344019983,
+      "step": 66500
+    },
+    {
+      "epoch": 85.46,
+      "learning_rate": 2.9342747111681647e-06,
+      "loss": 1.0325,
+      "step": 67000
+    },
+    {
+      "epoch": 85.46,
+      "eval_loss": 0.22399279475212097,
+      "eval_runtime": 232.7577,
+      "eval_samples_per_second": 35.827,
+      "eval_steps_per_second": 1.121,
+      "eval_wer": 0.2907853427137521,
+      "step": 67000
+    },
+    {
+      "epoch": 86.1,
+      "learning_rate": 2.8059050064184858e-06,
+      "loss": 1.0202,
+      "step": 67500
+    },
+    {
+      "epoch": 86.1,
+      "eval_loss": 0.22061078250408173,
+      "eval_runtime": 236.8657,
+      "eval_samples_per_second": 35.206,
+      "eval_steps_per_second": 1.102,
+      "eval_wer": 0.28863120746155785,
+      "step": 67500
+    },
+    {
+      "epoch": 86.73,
+      "learning_rate": 2.6775353016688064e-06,
+      "loss": 1.0166,
+      "step": 68000
+    },
+    {
+      "epoch": 86.73,
+      "eval_loss": 0.2218720018863678,
+      "eval_runtime": 233.7184,
+      "eval_samples_per_second": 35.68,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.2885624584641474,
+      "step": 68000
+    },
+    {
+      "epoch": 87.37,
+      "learning_rate": 2.5491655969191275e-06,
+      "loss": 1.0259,
+      "step": 68500
+    },
+    {
+      "epoch": 87.37,
+      "eval_loss": 0.2234880030155182,
+      "eval_runtime": 235.0768,
+      "eval_samples_per_second": 35.474,
+      "eval_steps_per_second": 1.11,
+      "eval_wer": 0.28970827508765495,
+      "step": 68500
+    },
+    {
+      "epoch": 88.01,
+      "learning_rate": 2.420795892169448e-06,
+      "loss": 1.0337,
+      "step": 69000
+    },
+    {
+      "epoch": 88.01,
+      "eval_loss": 0.220963254570961,
+      "eval_runtime": 233.4278,
+      "eval_samples_per_second": 35.724,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.2873249765107592,
+      "step": 69000
+    },
+    {
+      "epoch": 88.65,
+      "learning_rate": 2.2926829268292687e-06,
+      "loss": 1.0264,
+      "step": 69500
+    },
+    {
+      "epoch": 88.65,
+      "eval_loss": 0.22157110273838043,
+      "eval_runtime": 233.5356,
+      "eval_samples_per_second": 35.708,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.2882187134770951,
+      "step": 69500
+    },
+    {
+      "epoch": 89.29,
+      "learning_rate": 2.1643132220795894e-06,
+      "loss": 1.0231,
+      "step": 70000
+    },
+    {
+      "epoch": 89.29,
+      "eval_loss": 0.2222645878791809,
+      "eval_runtime": 238.1657,
+      "eval_samples_per_second": 35.013,
+      "eval_steps_per_second": 1.096,
+      "eval_wer": 0.2899145220798863,
+      "step": 70000
+    },
+    {
+      "epoch": 89.92,
+      "learning_rate": 2.03594351732991e-06,
+      "loss": 1.0281,
+      "step": 70500
+    },
+    {
+      "epoch": 89.92,
+      "eval_loss": 0.22140374779701233,
+      "eval_runtime": 233.9034,
+      "eval_samples_per_second": 35.651,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.28723331118087864,
+      "step": 70500
+    },
+    {
+      "epoch": 90.56,
+      "learning_rate": 1.907573812580231e-06,
+      "loss": 1.0135,
+      "step": 71000
+    },
+    {
+      "epoch": 90.56,
+      "eval_loss": 0.22179700434207916,
+      "eval_runtime": 235.221,
+      "eval_samples_per_second": 35.452,
+      "eval_steps_per_second": 1.11,
+      "eval_wer": 0.28684373352888604,
+      "step": 71000
+    },
+    {
+      "epoch": 91.2,
+      "learning_rate": 1.7792041078305522e-06,
+      "loss": 1.0291,
+      "step": 71500
+    },
+    {
+      "epoch": 91.2,
+      "eval_loss": 0.22093360126018524,
+      "eval_runtime": 236.8894,
+      "eval_samples_per_second": 35.202,
+      "eval_steps_per_second": 1.102,
+      "eval_wer": 0.2862937415496024,
+      "step": 71500
+    },
+    {
+      "epoch": 91.84,
+      "learning_rate": 1.6508344030808731e-06,
+      "loss": 1.0321,
+      "step": 72000
+    },
+    {
+      "epoch": 91.84,
+      "eval_loss": 0.219914972782135,
+      "eval_runtime": 233.825,
+      "eval_samples_per_second": 35.663,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.2875770561679309,
+      "step": 72000
+    },
+    {
+      "epoch": 92.47,
+      "learning_rate": 1.5227214377406932e-06,
+      "loss": 1.028,
+      "step": 72500
+    },
+    {
+      "epoch": 92.47,
+      "eval_loss": 0.22144030034542084,
+      "eval_runtime": 234.5883,
+      "eval_samples_per_second": 35.547,
+      "eval_steps_per_second": 1.113,
+      "eval_wer": 0.28576666590278893,
+      "step": 72500
+    },
+    {
+      "epoch": 93.11,
+      "learning_rate": 1.3943517329910141e-06,
+      "loss": 1.0213,
+      "step": 73000
+    },
+    {
+      "epoch": 93.11,
+      "eval_loss": 0.2219470739364624,
+      "eval_runtime": 234.1897,
+      "eval_samples_per_second": 35.608,
+      "eval_steps_per_second": 1.114,
+      "eval_wer": 0.2874624745055801,
+      "step": 73000
+    },
+    {
+      "epoch": 93.75,
+      "learning_rate": 1.2659820282413352e-06,
+      "loss": 1.0261,
+      "step": 73500
+    },
+    {
+      "epoch": 93.75,
+      "eval_loss": 0.22315841913223267,
+      "eval_runtime": 234.7799,
+      "eval_samples_per_second": 35.518,
+      "eval_steps_per_second": 1.112,
+      "eval_wer": 0.28688956619382633,
+      "step": 73500
+    },
+    {
+      "epoch": 94.39,
+      "learning_rate": 1.137612323491656e-06,
+      "loss": 1.0197,
+      "step": 74000
+    },
+    {
+      "epoch": 94.39,
+      "eval_loss": 0.22271272540092468,
+      "eval_runtime": 233.7941,
+      "eval_samples_per_second": 35.668,
+      "eval_steps_per_second": 1.116,
+      "eval_wer": 0.2866145702041845,
+      "step": 74000
+    },
+    {
+      "epoch": 95.03,
+      "learning_rate": 1.009242618741977e-06,
+      "loss": 1.0298,
+      "step": 74500
+    },
+    {
+      "epoch": 95.03,
+      "eval_loss": 0.22284960746765137,
+      "eval_runtime": 236.8784,
+      "eval_samples_per_second": 35.204,
+      "eval_steps_per_second": 1.102,
+      "eval_wer": 0.28675206819900545,
+      "step": 74500
+    },
+    {
+      "epoch": 95.66,
+      "learning_rate": 8.808729139922979e-07,
+      "loss": 1.0192,
+      "step": 75000
+    },
+    {
+      "epoch": 95.66,
+      "eval_loss": 0.22300392389297485,
+      "eval_runtime": 233.5836,
+      "eval_samples_per_second": 35.7,
+      "eval_steps_per_second": 1.117,
+      "eval_wer": 0.28652290487430393,
+      "step": 75000
+    },
+    {
+      "epoch": 96.3,
+      "learning_rate": 7.525032092426188e-07,
+      "loss": 1.0156,
+      "step": 75500
+    },
+    {
+      "epoch": 96.3,
+      "eval_loss": 0.2220136970281601,
+      "eval_runtime": 231.7898,
+      "eval_samples_per_second": 35.977,
+      "eval_steps_per_second": 1.126,
+      "eval_wer": 0.2869353988587666,
+      "step": 75500
+    },
+    {
+      "epoch": 96.94,
+      "learning_rate": 6.241335044929398e-07,
+      "loss": 1.0075,
+      "step": 76000
+    },
+    {
+      "epoch": 96.94,
+      "eval_loss": 0.2222670316696167,
+      "eval_runtime": 232.6992,
+      "eval_samples_per_second": 35.836,
+      "eval_steps_per_second": 1.122,
+      "eval_wer": 0.2866145702041845,
+      "step": 76000
+    },
+    {
+      "epoch": 97.58,
+      "learning_rate": 4.9602053915276e-07,
+      "loss": 1.0201,
+      "step": 76500
+    },
+    {
+      "epoch": 97.58,
+      "eval_loss": 0.2218976616859436,
+      "eval_runtime": 233.5288,
+      "eval_samples_per_second": 35.709,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.28659165387171437,
+      "step": 76500
+    },
+    {
+      "epoch": 98.21,
+      "learning_rate": 3.676508344030809e-07,
+      "loss": 1.0159,
+      "step": 77000
+    },
+    {
+      "epoch": 98.21,
+      "eval_loss": 0.22194130718708038,
+      "eval_runtime": 233.434,
+      "eval_samples_per_second": 35.723,
+      "eval_steps_per_second": 1.118,
+      "eval_wer": 0.28764580516534133,
+      "step": 77000
+    },
+    {
+      "epoch": 98.85,
+      "learning_rate": 2.395378690629012e-07,
+      "loss": 1.0087,
+      "step": 77500
+    },
+    {
+      "epoch": 98.85,
+      "eval_loss": 0.2219318002462387,
+      "eval_runtime": 235.7197,
+      "eval_samples_per_second": 35.377,
+      "eval_steps_per_second": 1.107,
+      "eval_wer": 0.2873249765107592,
+      "step": 77500
+    },
+    {
+      "epoch": 99.49,
+      "learning_rate": 1.111681643132221e-07,
+      "loss": 1.0159,
+      "step": 78000
+    },
+    {
+      "epoch": 99.49,
+      "eval_loss": 0.2223382443189621,
+      "eval_runtime": 234.8374,
+      "eval_samples_per_second": 35.51,
+      "eval_steps_per_second": 1.111,
+      "eval_wer": 0.2867291518665353,
+      "step": 78000
+    },
+    {
+      "epoch": 100.0,
+      "step": 78400,
+      "total_flos": 1.850628803077507e+20,
+      "train_loss": 1.2247810986577248,
+      "train_runtime": 113701.5353,
+      "train_samples_per_second": 22.038,
+      "train_steps_per_second": 0.69
+    }
+  ],
+  "max_steps": 78400,
+  "num_train_epochs": 100,
+  "total_flos": 1.850628803077507e+20,
+  "trial_name": null,
+  "trial_params": null
+}