Training in progress, step 10000, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +160 -6

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83581d38161b27a5acb790f575f33ed3c02a7f1d7c2437ee178aa966f81080ae
 size 409608164

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f9bd8fdf0af32af8f59abce260f9b57d6b83c268c98baf68e11cc08f06c96e2
 size 409608164

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dffa6ac9b8d89e7a91077ceb9acc3c19df6aae53480883e9198e93f6f29bffc1
 size 814647162

 version https://git-lfs.github.com/spec/v1
+oid sha256:489808c2860cdf751eb2c99475a6b346765860ebbe7e08073938bc45654ce999
 size 814647162

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ab19ef495d430a2accb0aebafeb69cc818c2a103c6f73355b5b8061f940d1b3
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc8958737f63827fcb5b01c7daddc2f1f0e348e84c3608ec0d26115852593ed2
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f430e9f6ffa976be8b034917a3194b833ba551ae167ef81aa406b2df6c359139
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:88aeefb87e8a5cdeb363b3bb85c7ea47c59528a3b28554e6fd533407ab39a79a
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.001237295625276182,
-  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine_restarts-opt25/trial-number=9-learning_rate=9.1e-06-warmup_ratio=0.060-num_cycles=2/checkpoint-5000",
-  "epoch": 0.49319392385085814,
   "eval_steps": 2500,
-  "global_step": 5000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -119,6 +119,160 @@
       "eval_tanimoto_similarity": 0.0,
       "eval_valid": 0.7521873619089704,
       "step": 5000
     }
   ],
   "logging_steps": 500,
@@ -133,12 +287,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 4.33139477262336e+16,
   "train_batch_size": 128,
   "trial_name": "trial-number=9-learning_rate=9.1e-06-warmup_ratio=0.060-num_cycles=2",
   "trial_params": {

 {
+  "best_metric": 0.07273530711444985,
+  "best_model_checkpoint": "/mimer/NOBACKUP/groups/naiss2023-6-290/stefano/models//PROTAC-Splitter-EncoderDecoder-lr_cosine_restarts-opt25/trial-number=9-learning_rate=9.1e-06-warmup_ratio=0.060-num_cycles=2/checkpoint-10000",
+  "epoch": 0.9863878477017163,
   "eval_steps": 2500,
+  "global_step": 10000,
   "is_hyper_param_search": true,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_tanimoto_similarity": 0.0,
       "eval_valid": 0.7521873619089704,
       "step": 5000
+    },
+    {
+      "epoch": 0.542513316235944,
+      "grad_norm": 0.47060030698776245,
+      "learning_rate": 8.882979678601097e-06,
+      "loss": 0.174,
+      "step": 5500
+    },
+    {
+      "epoch": 0.5918327086210298,
+      "grad_norm": 0.5330048203468323,
+      "learning_rate": 8.267282522223007e-06,
+      "loss": 0.1418,
+      "step": 6000
+    },
+    {
+      "epoch": 0.6411521010061156,
+      "grad_norm": 0.4379560947418213,
+      "learning_rate": 7.278718737276227e-06,
+      "loss": 0.1199,
+      "step": 6500
+    },
+    {
+      "epoch": 0.6904714933912014,
+      "grad_norm": 0.4775562286376953,
+      "learning_rate": 6.016004093409107e-06,
+      "loss": 0.1041,
+      "step": 7000
+    },
+    {
+      "epoch": 0.7397908857762873,
+      "grad_norm": 0.38391777873039246,
+      "learning_rate": 4.605230452182494e-06,
+      "loss": 0.0923,
+      "step": 7500
+    },
+    {
+      "epoch": 0.7397908857762873,
+      "eval_all_ligands_equal": 0.03853292090145824,
+      "eval_e3_equal": 0.54909412284578,
+      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
+      "eval_e3_graph_edit_distance_norm": 1.0,
+      "eval_e3_has_attachment_point(s)": 0.9959346000883783,
+      "eval_e3_heavy_atoms_difference": -0.3578435704816615,
+      "eval_e3_heavy_atoms_difference_norm": -0.02785724707369664,
+      "eval_e3_tanimoto_similarity": 0.0,
+      "eval_e3_valid": 0.9959346000883783,
+      "eval_has_all_attachment_points": 0.9732213875386655,
+      "eval_has_three_substructures": 0.997613787008396,
+      "eval_heavy_atoms_difference": 11.28157313300928,
+      "eval_heavy_atoms_difference_norm": 0.1489927886833175,
+      "eval_linker_equal": 0.08395934600088378,
+      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
+      "eval_linker_graph_edit_distance_norm": 1.0,
+      "eval_linker_has_attachment_point(s)": 0.9931064958020327,
+      "eval_linker_heavy_atoms_difference": 2.419001325673884,
+      "eval_linker_heavy_atoms_difference_norm": 0.08873987335070188,
+      "eval_linker_tanimoto_similarity": 0.0,
+      "eval_linker_valid": 0.9931064958020327,
+      "eval_loss": 0.3142109215259552,
+      "eval_num_fragments": 2.9990278391515686,
+      "eval_poi_equal": 0.5286787450287229,
+      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
+      "eval_poi_graph_edit_distance_norm": 1.0,
+      "eval_poi_has_attachment_point(s)": 0.8821917808219178,
+      "eval_poi_heavy_atoms_difference": 3.70234202386213,
+      "eval_poi_heavy_atoms_difference_norm": 0.1184160547254355,
+      "eval_poi_tanimoto_similarity": 0.0,
+      "eval_poi_valid": 0.8821917808219178,
+      "eval_reassembly": 0.03959346000883782,
+      "eval_reassembly_nostereo": 0.04958020326999558,
+      "eval_runtime": 1522.9606,
+      "eval_samples_per_second": 7.43,
+      "eval_steps_per_second": 0.116,
+      "eval_tanimoto_similarity": 0.0,
+      "eval_valid": 0.8780380026513478,
+      "step": 7500
+    },
+    {
+      "epoch": 0.789110278161373,
+      "grad_norm": 0.3485475778579712,
+      "learning_rate": 3.187274515650354e-06,
+      "loss": 0.0844,
+      "step": 8000
+    },
+    {
+      "epoch": 0.8384296705464589,
+      "grad_norm": 0.31034043431282043,
+      "learning_rate": 1.9037301938199667e-06,
+      "loss": 0.0789,
+      "step": 8500
+    },
+    {
+      "epoch": 0.8877490629315447,
+      "grad_norm": 0.427944153547287,
+      "learning_rate": 8.827693533292254e-07,
+      "loss": 0.0752,
+      "step": 9000
+    },
+    {
+      "epoch": 0.9370684553166305,
+      "grad_norm": 0.35361239314079285,
+      "learning_rate": 2.2634286137006849e-07,
+      "loss": 0.0738,
+      "step": 9500
+    },
+    {
+      "epoch": 0.9863878477017163,
+      "grad_norm": 0.42388033866882324,
+      "learning_rate": 0.0,
+      "loss": 0.0731,
+      "step": 10000
+    },
+    {
+      "epoch": 0.9863878477017163,
+      "eval_all_ligands_equal": 0.07273530711444985,
+      "eval_e3_equal": 0.5886875828546178,
+      "eval_e3_graph_edit_distance": 9.999999999999999e+63,
+      "eval_e3_graph_edit_distance_norm": 1.0,
+      "eval_e3_has_attachment_point(s)": 0.9959346000883783,
+      "eval_e3_heavy_atoms_difference": -0.4637207247017234,
+      "eval_e3_heavy_atoms_difference_norm": -0.03239218121458508,
+      "eval_e3_tanimoto_similarity": 0.0,
+      "eval_e3_valid": 0.9959346000883783,
+      "eval_has_all_attachment_points": 0.9784357048166151,
+      "eval_has_three_substructures": 0.9978789217852408,
+      "eval_heavy_atoms_difference": 9.685461776403004,
+      "eval_heavy_atoms_difference_norm": 0.1285929207163922,
+      "eval_linker_equal": 0.13504197967300044,
+      "eval_linker_graph_edit_distance": 9.999999999999999e+63,
+      "eval_linker_graph_edit_distance_norm": 1.0,
+      "eval_linker_has_attachment_point(s)": 0.9935483870967742,
+      "eval_linker_heavy_atoms_difference": 1.6614228899690675,
+      "eval_linker_heavy_atoms_difference_norm": 0.048918556931556306,
+      "eval_linker_tanimoto_similarity": 0.0,
+      "eval_linker_valid": 0.9935483870967742,
+      "eval_loss": 0.30737239122390747,
+      "eval_num_fragments": 2.999116217410517,
+      "eval_poi_equal": 0.573663278833407,
+      "eval_poi_graph_edit_distance": 9.999999999999999e+63,
+      "eval_poi_graph_edit_distance_norm": 1.0,
+      "eval_poi_has_attachment_point(s)": 0.8909412284577993,
+      "eval_poi_heavy_atoms_difference": 3.2883782589482986,
+      "eval_poi_heavy_atoms_difference_norm": 0.10593427106256059,
+      "eval_poi_tanimoto_similarity": 0.0,
+      "eval_poi_valid": 0.8909412284577993,
+      "eval_reassembly": 0.07476800707026071,
+      "eval_reassembly_nostereo": 0.0899690676093681,
+      "eval_runtime": 1508.2236,
+      "eval_samples_per_second": 7.502,
+      "eval_steps_per_second": 0.117,
+      "eval_tanimoto_similarity": 0.0,
+      "eval_valid": 0.8865223155103844,
+      "step": 10000
     }
   ],
   "logging_steps": 500,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 8.663036348367667e+16,
   "train_batch_size": 128,
   "trial_name": "trial-number=9-learning_rate=9.1e-06-warmup_ratio=0.060-num_cycles=2",
   "trial_params": {