End of training

Browse files

Files changed (5) hide show

README.md +23 -8
model.safetensors +1 -1
runs/Apr16_09-39-10_83315c8218e7/events.out.tfevents.1744796350.83315c8218e7.32.2 +3 -0
runs/Apr16_09-40-11_83315c8218e7/events.out.tfevents.1744796411.83315c8218e7.32.3 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.1854
 ## Model description
@@ -41,16 +41,31 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 50
-- num_epochs: 5
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss |
-|:-------------:|:------:|:----:|:---------------:|
-| 3.5768        | 1.6393 | 100  | 3.1825          |
-| 3.4167        | 3.2787 | 200  | 3.1319          |
-| 3.3584        | 4.9180 | 300  | 3.1854          |
 ### Framework versions

 This model is a fine-tuned version of [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.0073
 ## Model description
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 25
+- num_epochs: 15
 ### Training results
+| Training Loss | Epoch   | Step | Validation Loss |
+|:-------------:|:-------:|:----:|:---------------:|
+| No log        | 0.8065  | 50   | 3.2215          |
+| 3.5557        | 1.6129  | 100  | 3.1603          |
+| 3.5557        | 2.4194  | 150  | 3.0890          |
+| 3.4117        | 3.2258  | 200  | 3.0941          |
+| 3.4117        | 4.0323  | 250  | 3.1186          |
+| 3.324         | 4.8387  | 300  | 3.1086          |
+| 3.324         | 5.6452  | 350  | 3.0218          |
+| 3.2389        | 6.4516  | 400  | 3.1045          |
+| 3.2389        | 7.2581  | 450  | 2.9879          |
+| 3.2033        | 8.0645  | 500  | 3.0223          |
+| 3.2033        | 8.8710  | 550  | 3.0385          |
+| 3.208         | 9.6774  | 600  | 2.9855          |
+| 3.208         | 10.4839 | 650  | 2.9403          |
+| 3.1853        | 11.2903 | 700  | 3.0554          |
+| 3.1853        | 12.0968 | 750  | 3.0020          |
+| 3.1617        | 12.9032 | 800  | 2.9592          |
+| 3.1617        | 13.7097 | 850  | 3.0212          |
+| 3.1488        | 14.5161 | 900  | 3.0073          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b1a3ca01c80e12d39d68ce1e033e9e6950d6dcd7b49f33055cbef95e7ab5f8c
 size 117119608

 version https://git-lfs.github.com/spec/v1
+oid sha256:e994fe77d2b11bd80a6493a76f57578b0f880075b6c1889ead856c409e7443cc
 size 117119608

runs/Apr16_09-39-10_83315c8218e7/events.out.tfevents.1744796350.83315c8218e7.32.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3cdf3c71d5f233c464f05792f9257bdd4a82373e81ba3ff5025b9f65bd43fe1
+size 4998

runs/Apr16_09-40-11_83315c8218e7/events.out.tfevents.1744796411.83315c8218e7.32.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b6ecb3a08afb6765b00a27c976066b6a2bdb18516a949ce908f188228f31d81a
+size 12115

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e47c083bbb01ceb96ad3fb648b891e231d24505d4cf6ede3925c318993eeebc
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:3581245ad66efa1c6fa130662245059cc7dfebbb2e2bf5ff7bc2934232e394cf
 size 5304