Update README.md
Browse files
README.md
CHANGED
|
@@ -79,3 +79,21 @@ Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力
|
|
| 79 |
|
| 80 |
学習強度が1/3と、2/3のcheck pointも公開しました
|
| 81 |
こちらのほうがベースモデルの汎化性能維持できている可能性があります
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 79 |
|
| 80 |
学習強度が1/3と、2/3のcheck pointも公開しました
|
| 81 |
こちらのほうがベースモデルの汎化性能維持できている可能性があります
|
| 82 |
+
|
| 83 |
+
**learningstrength0.3**
|
| 84 |
+
num_fewshot: 2,2, batch_size: 1
|
| 85 |
+
| Task |Version| Metric | Value | |Stderr|
|
| 86 |
+
|----------------------|------:|-----------|------:|---|-----:|
|
| 87 |
+
|jsquad-1.1-0.3 | 1.1|exact_match|72.1747| | |
|
| 88 |
+
| | |f1 |85.3325| | |
|
| 89 |
+
|jcommonsenseqa-1.1-0.3| 1.1|acc | 0.7534|± |0.0129|
|
| 90 |
+
| | |acc_norm | 0.4111|± |0.0147|
|
| 91 |
+
|
| 92 |
+
**learningstrength0.6**
|
| 93 |
+
num_fewshot: 2,2, batch_size: 1
|
| 94 |
+
| Task |Version| Metric | Value | |Stderr|
|
| 95 |
+
|----------------------|------:|-----------|------:|---|-----:|
|
| 96 |
+
|jsquad-1.1-0.3 | 1.1|exact_match|72.3548| | |
|
| 97 |
+
| | |f1 |85.5144| | |
|
| 98 |
+
|jcommonsenseqa-1.1-0.3| 1.1|acc | 0.7480|± |0.0130|
|
| 99 |
+
| | |acc_norm | 0.4111|± |0.0147|
|