jhn9803
/

DeepSeek-R1-Distill-Qwen-7B-GRPO-G4

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GRPO-G4

Commit History

Upload folder using huggingface_hub

5070174
verified

jhn9803 commited on 18 days ago

Upload folder using huggingface_hub

8529bde
verified

jhn9803 commited on 18 days ago

End of training

a5cf451
verified

jhn9803 commited on 19 days ago

Model save

18d83e9
verified

jhn9803 commited on 19 days ago

Training in progress, epoch 3

d5247ad
verified

jhn9803 commited on 19 days ago

Training in progress, epoch 2

1fc4c21
verified

jhn9803 commited on 19 days ago

Training in progress, epoch 1

31b3954
verified

jhn9803 commited on 19 days ago

Training in progress, epoch 0

5094c6a
verified

jhn9803 commited on 19 days ago

initial commit

8564725
verified

jhn9803 commited on 19 days ago