sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO / README.md

Commit History

End of training

9ae8351
verified

sergiopaniego HF Staff commited on Jan 31

Model save

5644c6d
verified

sergiopaniego HF Staff commited on Jan 31

End of training

e4a2529
verified

sergiopaniego HF Staff commited on Jan 30

Model save

b82cdac
verified

sergiopaniego HF Staff commited on Jan 30

End of training

6acb439
verified

sergiopaniego HF Staff commited on Jan 29

Model save

1662395
verified

sergiopaniego HF Staff commited on Jan 29