Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions

SmolLM2-135M-GRPO-Trained-For-Reasoning

Ctrl+K

Ctrl+K

1 contributor

History: 5 commits

Macromrit's picture

Update README.md

d95fa21 verified about 1 year ago