2 19 1

Langlin Huang

shrango

https://shrango.github.io/

AI & ML interests

LLM Reasoning, Machine Translation

Recent Activity

upvoted a paper 3 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

upvoted a paper 4 days ago

Process Rewards with Learned Reliability

upvoted a paper 12 days ago

G-Zero: Self-Play for Open-Ended Generation from Zero Data

View all activity

Organizations

upvoted a paper 3 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 4 days ago • 44

upvoted a paper 4 days ago

Process Rewards with Learned Reliability

Paper • 2605.15529 • Published 9 days ago • 51

upvoted a paper 12 days ago

G-Zero: Self-Play for Open-Ended Generation from Zero Data

Paper • 2605.09959 • Published 13 days ago • 17

upvoted a paper 13 days ago

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Paper • 2605.08083 • Published 16 days ago • 66

upvoted a paper 16 days ago

Nonsense Helps: Prompt Space Perturbation Broadens Reasoning Exploration

Paper • 2605.05566 • Published 17 days ago • 37

updated a model 21 days ago

shrango/fake_english_advshape_policyshape_qwen3-1.7b-base

2B • Updated 21 days ago • 61

published a model 21 days ago

shrango/fake_english_advshape_policyshape_qwen3-1.7b-base

2B • Updated 21 days ago • 61

updated a model 22 days ago

shrango/ascii_advshape_policyshape_qwen3-1.7b-base

2B • Updated 22 days ago • 74

published a model 22 days ago

shrango/ascii_advshape_policyshape_qwen3-1.7b-base

2B • Updated 22 days ago • 74

updated a model 23 days ago

shrango/markovify_advshape_policy_shape_qwen3-1.7b-base

2B • Updated 23 days ago • 74

published a model 23 days ago

shrango/markovify_advshape_policy_shape_qwen3-1.7b-base

2B • Updated 23 days ago • 74

updated a model 24 days ago

shrango/random_la_advshape_policyshape_qwen3-1.7b-base

2B • Updated 24 days ago • 68

published a model 24 days ago

shrango/random_la_advshape_policyshape_qwen3-1.7b-base

2B • Updated 24 days ago • 68

updated a model 28 days ago

shrango/lorem_advshape_qwen3-1.7b-base

2B • Updated 28 days ago • 58

published a model 28 days ago

shrango/lorem_advshape_qwen3-1.7b-base

2B • Updated 28 days ago • 58

updated a model 29 days ago

shrango/lorem_policy_shape_adv_shape_qwen2.5-math_7b

8B • Updated 29 days ago • 48

published a model 29 days ago

shrango/lorem_policy_shape_adv_shape_qwen2.5-math_7b

8B • Updated 29 days ago • 48

updated a model 30 days ago

shrango/lorem_advshape_policyshape_qwen2.5_math_7b_170

Updated 30 days ago

published a model 30 days ago

shrango/lorem_advshape_policyshape_qwen2.5_math_7b_170

Updated 30 days ago

updated a model 30 days ago

shrango/lorem_advshape_policyshape_qwen2.5_math_7b_150

Updated 30 days ago

Langlin Huang

AI & ML interests

Recent Activity

Organizations

shrango's activity