RL - a ChunjiangGe Collection

ChunjiangGe 's Collections

RL

updated Apr 7

MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published Jan 29 • 62
Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published Jan 30 • 113
Reinforced Attention Learning

Paper • 2602.04884 • Published Feb 4 • 30
LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Paper • 2510.19363 • Published Oct 22, 2025 • 63
QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

Paper • 2512.12967 • Published Dec 15, 2025 • 113
Light Forcing: Accelerating Autoregressive Video Diffusion via Sparse Attention

Paper • 2602.04789 • Published Feb 4 • 4
Gaia2: Benchmarking LLM Agents on Dynamic and Asynchronous Environments

Paper • 2602.11964 • Published Feb 12 • 13
DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

Paper • 2602.16742 • Published Feb 18 • 12
Towards Autonomous Mathematics Research

Paper • 2602.10177 • Published Feb 10 • 36
CLI-Gym: Scalable CLI Task Generation via Agentic Environment Inversion

Paper • 2602.10999 • Published Feb 11 • 11
On Data Engineering for Scaling LLM Terminal Capabilities

Paper • 2602.21193 • Published Feb 24 • 103
Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better

Paper • 2602.05393 • Published Feb 5 • 9
Efficient Exploration at Scale

Paper • 2603.17378 • Published Mar 18 • 14