BaiXue's picture

BaiXue

BaiXue

·

Byshev333

AI & ML interests

None yet

Recent Activity

upvoted a paper 22 days ago

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

upvoted a paper 9 months ago

CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

upvoted a paper 10 months ago

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

View all activity

Organizations

upvoted a paper 22 days ago

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

Paper • 2605.19577 • Published 23 days ago • 58

upvoted a paper 9 months ago

CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

Paper • 2509.20712 • Published Sep 25, 2025 • 20

upvoted a paper 10 months ago

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

Paper • 2508.07629 • Published Aug 11, 2025 • 43

liked a dataset over 1 year ago

OpenLeecher/lmsys_chat_1m_clean

Viewer • Updated Dec 31, 2024 • 273k • 543 • 85

New activity in GAIR/MathPile over 2 years ago

Issue with TypeError in GAIR/MathPile Dataset Loading

#2 opened over 2 years ago by

Issue with TypeError in GAIR/MathPile Dataset Loading

#2 opened over 2 years ago by