Durakaka's picture

2 1

Durakaka

Durakaka

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

upvoted a paper 12 days ago

Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

liked a dataset 3 months ago

nvidia/Nemotron-Terminal-Corpus

View all activity

Organizations

None yet

upvoted a paper 4 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

Paper • 2606.16771 • Published 6 days ago • 12

upvoted a paper 12 days ago

Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill

Paper • 2606.03980 • Published 19 days ago • 13

liked a dataset 3 months ago

nvidia/Nemotron-Terminal-Corpus

Viewer • Updated Feb 27 • 366k • 6.36k • 133