邱怡文's picture

邱怡文

qywMichelle

·

qywMichelle

AI & ML interests

None yet

Recent Activity

liked a dataset 5 days ago

Wulinjuan/CULTURE-MT

liked a Space 17 days ago

Wulinjuan/CULTURE-MT

upvoted a paper 24 days ago

Self-Distilled Agentic Reinforcement Learning

View all activity

Organizations

None yet

upvoted a paper 24 days ago

Self-Distilled Agentic Reinforcement Learning

Paper • 2605.15155 • Published 25 days ago • 111

upvoted a paper about 1 month ago

Pause or Fabricate? Training Language Models for Grounded Reasoning

Paper • 2604.19656 • Published Apr 21 • 10

upvoted 3 papers about 2 months ago

SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric Environments

Paper • 2604.14144 • Published Apr 15 • 63

ClawGUI: A Unified Framework for Training, Evaluating, and Deploying GUI Agents

Paper • 2604.11784 • Published Apr 13 • 143

KnowU-Bench: Towards Interactive, Proactive, and Personalized Mobile Agent Evaluation

Paper • 2604.08455 • Published Apr 9 • 47

upvoted a paper 2 months ago

SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization

Paper • 2604.02268 • Published Apr 2 • 101

upvoted 3 papers 8 months ago

SpatialLadder: Progressive Training for Spatial Reasoning in Vision-Language Models

Paper • 2510.08531 • Published Oct 9, 2025 • 12

GSM8K-V: Can Vision Language Models Solve Grade School Math Word Problems in Visual Contexts

Paper • 2509.25160 • Published Sep 29, 2025 • 32

EasySteer: A Unified Framework for High-Performance and Extensible LLM Steering

Paper • 2509.25175 • Published Sep 29, 2025 • 31

upvoted a paper 10 months ago

OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks

Paper • 2508.05614 • Published Aug 7, 2025 • 20

upvoted a paper 11 months ago

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

Paper • 2507.15846 • Published Jul 21, 2025 • 135

upvoted 2 papers about 1 year ago

VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models

Paper • 2505.15801 • Published May 21, 2025 • 17

Chain-of-Model Learning for Language Model

Paper • 2505.11820 • Published May 17, 2025 • 121