Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2605.27365

Eagle is a family of frontier vision-language models with data-centric strategies. The model supports both HD image and long-context video input.

about 9 hours ago

nvidia/Eagle2-1B

Image-Text-to-Text • 1B • Updated Apr 27, 2025 • 2.14k • 30
nvidia/Eagle2-2B

Image-Text-to-Text • 2B • Updated Apr 27, 2025 • 525 • 34
nvidia/Eagle2-9B

Image-Text-to-Text • 9B • Updated Jan 28, 2025 • 212 • 63
Build error

Agents

15

Eagle2.5 VL

💬

15

Chat with Eagle2-VL to generate text based on text and images

interesting architecture

FAN: Fourier Analysis Networks

Paper • 2410.02675 • Published Oct 3, 2024 • 29
Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published Jan 11, 2025 • 91
Scalable-Softmax Is Superior for Attention

Paper • 2501.19399 • Published Jan 31, 2025 • 25
EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling

Paper • 2502.09509 • Published Feb 13, 2025 • 9

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

Papers I'm going to read

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published Jan 6 • 180
MHLA: Restoring Expressivity of Linear Attention via Token-Level Multi-Head

Paper • 2601.07832 • Published Jan 12 • 53
Motion Attribution for Video Generation

Paper • 2601.08828 • Published Jan 13 • 72
Post-LayerNorm Is Back: Stable, ExpressivE, and Deep

Paper • 2601.19895 • Published Jan 27 • 27

Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video

Paper • 2605.15182 • Published 16 days ago • 39
STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

Paper • 2605.06527 • Published 23 days ago • 44
Learning to Build the Environment: Self-Evolving Reasoning RL via Verifiable Environment Synthesis

Paper • 2605.14392 • Published 16 days ago • 8
World Action Models: The Next Frontier in Embodied AI

Paper • 2605.12090 • Published 18 days ago • 67

MolmoAct2: Action Reasoning Models for Real-world Deployment

Paper • 2605.02881 • Published 26 days ago • 345
LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118
Continuous Latent Diffusion Language Model

Paper • 2605.06548 • Published 23 days ago • 80

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

Fast-SAM3D: 3Dfy Anything in Images but Faster

Paper • 2602.05293 • Published Feb 5 • 2
Stroke of Surprise: Progressive Semantic Illusions in Vector Sketching

Paper • 2602.12280 • Published Feb 12 • 34
CADEvolve: Creating Realistic CAD via Program Evolution

Paper • 2602.16317 • Published Feb 18 • 30
SketchDynamics: Exploring Free-Form Sketches for Dynamic Intent Expression in Animation Generation

Paper • 2601.20622 • Published Jan 28 • 2

about 23 hours ago

YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

Paper • 2512.23273 • Published Dec 29, 2025 • 15
A 58-Addition, Rank-23 Scheme for General 3x3 Matrix Multiplication

Paper • 2512.21980 • Published Dec 26, 2025 • 3
Step-DeepResearch Technical Report

Paper • 2512.20491 • Published Dec 23, 2025 • 88
SAM Audio: Segment Anything in Audio

Paper • 2512.18099 • Published Dec 19, 2025 • 25

Eagle is a family of frontier vision-language models with data-centric strategies. The model supports both HD image and long-context video input.

about 9 hours ago

nvidia/Eagle2-1B

Image-Text-to-Text • 1B • Updated Apr 27, 2025 • 2.14k • 30
nvidia/Eagle2-2B

Image-Text-to-Text • 2B • Updated Apr 27, 2025 • 525 • 34
nvidia/Eagle2-9B

Image-Text-to-Text • 9B • Updated Jan 28, 2025 • 212 • 63
Build error

Agents

15

Eagle2.5 VL

💬

15

Chat with Eagle2-VL to generate text based on text and images

Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video

Paper • 2605.15182 • Published 16 days ago • 39
STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

Paper • 2605.06527 • Published 23 days ago • 44
Learning to Build the Environment: Self-Evolving Reasoning RL via Verifiable Environment Synthesis

Paper • 2605.14392 • Published 16 days ago • 8
World Action Models: The Next Frontier in Embodied AI

Paper • 2605.12090 • Published 18 days ago • 67

interesting architecture

FAN: Fourier Analysis Networks

Paper • 2410.02675 • Published Oct 3, 2024 • 29
Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published Jan 11, 2025 • 91
Scalable-Softmax Is Superior for Attention

Paper • 2501.19399 • Published Jan 31, 2025 • 25
EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling

Paper • 2502.09509 • Published Feb 13, 2025 • 9

MolmoAct2: Action Reasoning Models for Real-world Deployment

Paper • 2605.02881 • Published 26 days ago • 345
LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118
Continuous Latent Diffusion Language Model

Paper • 2605.06548 • Published 23 days ago • 80

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

Paper • 2605.27365 • Published 4 days ago • 118

Fast-SAM3D: 3Dfy Anything in Images but Faster

Paper • 2602.05293 • Published Feb 5 • 2
Stroke of Surprise: Progressive Semantic Illusions in Vector Sketching

Paper • 2602.12280 • Published Feb 12 • 34
CADEvolve: Creating Realistic CAD via Program Evolution

Paper • 2602.16317 • Published Feb 18 • 30
SketchDynamics: Exploring Free-Form Sketches for Dynamic Intent Expression in Animation Generation

Paper • 2601.20622 • Published Jan 28 • 2

Papers I'm going to read

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published Jan 6 • 180
MHLA: Restoring Expressivity of Linear Attention via Token-Level Multi-Head

Paper • 2601.07832 • Published Jan 12 • 53
Motion Attribution for Video Generation

Paper • 2601.08828 • Published Jan 13 • 72
Post-LayerNorm Is Back: Stable, ExpressivE, and Deep

Paper • 2601.19895 • Published Jan 27 • 27

about 23 hours ago

YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

Paper • 2512.23273 • Published Dec 29, 2025 • 15
A 58-Addition, Rank-23 Scheme for General 3x3 Matrix Multiplication

Paper • 2512.21980 • Published Dec 26, 2025 • 3
Step-DeepResearch Technical Report

Paper • 2512.20491 • Published Dec 23, 2025 • 88
SAM Audio: Segment Anything in Audio

Paper • 2512.18099 • Published Dec 19, 2025 • 25

Previous
1
2
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs