Gengze Zhou's picture

Gengze Zhou

ZGZzz

·

https://gengzezhou.github.io/

AI & ML interests

Embodied Ai, Vision-and-Language Navigation, Computer vision, Multimodality Learning, LLM

Recent Activity

authored a paper 21 days ago

Learning Goal-Oriented Language-Guided Navigation with Self-Improving Demonstrations at Scale

authored a paper 21 days ago

Embodied Navigation Foundation Model

authored a paper 21 days ago

VLNVerse: A Benchmark for Vision-Language Navigation with Versatile, Embodied, Realistic Simulation and Evaluation

View all activity

Organizations

None yet

authored 5 papers 21 days ago

Learning Goal-Oriented Language-Guided Navigation with Self-Improving Demonstrations at Scale

Paper • 2509.24910 • Published Sep 29, 2025 • 4

Embodied Navigation Foundation Model

Paper • 2509.12129 • Published Sep 15, 2025

VLNVerse: A Benchmark for Vision-Language Navigation with Versatile, Embodied, Realistic Simulation and Evaluation

Paper • 2512.19021 • Published Dec 22, 2025

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

Paper • 2603.07145 • Published Mar 7 • 4

Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments

Paper • 2605.30280 • Published 26 days ago • 146

authored a paper 6 months ago

MMGR: Multi-Modal Generative Reasoning

Paper • 2512.14691 • Published Dec 16, 2025 • 121

authored a paper 7 months ago

Rethinking Training Dynamics in Scale-wise Autoregressive Generation

Paper • 2512.06421 • Published Dec 6, 2025 • 7

authored a paper over 1 year ago

SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts

Paper • 2412.05552 • Published Dec 7, 2024 • 6

authored 4 papers almost 2 years ago

WebVLN: Vision-and-Language Navigation on Websites

Paper • 2312.15820 • Published Dec 25, 2023

NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation

Paper • 2402.15852 • Published Feb 24, 2024

NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models

Paper • 2305.16986 • Published May 26, 2023

NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models

Paper • 2407.12366 • Published Jul 17, 2024 • 4