Zihan Ding | Beihang University

Bio

I am currently a Ph.D. candidate at Beihang University, where my research focuses on Deep Reinforcement Learning and Large Language Models. I am fortunate to be advised by Prof. Si Liu. I received my Bachelor's degree from Beihang University in 2021. Currently, I am also a research intern at Tencent, working under the guidance of Zhongwen Xu.

News

2026-01 SPO is accepted by ICLR 2026!
2025-11 SPO code is now available in verl-recipe.
2025-10 SPO is accepted for presentation at NeurIPS Workshop MATH-AI 2025!

Publications

Single-stream Policy Optimization

Zhongwen Xu^*, Zihan Ding^*

ICLR 2026

Paper Blog Code Huggingface

Point Cluster: A Compact Message Unit for Communication-Efficient Collaborative Perception

Zihan Ding, Jiahui Fu, Si Liu, Hongyu Li, Siheng Chen, Hongsheng Li, Shifeng Zhang, Xu Zhou

ICLR 2025

Paper

Intuition Estimation and Knowledge-Based Planning for Human-AI Collaboration

Zihan Ding^*, Jinyu Chen^*, Si Liu, Shifeng Zhang

PRCV 2025

Paper

Topv-nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-Shot Object Navigation

Linqing Zhong, Chen Gao, Zihan Ding, Yue Liao, Huimin Ma, Shifeng Zhang, Xu Zhou, Si Liu

arXiv Preprint

Paper

Dynamic Prompting of Frozen Text-to-Image Diffusion Models for Panoptic Narrative Grounding

Hongyu Li, Tianrui Hui, Zihan Ding, Jing Zhang, Bin Ma, Xiaoming Wei, Jizhong Han, Si Liu

ACM MM 2024

Paper

Region-Adaptive and Context-Complementary Cross Modulation for RGB-T Semantic Segmentation

Fengguang Peng, Zihan Ding, Ziming Chen, Gang Wang, Tianrui Hui, Si Liu, Hang Shi

Pattern Recognition

Paper

Language-Aware Spatial-Temporal Collaboration for Referring Video Segmentation

Tianrui Hui, Si Liu, Zihan Ding, Shaofei Huang, Guanbin Li, Wenguan Wang, Luoqi Liu, Jizhong Han

TPAMI

Paper

Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic Narrative Grounding

Tianrui Hui, Zihan Ding, Junshi Huang, Xiaoming Wei, Xiaolin Wei, Jiao Dai, Jizhong Han, Si Liu

IJCAI 2023

Paper

Object-Aware Distillation Pyramid for Open-Vocabulary Object Detection

Luting Wang, Yi Liu, Penghui Du, Zihan Ding, Yue Liao, Qiaosong Qi, Biaolong Chen, Si Liu

CVPR 2023

Paper

Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation

Zihan Ding, Tianrui Hui, Junshi Huang, Xiaoming Wei, Jizhong Han, Si Liu

CVPR 2022

Paper Code

PPMN: Pixel-Phrase Matching Network for One-Stage Panoptic Narrative Grounding

Zihan Ding^*, Zi-han Ding^*, Tianrui Hui, Junshi Huang, Xiaoming Wei, Xiaolin Wei, Si Liu

ACM MM 2022

Paper Code

Collaborative Spatial-Temporal Modeling for Language-Queried Video Actor Segmentation

Tianrui Hui, Shaofei Huang, Si Liu, Zihan Ding, Guanbin Li, Wenguan Wang, Jizhong Han, Fei Wang

CVPR 2021

Paper

Progressive Multimodal Interaction Network for Referring Video Object Segmentation

Zihan Ding, Tianrui Hui, Shaofei Huang, Si Liu, Xuan Luo, Junshi Huang, Xiaoming Wei

The 3rd Large-scale Video Object Segmentation Challenge

Paper