ICLR 2026 Schedule

Oral

Fri Apr 24 06:30 AM -- 06:40 AM (PDT) @ 201 A/B None

Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation

In Oral Session 3B Image generation

Zhuoyang Zhang ⋅ Luke Huang ⋅ Chengyue Wu ⋅ Shang Yang ⋅ Kelly Peng ⋅ Yao Lu ⋅ Song Han

[ OpenReview]

Oral

Fri Apr 24 06:42 AM -- 06:52 AM (PDT) @ 201 A/B None

SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer

In Oral Session 3B Image generation

Junsong Chen ⋅ Yuyang Zhao ⋅ Jincheng YU ⋅ Ruihang Chu ⋅ Junyu Chen ⋅ Shuai Yang ⋅ Xianbang Wang ⋅ Yicheng Pan ⋅ Zhou Daquan ⋅ Huan Ling ⋅ Haozhe Liu ⋅ Hongwei Yi ⋅ Hao Zhang ⋅ Muyang Li ⋅ Yukang Chen ⋅ Han Cai ⋅ Sanja Fidler ⋅ Ping Luo ⋅ Song Han ⋅ Enze Xie

[ OpenReview]

Oral

Fri Apr 24 06:54 AM -- 07:04 AM (PDT) @ 201 A/B None

Partition Generative Modeling: Masked Modeling Without Masks

In Oral Session 3B Image generation

Justin Deschenaux ⋅ Lan Tran ⋅ Caglar Gulcehre

[ OpenReview]

Oral

Fri Apr 24 07:06 AM -- 07:16 AM (PDT) @ 201 A/B None

NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

In Oral Session 3B Image generation

chunrui han ⋅ Guopeng Li ⋅ Jingwei Wu ⋅ Quan Sun ⋅ Yan Cai ⋅ Yuang Peng ⋅ Zheng Ge ⋅ Deyu Zhou ⋅ Haomiao Tang ⋅ Hongyu Zhou ⋅ Kenkun Liu ⋅ Shu-Tao Xia ⋅ Binxing Jiao ⋅ Daxin Jiang ⋅ Xiangyu Zhang ⋅ Yibo Zhu

[ OpenReview]

Oral

Fri Apr 24 07:18 AM -- 07:28 AM (PDT) @ 201 A/B None

TTSDS2: Resources and Benchmark for Evaluating Human-Quality Text to Speech Systems

In Oral Session 3B Image generation

Christoph Minixhofer ⋅ Ondrej Klejch ⋅ Peter Bell

[ OpenReview]

Oral

Fri Apr 24 07:30 AM -- 07:40 AM (PDT) @ 201 A/B None

VibeVoice: Expressive Podcast Generation with Next-Token Diffusion

In Oral Session 3B Image generation

Zhiliang Peng ⋅ Jianwei Yu ⋅ Wenhui Wang ⋅ Yaoyao Chang ⋅ Yutao Sun ⋅ Li Dong ⋅ Yi Zhu ⋅ Weijiang Xu ⋅ Hangbo Bao ⋅ Zehua Wang ⋅ Shaohan Huang ⋅ Yan Xia ⋅ Furu Wei

[ OpenReview]

Oral

Fri Apr 24 07:42 AM -- 07:52 AM (PDT) @ 201 A/B None

UALM: Unified Audio Language Model for Understanding, Generation and Reasoning

In Oral Session 3B Image generation

Jinchuan Tian ⋅ Sang-gil Lee ⋅ Zhifeng Kong ⋅ Sreyan Ghosh ⋅ Arushi Goel ⋅ Chao-Han Huck Yang ⋅ Wenliang Dai ⋅ Zihan Liu ⋅ Hanrong Ye ⋅ Shinji Watanabe ⋅ Mohammad Shoeybi ⋅ Bryan Catanzaro ⋅ Rafael Valle ⋅ Wei Ping

[ OpenReview]