ICLR 2024 Friday 05/10

Timezone: Europe/Vienna

Full Schedule Tue 5/7 Wed 5/8 Thu 5/9 Fri 5/10 Sat 5/11

Registration Desk

8:00 AM - 6:30 PM

Please bring an ID or a credit card and your registration receipt QR code to check in. Avoid brining your passport to the convention center.

... more

Invited Talk

The emerging science of benchmarks

Moritz Hardt

8:30 AM - 9:30 AM

Benchmarks are the keystone that hold the machine learning community together. Growing as a research paradigm since the 1980s, there's much we've done with them, but little we know about them. In this talk, I will trace the rudiments of an emerging science of benchmarks through selected empirical and theoretical observations. Specifically, we'll discuss the role of annotator errors, external validity of model rankings, and the promise of multi-task benchmarks. The results in each case challenge conventional wisdom and underscore the benefits of developing a science of benchmarks.

... more

Speaker Bio

Hardt is a director at the Max Planck Institute for Intelligent Systems, Tübingen. Previously, he was Associate Professor for Electrical Engineering and Computer Sciences at the University of California, Berkeley. His research contributes to the scientific foundations of machine learning and algorithmic decision making with a focus on social questions. He co-authored Fairness and Machine Learning: Limitations and Opportunities (MIT Press) and Patterns, Predictions, and Actions: Foundations of Machine Learning (Princeton University Press).

... more

Oral

Oral 7A

10:00 AM - 10:45 AM

3 Events in this session

Small-scale proxies for large-scale Transformer training instabilities

Mitchell Wortsman · Peter Liu · Lechao Xiao · Katie Everett · Alexander Alemi · Ben Adlam · John Co-Reyes · Izzeddin Gur · Abhishek Kumar · Roman Novak · Jeffrey Pennington · Jascha Sohl-Dickstein · Kelvin Xu · Jaehoon Lee · Justin Gilmer · Simon Kornblith

An Analytical Solution to Gauss-Newton Loss for Direct Image Alignment

Sergei Solonets · Daniil Sinitsyn · Lukas Von Stumberg · Nikita Araslanov · Daniel Cremers

Statistically Optimal $K$-means Clustering via Nonnegative Low-rank Semidefinite Programming

Yubo Zhuang · Xiaohui Chen · Yun Yang · Richard Zhang

Go to Event Page

Oral

Oral 7B

10:00 AM - 10:45 AM

3 Events in this session

DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation

Jiaxiang Tang · Jiawei Ren · Hang Zhou · Ziwei Liu · Gang Zeng

"What Data Benefits My Classifier?" Enhancing Model Performance and Interpretability through Influence-Based Data Selection

Anshuman Chhabra · Peizhao Li · Prasant Mohapatra · Hongfu Liu

Knowledge Card: Filling LLMs' Knowledge Gaps with Plug-in Specialized Language Models

Shangbin Feng · Weijia Shi · Yuyang Bai · Vidhisha Balachandran · Tianxing He · Yulia Tsvetkov

Go to Event Page

Oral

Oral 7C

10:00 AM - 10:45 AM

2 Events in this session

Less is More: Fewer Interpretable Region via Submodular Subset Selection

Ruoyu Chen · Hua Zhang · Siyuan Liang · Jingzhi Li · Xiaochun Cao

On the Joint Interaction of Models, Data, and Features

Yiding Jiang · Christina Baek · J Kolter

Go to Event Page

Oral

Oral 7D

10:00 AM - 10:45 AM

2 Events in this session

One-shot Empirical Privacy Estimation for Federated Learning

Galen Andrew · Peter Kairouz · Sewoong Oh · Alina Oprea · H. Brendan McMahan · Vinith Suriyakumar

On the Humanity of Conversational AI: Evaluating the Psychological Portrayal of LLMs

Jen-tse Huang · Wenxuan Wang · Eric John Li · Man Ho LAM · Shujie Ren · Youliang Yuan · Wenxiang Jiao · Zhaopeng Tu · Michael Lyu

Go to Event Page

Poster

Poster Session 7

10:45 AM - 12:45 PM

264 Events in this session

Weatherproofing Retrieval for Localization with Generative AI and Geometric Consistency

Yannis Kalantidis · Mert Bulent SARIYILDIZ · Rafael Rezende · Philippe Weinzaepfel · Diane Larlus · Gabriela Csurka

DyST: Towards Dynamic Neural Scene Representations on Real-World Videos

Maximilian Seitzer · Sjoerd van Steenkiste · Thomas Kipf · Klaus Greff · Mehdi S. M. Sajjadi

Follow-Up Differential Descriptions: Language Models Resolve Ambiguities for Image Classification

Reza Esfandiarpoor · Stephen Bach

What's in a Prior? Learned Proximal Networks for Inverse Problems

Zhenghan Fang · Sam Buchanan · Jeremias Sulam

Connect, Collapse, Corrupt: Learning Cross-Modal Tasks with Uni-Modal Data

Yuhui Zhang · Elaine Sui · Serena Yeung

Implicit Neural Representations and the Algebra of Complex Wavelets

T Mitchell Roddenberry · Vishwanath Saragadam · Maarten V de Hoop · Richard Baraniuk

Bayes Conditional Distribution Estimation for Knowledge Distillation Based on Conditional Mutual Information

Linfeng Ye · Shayan Mohajer Hamidi · Renhao Tan · EN-HUI YANG

Enhancing One-Shot Federated Learning Through Data and Ensemble Co-Boosting

Rong Dai · Yonggang Zhang · Ang Li · Tongliang Liu · Xun Yang · Bo Han

ODICE: Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update

Liyuan Mao · Haoran Xu · Weinan Zhang · Xianyuan Zhan

Decoupling regularization from the action space

Sobhan Mohammadpour · Emma Frejinger · Pierre-Luc Bacon

Pose Modulated Avatars from Video

Chunjin Song · Bastian Wandt · Helge Rhodin

PAE: Reinforcement Learning from External Knowledge for Efficient Exploration

Zhe Wu · Haofei Lu · Junliang Xing · You Wu · Renye Yan · Yaozhong Gan · Yuanchun Shi

A Policy Gradient Method for Confounded POMDPs

Mao Hong · Zhengling Qi · Yanxun Xu

On Representation Complexity of Model-based and Model-free Reinforcement Learning

Hanlin Zhu · Baihe Huang · Stuart Russell

Local Composite Saddle Point Optimization

Site Bai · Brian Bullins

AutoChunk: Automated Activation Chunk for Memory-Efficient Deep Learning Inference

Xuanlei Zhao · Shenggan Cheng · Guangyang LU · Haotian Zhou · Bin Jia · Yang You

Flag Aggregator: Scalable Distributed Training under Failures and Augmented Losses using Convex Optimization

Hamidreza Almasi · Harsh Mishra · Balajee Vamanan · Sathya N. Ravi

Relaxing the Additivity Constraints in Decentralized No-Regret High-Dimensional Bayesian Optimization

Anthony Bardou · Patrick Thiran · Thomas Begin

A Discretization Framework for Robust Contextual Stochastic Optimization

Rares Cristian · Georgia Perakis

A Study of Bayesian Neural Network Surrogates for Bayesian Optimization

Yucen Li · Tim G. J. Rudner · Andrew Gordon Wilson

SpikePoint: An Efficient Point-based Spiking Neural Network for Event Cameras Action Recognition

Hongwei Ren · Yue ZHOU · Xiaopeng LIN · Yulong Huang · Haotian FU · Jie Song · Bojun Cheng

A Differentially Private Clustering Algorithm for Well-Clustered Graphs

Weiqiang He · Hendrik Fichtenberger · Pan Peng

Threshold-Consistent Margin Loss for Open-World Deep Metric Learning

Qin ZHANG · Linghan Xu · Jun Fang · Qingming Tang · Yingnian Wu · Joseph Tighe · Yifan Xing

Knowledge Distillation Based on Transformed Teacher Matching

Kaixiang Zheng · EN-HUI YANG

Progressive Fourier Neural Representation for Sequential Video Compilation

Haeyong Kang · Jaehong Yoon · DaHyun Kim · Sung Ju Hwang · Chang Yoo

Continuous Field Reconstruction from Sparse Observations with Implicit Neural Networks

Xihaier Luo · Wei Xu · Balasubramanya T. Nadiga · Yihui Ren · Shinjae Yoo

FITS: Modeling Time Series with $10k$ Parameters

Zhijian Xu · Ailing Zeng · Qiang Xu

Learning to Embed Time Series Patches Independently

Seunghan Lee · Taeyoung Park · Kibok Lee

Generalization of Scaled Deep ResNets in the Mean-Field Regime

Yihang Chen · Fanghui Liu · Yiping Lu · Grigorios Chrysos · Volkan Cevher

Feature Collapse

Thomas Laurent · James von Brecht · Xavier Bresson

Dichotomy of Early and Late Phase Implicit Biases Can Provably Induce Grokking

Kaifeng Lyu · Jikai Jin · Zhiyuan Li · Simon Du · Jason Lee · Wei Hu

Alt-Text with Context: Improving Accessibility for Images on Twitter

Nikita Srivatsan · Sofia Samaniego · Omar Florez · Taylor Berg-Kirkpatrick

Optimal criterion for feature learning of two-layer linear neural network in high dimensional interpolation regime

Keita Suzuki · Taiji Suzuki

Exploring Target Representations for Masked Autoencoders

xingbin liu · Jinghao Zhou · Tao Kong · Xianming Lin · Rongrong Ji

An Investigation of Representation and Allocation Harms in Contrastive Learning

Subha Maity · Mayank Agarwal · Mikhail Yurochkin · Yuekai Sun

Improved Efficiency Based on Learned Saccade and Continuous Scene Reconstruction From Foveated Visual Sampling

Jiayang Liu · Yiming Bu · Daniel Tso · Qinru Qiu

Do Generated Data Always Help Contrastive Learning?

Yifei Wang · Jizhe Zhang · Yisen Wang

Efficient Backdoor Attacks for Deep Neural Networks in Real-world Scenarios

Ziqiang Li · Hong Sun · Pengfei Xia · Heng Li · Beihao Xia · Yi Wu · Bin Li

Does CLIP’s generalization performance mainly stem from high train-test similarity?

Prasanna Mayilvahanan · Thaddäus Wiedemer · Evgenia Rusak · Matthias Bethge · Wieland Brendel

LEAP: Liberate Sparse-View 3D Modeling from Camera Poses

Hanwen Jiang · Zhenyu Jiang · Yue Zhao · Qixing Huang

Understanding Domain Generalization: A Noise Robustness Perspective

Rui Qiao · Bryan Kian Hsiang Low

Rethinking Model Ensemble in Transfer-based Adversarial Attacks

Huanran Chen · Yichi Zhang · Yinpeng Dong · Xiao Yang · Hang Su · Jun Zhu

ZeroFlow: Scalable Scene Flow via Distillation

Kyle Vedder · Neehar Peri · Nathaniel Chodosh · Ishan Khatri · ERIC EATON · Dinesh Jayaraman · Yang Liu · Deva Ramanan · James Hays

OPTIMAL ROBUST MEMORIZATION WITH RELU NEURAL NETWORKS

Lijia Yu · XIAOSHAN GAO · Lijun Zhang

On Trajectory Augmentations for Off-Policy Evaluation

Ge Gao · Qitong Gao · Xi Yang · Song Ju · Miroslav Pajic · Min Chi

Score Models for Offline Goal-Conditioned Reinforcement Learning

Harshit Sikchi · Rohan Chitnis · Ahmed Touati · Alborz Geramifard · Amy Zhang · Scott Niekum

Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages

Guozheng Ma · Lu Li · Sen Zhang · Zixuan Liu · Zhen Wang · Yixin Chen · Li Shen · Xueqian Wang · Dacheng Tao

Proper Laplacian Representation Learning

Diego Gomez · Michael Bowling · Marlos C. Machado

REValueD: Regularised Ensemble Value-Decomposition for Factorisable Markov Decision Processes

David Ireland · Giovanni Montana

Accelerating Data Generation for Neural Operators via Krylov Subspace Recycling

Hong Wang · Zhongkai Hao · Jie Wang · Zijie Geng · Zhen Wang · Bin Li · Feng Wu

Exploring the Promise and Limits of Real-Time Recurrent Learning

Kazuki Irie · Anand Gopalakrishnan · Jürgen Schmidhuber

Adaptive Rational Activations to Boost Deep Reinforcement Learning

Quentin Delfosse · Patrick Schramowski · Martin Mundt · Alejandro Molina Ramirez · Kristian Kersting

Bridging State and History Representations: Understanding Self-Predictive RL

Tianwei Ni · Benjamin Eysenbach · Erfan Seyedsalehi · Michel Ma · Clement Gehring · Aditya Mahajan · Pierre-Luc Bacon

DragonDiffusion: Enabling Drag-style Manipulation on Diffusion Models

Chong Mou · Xintao Wang · Jiechong Song · Ying Shan · Jian Zhang

Understanding when Dynamics-Invariant Data Augmentations Benefit Model-free Reinforcement Learning Updates

Nicholas Corrado · Josiah Hanna

Sample-Efficient Multi-Agent RL: An Optimization Perspective

Nuoya Xiong · Zhihan Liu · Zhaoran Wang · Zhuoran Yang

Enhancing Human Experience in Human-Agent Collaboration: A Human-Centered Modeling Approach Based on Positive Human Gain

Yiming Gao · Feiyu Liu · Liang Wang · Dehua Zheng · Zhenjie Lian · Weixuan Wang · Wenjin Yang · Siqin Li · Xianliang Wang · Wenhui Chen · Jing Dai · QIANG FU · Yang Wei · Lanxiao Huang · Wei Liu

The Update-Equivalence Framework for Decision-Time Planning

Samuel Sokota · Gabriele Farina · David Wu · Hengyuan Hu · Kevin A. Wang · J Kolter · Noam Brown

Robust Adversarial Reinforcement Learning via Bounded Rationality Curricula

Aryaman Reddi · Maximilian Tölle · Jan Peters · Georgia Chalvatzaki · Carlo D'Eramo

Intelligent Switching for Reset-Free RL

Darshan Patil · Janarthanan Rajendran · Glen Berseth · Sarath Chandar

Extending Power of Nature from Binary to Real-Valued Graph Learning in Real World

Chunshu Wu · Ruibing Song · Chuan Liu · Yunan Yang · Ang Li · Michael Huang · Tong Geng

A Hierarchical Bayesian Model for Few-Shot Meta Learning

Minyoung Kim · Timothy Hospedales

Stochastic Gradient Descent for Gaussian Processes Done Right

Jihao Andreas Lin · Shreyas Padhy · Javier Antorán · Austin Tripp · Alexander Terenin · Csaba Szepesvari · José Miguel Hernández Lobato · David Janz

Neural-Symbolic Recursive Machine for Systematic Generalization

Qing Li · Yixin Zhu · Yitao Liang · Yingnian Wu · Song-Chun Zhu · Siyuan Huang

OpenNeRF: Open Set 3D Neural Scene Segmentation with Pixel-Wise Features and Rendered Novel Views

Francis Engelmann · Fabian Manhardt · Michael Niemeyer · Keisuke Tateno · Federico Tombari

Neural structure learning with stochastic differential equations

Benjie Wang · Joel Jennings · Wenbo Gong

RECOMBINER: Robust and Enhanced Compression with Bayesian Implicit Neural Representations

Jiajun He · Gergely Flamich · Zongyu Guo · José Miguel Hernández Lobato

One-shot Active Learning Based on Lewis Weight Sampling for Multiple Deep Models

Sheng-Jun Huang · Yi Li · Yiming Sun · Ying-Peng Tang

How Many Pretraining Tasks Are Needed for In-Context Learning of Linear Regression?

Jingfeng Wu · Difan Zou · Zixiang Chen · Vladimir Braverman · Quanquan Gu · Peter Bartlett

Can We Evaluate Domain Adaptation Models Without Target-Domain Labels?

JIANFEI YANG · Hanjie Qian · Yuecong Xu · Yuecong Xu · Kai Wang · Lihua Xie

Mediator Interpretation and Faster Learning Algorithms for Linear Correlated Equilibria in General Sequential Games

Brian Zhang · Gabriele Farina · Tuomas Sandholm

Understanding prompt engineering may not require rethinking generalization

Victor Akinwande · Yiding Jiang · Dylan Sam · J Kolter

Convergence of Bayesian Bilevel Optimization

Shi Fu · Fengxiang He · Xinmei Tian · Dacheng Tao

Cascading Reinforcement Learning

Yihan Du · R. Srikant · Wei Chen

Bandits Meet Mechanism Design to Combat Clickbait in Online Recommendation

Thomas Kleine Buening · Aadirupa Saha · Christos Dimitrakakis · Haifeng Xu

WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space

Katja Schwarz · Seung Wook Kim · Jun Gao · Sanja Fidler · Andreas Geiger · Karsten Kreis

Only Pay for What Is Uncertain: Variance-Adaptive Thompson Sampling

Aadirupa Saha · Branislav Kveton

Fixed-Budget Differentially Private Best Arm Identification

Zhirui Chen · P. N. Karthik · Yeow Meng Chee · Vincent Tan

Incentivized Truthful Communication for Federated Bandits

Zhepei Wei · Chuanhao Li · Tianze Ren · Haifeng Xu · Hongning Wang

Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods

Sara Klein · Simon Weissmann · Leif Döring

Demonstration-Regularized RL

Daniil Tiapkin · Denis Belomestny · Daniele Calandriello · Eric Moulines · Alexey Naumov · Pierre Perrault · Michal Valko · Pierre Ménard

LCOT: Linear Circular Optimal Transport

ROCIO DIAZ MARTIN · Ivan Medri · Yikun Bai · Xinran Liu · Kangbai Yan · Gustavo Rohde · Soheil Kolouri

Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence Elicitation in LLMs

Miao Xiong · Zhiyuan Hu · Xinyang Lu · YIFEI LI · Jie Fu · Junxian He · Bryan Hooi

An LLM can Fool Itself: A Prompt-Based Adversarial Attack

Xilie Xu · Keyi Kong · Ning Liu · Lizhen Cui · Di Wang · Jingfeng Zhang · Mohan Kankanhalli

Demystifying Local & Global Fairness Trade-offs in Federated Learning Using Partial Information Decomposition

Faisal Hamman · Sanghamitra Dutta

Incentive-Aware Federated Learning with Training-Time Model Rewards

Zhaoxuan Wu · Mohammad Mohammadi Amiri · Ramesh Raskar · Bryan Kian Hsiang Low

Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence

Sunghwan Hong · Seokju Cho · Seungryong Kim · Stephen Lin

Hyper Evidential Deep Learning to Quantify Composite Classification Uncertainty

Changbin Li · Kangshuo Li · Yuzhe Ou · Lance Kaplan · Audun Jøsang · Jin-Hee Cho · DONG HYUN JEONG · Feng Chen

Universal Backdoor Attacks

Benjamin Schneider · Nils Lukas · Florian Kerschbaum

Hiding in Plain Sight: Disguising Data Stealing Attacks in Federated Learning

Kostadin Garov · Dimitar I. Dimitrov · Nikola Jovanović · Martin Vechev

One-shot Empirical Privacy Estimation for Federated Learning

Galen Andrew · Peter Kairouz · Sewoong Oh · Alina Oprea · H. Brendan McMahan · Vinith Suriyakumar

On the Humanity of Conversational AI: Evaluating the Psychological Portrayal of LLMs

Jen-tse Huang · Wenxuan Wang · Eric John Li · Man Ho LAM · Shujie Ren · Youliang Yuan · Wenxiang Jiao · Zhaopeng Tu · Michael Lyu

Parameter-Efficient Multi-Task Model Fusion with Partial Linearization

Anke Tang · Li Shen · Yong Luo · Yibing Zhan · Han Hu · Bo Du · Yixin Chen · Dacheng Tao

Gradual Domain Adaptation via Gradient Flow

Zhan ZHUANG · Yu Zhang · Ying Wei

Continual Learning in the Presence of Spurious Correlations: Analyses and a Simple Baseline

Donggyu Lee · Sangwon Jung · Taesup Moon

Kalman Filter for Online Classification of Non-Stationary Data

Michalis Titsias · Alexandre Galashov · Amal Rannen-Triki · Razvan Pascanu · Yee Whye Teh · Jorg Bornschein

Prediction Error-based Classification for Class-Incremental Learning

Michał Zając · Tinne Tuytelaars · Gido M van de Ven

An Analytical Solution to Gauss-Newton Loss for Direct Image Alignment

Sergei Solonets · Daniil Sinitsyn · Lukas Von Stumberg · Nikita Araslanov · Daniel Cremers

Adaptive Instrument Design for Indirect Experiments

Yash Chandak · Shiv Shankar · Vasilis Syrgkanis · Emma Brunskill

Selective Mixup Fine-Tuning for Optimizing Non-Decomposable Objectives

Shrinivas Ramasubramanian · Harsh Rangwani · Sho Takemori · Kunal Samanta · Yuhei Umeda · Venkatesh Babu Radhakrishnan

On the Provable Advantage of Unsupervised Pretraining

Jiawei Ge · Shange Tang · Jianqing Fan · Chi Jin

Weakly Supervised Virus Capsid Detection with Image-Level Annotations in Electron Microscopy Images

Hannah Kniesel · Leon Sick · Tristan Payer · Tim Bergner · Kavitha Shaga Devan · Clarissa Read · Paul Walther · Timo Ropinski · Pedro Hermosilla

Multi-View Causal Representation Learning with Partial Observability

Dingling Yao · Danru Xu · Sébastien Lachapelle · Sara Magliacane · Perouz Taslakian · Georg Martius · Julius von Kügelgen · Francesco Locatello

Performance Gaps in Multi-view Clustering under the Nested Matrix-Tensor Model

Hugo Lebeau · Mohamed El Amine Seddik · José Henrique Goulart

SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch

Chun-Liang Li · Tomas Pfister · Kihyuk Sohn · Jinsung Yoon · Sercan Arik

Plugin estimators for selective classification with out-of-distribution detection

Harikrishna Narasimhan · Aditya Krishna Menon · Wittawat Jitkrittum · Sanjiv Kumar

In defense of parameter sharing for model-compression

Aditya Desai · Anshumali Shrivastava

Modulated Phase Diffusor: Content-Oriented Feature Synthesis for Detecting Unknown Objects

Aming Wu · Cheng Deng

DQ-LoRe: Dual Queries with Low Rank Approximation Re-ranking for In-Context Learning

Jing Xiong · Zixuan Li · Chuanyang Zheng · Zhijiang Guo · Yichun Yin · Enze Xie · Zhicheng YANG · Qingxing Cao · Haiming Wang · Xiongwei Han · Jing Tang · Chengming Li · Xiaodan Liang

Probabilistic Adaptation of Black-Box Text-to-Video Models

Sherry Yang · Yilun Du · Bo Dai · Dale Schuurmans · Joshua B Tenenbaum · Pieter Abbeel

Decodable and Sample Invariant Continuous Object Encoder

Dehao Yuan · Furong Huang · Cornelia Fermuller · Yiannis Aloimonos

How Does Unlabeled Data Provably Help Out-of-Distribution Detection?

Xuefeng Du · Zhen Fang · Ilias Diakonikolas · Yixuan Li

Less or More From Teacher: Exploiting Trilateral Geometry For Knowledge Distillation

Chengming Hu · Haolun Wu · Xuan Li · Chen Ma · Xi Chen · Boyu Wang · Jun Yan · Xue Liu

"What Data Benefits My Classifier?" Enhancing Model Performance and Interpretability through Influence-Based Data Selection

Anshuman Chhabra · Peizhao Li · Prasant Mohapatra · Hongfu Liu

Independent-Set Design of Experiments for Estimating Treatment and Spillover Effects under Network Interference

Chencheng Cai · Xu Zhang · Edoardo Airoldi

A Dynamical View of the Question of Why

Mehdi Fatemi · Sindhu Chatralinganadoddi Mariyappa Gowda

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Valentyn Melnychuk · Dennis Frauen · Stefan Feuerriegel

A Linear Algebraic Framework for Counterfactual Generation

Jong-Hoon Ahn · Akshay Vashist

LLCP: Learning Latent Causal Processes for Reasoning-based Video Question Answer

Guangyi Chen · Yuke Li · Xiao Liu · Zijian Li · Eman Al Suradi · Donglai Wei · Kun Zhang

Consistent4D: Consistent 360° Dynamic Object Generation from Monocular Video

Yanqin Jiang · Li Zhang · Jin Gao · Weiming Hu · Yao Yao

Data Debugging with Shapley Importance over Machine Learning Pipelines

Bojan Karlaš · David Dao · Matteo Interlandi · Sebastian Schelter · Wentao Wu · Ce Zhang

DOS: Diverse Outlier Sampling for Out-of-Distribution Detection

Wenyu Jiang · Hao Cheng · MingCai Chen · Chongjun Wang · Hongxin Wei

Rethinking CNN’s Generalization to Backdoor Attack from Frequency Domain

Quanrui Rao · Lin Wang · Wuying Liu

Does Progress On Object Recognition Benchmarks Improve Generalization on Crowdsourced, Global Data?

Megan Richards · Polina Kirichenko · Diane Bouchacourt · Mark Ibrahim

Towards Eliminating Hard Label Constraints in Gradient Inversion Attacks

Yanbo Wang · Jian Liang · Ran He

Intriguing Properties of Data Attribution on Diffusion Models

Xiaosen Zheng · Tianyu Pang · Chao Du · Jing Jiang · Min Lin

Adapting and Evaluating Influence-Estimation Methods for Gradient-Boosted Decision Trees

Jonathan Brophy · Zayd Hammoudeh · Daniel Lowd

Where We Have Arrived in Proving the Emergence of Sparse Interaction Primitives in DNNs

Qihan Ren · Jiayang Gao · Wen Shen · Quanshi Zhang

SOInter: A Novel Deep Energy-Based Interpretation Method for Explaining Structured Output Models

S. Fatemeh Seyyedsalehi · Mahdieh Baghshah · Hamid Rabiee

Less is More: Fewer Interpretable Region via Submodular Subset Selection

Ruoyu Chen · Hua Zhang · Siyuan Liang · Jingzhi Li · Xiaochun Cao

MVSFormer++: Revealing the Devil in Transformer's Details for Multi-View Stereo

chenjie cao · xinlin ren · Yanwei Fu

Faithful Rule Extraction for Differentiable Rule Learning Models

Xiaxia Wang · David Jaime Tena Cucala · Bernardo Grau · Ian Horrocks

Faithful and Efficient Explanations for Neural Networks via Neural Tangent Kernel Surrogate Models

Andrew Engel · Zhichao Wang · Natalie Frank · Ioana Dumitriu · Sutanay Choudhury · Anand Sarwate · Tony Chiang

Enhancing Group Fairness in Online Settings Using Oblique Decision Forests

Somnath Basu Roy Chowdhury · Nicholas Monath · Ahmad Beirami · Rahul Kidambi · Kumar Dubey · Amr Ahmed · Snigdha Chaturvedi

Beyond Accuracy: Evaluating Self-Consistency of Code Large Language Models with IdentityChain

Marcus J. Min · Yangruibo Ding · Luca Buratti · Saurabh Pujar · Gail Kaiser · Suman Jana · Baishakhi Ray

f-FERM: A Scalable Framework for Robust Fair Empirical Risk Minimization

Sina Baharlouei · Shivam Patel · Meisam Razaviyayn

Learning with Mixture of Prototypes for Out-of-Distribution Detection

Haodong Lu · Dong Gong · Shuo Wang · Jason Xue · Lina Yao · Kristen Moore

SolidGen: An Autoregressive Model for Direct B-rep Synthesis

Karl Willis · Joseph Lambourne · Nigel Morris · Nishkrit Desai · Aditya Sanghi · Pradeep Kumar Jayaraman

Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

Xin Li · Jing Yu Koh · Alexander Ku · Burcu Karagol Ayan · Han Zhang · Thang Luong · Yonghui Wu · Zarana Parekh · Yinfei Yang · Wei Han · Zirui Wang · Vijay Vasudevan · Jiahui Yu · Ben Hutchinson · Yuanzhong Xu · Jason Baldridge · Gunjan Baid

Faithful Explanations of Black-box NLP Models Using LLM-generated Counterfactuals

Yair Gat · Nitay Calderon · Amir Feder · Alexander Chapanin · Amit Sharma · Roi Reichart

Tackling the Data Heterogeneity in Asynchronous Federated Learning with Cached Update Calibration

Yujia Wang · Yuanpu Cao · Jingcheng Wu · Ruoyu Chen · Jinghui Chen

Matcher: Segment Anything with One Shot Using All-Purpose Feature Matching

Yang Liu · Muzhi Zhu · Hengtao Li · Hao Chen · Xinlong Wang · Chunhua Shen

Data-independent Module-aware Pruning for Hierarchical Vision Transformers

Yang He · Joey Tianyi Zhou

Prometheus: Inducing Fine-Grained Evaluation Capability in Language Models

Seungone Kim · Jamin Shin · yejin cho · Joel Jang · Shayne Longpre · Hwaran Lee · Sangdoo Yun · Ryan, S Shin · Sungdong Kim · James Thorne · Minjoon Seo

GAIA: Zero-shot Talking Avatar Generation

Tianyu He · Junliang Guo · Runyi Yu · Yuchi Wang · jialiang zhu · Kaikai An · Leyi Li · Xu Tan · Chunyu Wang · Han Hu · HsiangTao Wu · sheng zhao · Jiang Bian

Enhancing Instance-Level Image Classification with Set-Level Labels

Renyu Zhang · Aly Khan · Yuxin Chen · Robert Grossman

What Makes Good Data for Alignment? A Comprehensive Study of Automatic Data Selection in Instruction Tuning

Wei Liu · Weihao Zeng · Keqing He · Yong Jiang · Junxian He

PnP Inversion: Boosting Diffusion-based Editing with 3 Lines of Code

Xuan Ju · Ailing Zeng · Yuxuan Bian · Shaoteng Liu · Qiang Xu

RETSim: Resilient and Efficient Text Similarity

Marina Zhang · Owen Vallis · Aysegul Bumin · Tanay Vakharia · Elie Bursztein

Principled Architecture-aware Scaling of Hyperparameters

Wuyang Chen · Junru Wu · Zhangyang Wang · Boris Hanin

HIFA: High-fidelity Text-to-3D Generation with Advanced Diffusion Guidance

Junzhe Zhu · Peiye Zhuang · Sanmi Koyejo

Ins-DetCLIP: Aligning Detection Model to Follow Human-Language Instruction

Renjie Pi · Lewei Yao · Jianhua Han · Xiaodan Liang · Wei Zhang · Hang Xu

Graph Transformers on EHRs: Better Representation Improves Downstream Performance

Raphael Poulain · Rahmatollah Beheshti

Learning to Act from Actionless Videos through Dense Correspondences

Po-Chen Ko · Jiayuan Mao · Yilun Du · Shao-Hua Sun · Joshua B Tenenbaum

Federated Text-driven Prompt Generation for Vision-Language Models

Chen Qiu · Xingyu Li · Chaithanya Kumar Mummadi · Madan Ganesh · Zhenzhen Li · Lu Peng · Wan-Yi Lin

RDesign: Hierarchical Data-efficient Representation Learning for Tertiary Structure-based RNA Design

Cheng Tan · Yijie Zhang · Zhangyang Gao · Bozhen Hu · Siyuan Li · Zicheng Liu · Stan Z Li

Optimal Sketching for Residual Error Estimation for Matrix and Vector Norms

Yi Li · Honghao Lin · David Woodruff

THOUGHT PROPAGATION: AN ANALOGICAL APPROACH TO COMPLEX REASONING WITH LARGE LANGUAGE MODELS

Junchi Yu · Ran He · Rex Ying

Variational Bayesian Last Layers

James Harrison · John Willes · Jasper Snoek

BENO: Boundary-embedded Neural Operators for Elliptic PDEs

Haixin Wang · Jiaxin Li · Anubhav Dwivedi · Kentaro Hara · Tailin Wu

MT-Ranker: Reference-free machine translation evaluation by inter-system ranking

Ibraheem Muhammad Moosa · Rui Zhang · Wenpeng Yin

On the Joint Interaction of Models, Data, and Features

Yiding Jiang · Christina Baek · J Kolter

Sparse MoE with Language Guided Routing for Multilingual Machine Translation

Xinyu Zhao · Xuxi Chen · Yu Cheng · Tianlong Chen

Rethinking Complex Queries on Knowledge Graphs with Neural Link Predictors

Hang Yin · Zihao Wang · Yangqiu Song

Inverse Approximation Theory for Nonlinear Recurrent Neural Networks

Shida Wang · Zhong Li · Qianxiao Li

Statistically Optimal $K$-means Clustering via Nonnegative Low-rank Semidefinite Programming

Yubo Zhuang · Xiaohui Chen · Yun Yang · Richard Zhang

Faster Sampling from Log-Concave Densities over Polytopes via Efficient Linear Solvers

Oren Mangoubi · Nisheeth Vishnoi

Unbiased Watermark for Large Language Models

Zhengmian Hu · Lichang Chen · Xidong Wu · Yihan Wu · Hongyang Zhang · Heng Huang

Large Language Models as Generalizable Policies for Embodied Tasks

Andrew Szot · Max Schwarzer · Harsh Agrawal · Bogdan Mazoure · Katherine Metcalf · Walter Talbott · Natalie Mackraz · R Devon Hjelm · Alexander Toshev

Motif: Intrinsic Motivation from Artificial Intelligence Feedback

Martin Klissarov · Pierluca D'Oro · Shagun Sodhani · Roberta Raileanu · Pierre-Luc Bacon · Pascal Vincent · Amy Zhang · Mikael Henaff

$\mathbb{D}^2$ Pruning: Message Passing for Balancing Diversity & Difficulty in Data Pruning

Adyasha Maharana · Prateek Yadav · Mohit Bansal

Towards Meta-Pruning via Optimal Transport

Alexander Theus · Olin Geimer · Friedrich Wicke · Thomas Hofmann · Sotiris Anagnostidis · Sidak Pal Singh

Analyzing and Mitigating Object Hallucination in Large Vision-Language Models

Yiyang Zhou · Chenhang Cui · Jaehong Yoon · Linjun Zhang · Zhun Deng · Chelsea Finn · Mohit Bansal · Huaxiu Yao

Scalable Language Model with Generalized Continual Learning

Bohao PENG · Zhuotao Tian · Shu Liu · Ming-Chang Yang · Jiaya Jia

Online Continual Learning for Interactive Instruction Following Agents

Byeonghwi Kim · Minhyuk Seo · Jonghyun Choi

Multi-Resolution Diffusion Models for Time Series Forecasting

Lifeng Shen · Weiyu Chen · James Kwok

FlashAttention-2: Faster Attention with Better Parallelism and Work Partitioning

Tri Dao

Assessing Uncertainty in Similarity Scoring: Performance & Fairness in Face Recognition

Jean-Rémy Conti · Stephan CLEMENCON

COLLIE: Systematic Construction of Constrained Text Generation Tasks

Shunyu Yao · Howard Chen · Austin Hanjie · Runzhe Yang · Karthik Narasimhan

USB-NeRF: Unrolling Shutter Bundle Adjusted Neural Radiance Fields

Moyang Li · Peng Wang · Lingzhe Zhao · Bangyan Liao · Peidong Liu

Learning Polynomial Problems with $SL(2, \mathbb{R})$-Equivariance

Hannah Lawrence · Mitchell Harris

DIFFTACTILE: A Physics-based Differentiable Tactile Simulator for Contact-rich Robotic Manipulation

Zilin Si · Gu Zhang · Qingwei Ben · Branden Romero · Zhou Xian · Chao Liu · Chuang Gan

Small-scale proxies for large-scale Transformer training instabilities

Decongestion by Representation: Learning to Improve Economic Welfare in Marketplaces

Omer Nahum · Gali Noti · David Parkes · Nir Rosenfeld

Raidar: geneRative AI Detection viA Rewriting

Chengzhi Mao · Carl Vondrick · Hao Wang · Junfeng Yang

An Extensible Framework for Open Heterogeneous Collaborative Perception

Yifan Lu · Yue Hu · Yiqi Zhong · Dequan Wang · Yanfeng Wang · Siheng Chen

Mol-Instructions: A Large-Scale Biomolecular Instruction Dataset for Large Language Models

Yin Fang · Xiaozhuan Liang · Ningyu Zhang · Kangwei Liu · Rui Huang · Zhuo Chen · Xiaohui Fan · Huajun Chen

Leveraging Hyperbolic Embeddings for Coarse-to-Fine Robot Design

Heng Dong · Junyu Zhang · Chongjie Zhang

SineNet: Learning Temporal Dynamics in Time-Dependent Partial Differential Equations

Xuan Zhang · Jacob Helwig · Yuchao Lin · Yaochen Xie · Cong Fu · Stephan Wojtowytsch · Shuiwang Ji

ModernTCN: A Modern Pure Convolution Structure for General Time Series Analysis

DongHao Luo · Xue Wang

MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding

Lirong Wu · Yijun Tian · Yufei Huang · Siyuan Li · Haitao Lin · Nitesh Chawla · Stan Z Li

MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models

Longhui Yu · Weisen JIANG · Han Shi · Jincheng YU · Zhengying Liu · Yu Zhang · James Kwok · Zhenguo Li · Adrian Weller · Weiyang Liu

CLEX: Continuous Length Extrapolation for Large Language Models

Guanzheng Chen · Xin Li · Zaiqiao Meng · Shangsong Liang · Lidong Bing

Learning interpretable control inputs and dynamics underlying animal locomotion

Thomas Soares Mullen · Marine Schimel · Guillaume Hennequin · Christian Machens · Michael B. Orger · Adrien Jouary

A Poincaré Inequality and Consistency Results for Signal Sampling on Large Graphs

Thien Le · Luana Ruiz · Stefanie Jegelka

G$^2$N$^2$ : Weisfeiler and Lehman go grammatical

Jason Piquenot · Aldo Moscatelli · Maxime Berar · Pierre Héroux · Romain Raveaux · Jean-Yves RAMEL · Sébastien Adam

Structural Fairness-aware Active Learning for Graph Neural Networks

Haoyu Han · Xiaorui Liu · Li Ma · MohamadAli Torkamani · Hui Liu · Jiliang Tang · Makoto Yamada

Learning From Simplicial Data Based on Random Walks and 1D Convolutions

Florian Frantzen · Michael Schaub

Beam Enumeration: Probabilistic Explainability For Sample Efficient Self-conditioned Molecular Design

Jeff Guo · Philippe Schwaller

NetInfoF Framework: Measuring and Exploiting Network Usable Information

Meng-Chieh Lee · Haiyang Yu · Jian Zhang · Vassilis N. Ioannidis · Xiang song · Soji Adeshina · Da Zheng · Christos Faloutsos

GraphChef: Decision-Tree Recipes to Explain Graph Neural Networks

Peter Müller · Lukas Faber · Karolis Martinkus · Roger Wattenhofer

KW-Design: Pushing the Limit of Protein Design via Knowledge Refinement

Zhangyang Gao · Cheng Tan · Xingran Chen · Yijie Zhang · Jun Xia · Siyuan Li · Stan Z Li

NoiseDiffusion: Correcting Noise for Image Interpolation with Diffusion Models beyond Spherical Linear Interpolation

Pengfei Zheng · Yonggang Zhang · Zhen Fang · Tongliang Liu · Defu Lian · Bo Han

Rayleigh Quotient Graph Neural Networks for Graph-level Anomaly Detection

Xiangyu Dong · Xingyi Zhang · Sibo WANG

Social Reward: Evaluating and Enhancing Generative AI through Million-User Feedback from an Online Creative Community

Arman Isajanyan · Artur Shatveryan · David Kocharian · Zhangyang Wang · Humphrey Shi

MaGIC: Multi-modality Guided Image Completion

Hao Wang · Yongsheng Yu · Tiejian Luo · Heng Fan · Libo Zhang

Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints

Jian Chen · Ruiyi Zhang · Yufan Zhou · Changyou Chen

AnyText: Multilingual Visual Text Generation and Editing

Yuxiang Tuo · Wangmeng Xiang · Jun-Yan He · Yifeng Geng · Xuansong Xie

Human Motion Diffusion as a Generative Prior

Yonatan Shafir · Guy Tevet · Roy Kapon · Amit Bermano

Neural Atoms: Propagating Long-range Interaction in Molecular Graphs through Efficient Communication Channel

Xuan Li · Zhanke Zhou · Jiangchao Yao · Yu Rong · Lu Zhang · Bo Han

Circumventing Concept Erasure Methods For Text-To-Image Generative Models

Minh Pham · Kelly Marshall · Niv Cohen · Govind Mittal · Chinmay Hegde

BayesDiff: Estimating Pixel-wise Uncertainty in Diffusion via Bayesian Inference

Siqi Kou · Lei Gan · Dequan Wang · Chongxuan Li · Zhijie Deng

Idempotent Generative Network

Assaf Shocher · Amil Dravid · Yossi Gandelsman · Inbar Mosseri · Michael Rubinstein · Alexei Efros

DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation

Jiaxiang Tang · Jiawei Ren · Hang Zhou · Ziwei Liu · Gang Zeng

Modelling complex vector drawings with stroke-clouds

Alexander Ashcroft · Ayan Das · Yulia Gryaditskaya · Zhiyu Qu · Yi-Zhe Song

Multimarginal Generative Modeling with Stochastic Interpolants

Michael Albergo · Nicholas Boffi · Michael Lindsey · Eric Vanden-Eijnden

The Blessing of Randomness: SDE Beats ODE in General Diffusion-based Image Editing

Shen Nie · Hanzhong Guo · Cheng Lu · Yuhao Zhou · Chenyu Zheng · Chongxuan Li

Idempotence and Perceptual Image Compression

Tongda Xu · Ziran Zhu · Dailan He · Yanghao Li · Lina Guo · Yuanyuan Wang · Zhe Wang · Hongwei Qin · Yan Wang · Jingjing Liu · Ya-Qin Zhang

Continuous-Multiple Image Outpainting in One-Step via Positional Query and A Diffusion-based Approach

Shaofeng Zhang · Jinfa Huang · Qiang Zhou · zhibin wang · Fan Wang · Jiebo Luo · Junchi Yan

Jointly Training Large Autoregressive Multimodal Models

Emanuele Aiello · Lili Yu · Yixin Nie · Armen Aghajanyan · Barlas Oguz

Gradual Optimization Learning for Conformational Energy Minimization

Artem Tsypin · Leonid A. Ugadiarov · Kuzma Khrabrov · Alexander Telepov · Egor Rumiantsev · Alexey Skrynnik · Aleksandr Panov · Dmitry P. Vetrov · Elena Tutubalina · Artur Kadurin

Learning 3D Particle-based Simulators from RGB-D Videos

William Whitney · Tatiana Lopez-Guevara · Tobias Pfaff · Yulia Rubanova · Thomas Kipf · Kimberly Stachenfeld · Kelsey Allen

Bespoke Solvers for Generative Flow Models

Neta Shaul · Juan Perez · Ricky T. Q. Chen · Ali Thabet · Albert Pumarola · Yaron Lipman

Synergistic Patch Pruning for Vision Transformer: Unifying Intra- & Inter-Layer Patch Importance

Yuyao Zhang · Lan Wei · Nikolaos Freris

Information Retention via Learning Supplemental Features

Zhipeng Xie · Yahe Li

Mean Field Theory in Deep Metric Learning

Takuya Furusawa

Neuro-Inspired Information-Theoretic Hierarchical Perception for Multimodal Learning

Xiongye Xiao · Gengshuo Liu · Gaurav Gupta · Defu Cao · Shixuan Li · Yaxing Li · Tianqing Fang · Mingxi Cheng · Paul Bogdan

Repeated Random Sampling for Minimizing the Time-to-Accuracy of Learning

Patrik Okanovic · Roger Waleffe · Vasilis Mageirakos · Konstantinos Nikolakakis · Amin Karbasi · Dionysios Kalogerias · Nezihe Merve Gürel · Theodoros Rekatsinas

Turning large language models into cognitive models

Marcel Binz · Eric Schulz

Neuroformer: Multimodal and Multitask Generative Pretraining for Brain Data

Antonis Antoniades · Yiyi Yu · Joe Canzano · William Wang · Spencer Smith

Deep Geodesic Canonical Correlation Analysis for Covariance-Based Neuroimaging Data

Ce Ju · Reinmar Kobler · Liyao Tang · Cuntai Guan · Motoaki Kawanabe

Rigid Protein-Protein Docking via Equivariant Elliptic-Paraboloid Interface Prediction

Ziyang Yu · Wenbing Huang · Yang Liu

Predictive, scalable and interpretable knowledge tracing on structured domains

Hanqi Zhou · Robert Bamler · Charley Wu · Álvaro Tejero-Cantero

InterpGNN: Understand and Improve Generalization Ability of Transdutive GNNs through the Lens of Interplay between Train and Test Nodes

Jiawei Sun · Kailai Li · Ruoxin Chen · Jie LI · Chentao Wu · Yue Ding · Junchi Yan

PromptAgent: Strategic Planning with Language Models Enables Expert-level Prompt Optimization

Xinyuan Wang · Chenxi Li · Zhen Wang · Fan Bai · Haotian Luo · Jiayou Zhang · Nebojsa Jojic · Eric Xing · Zhiting Hu

Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding

Zilong Wang · Hao Zhang · Chun-Liang Li · Julian M Eisenschlos · Vincent Perot · Zifeng Wang · Lesly Miculicich · Yasuhisa Fujii · Jingbo Shang · Chen-Yu Lee · Tomas Pfister

OWL: A Large Language Model for IT Operations

Hongcheng Guo · Jian Yang · Jiaheng Liu · Liqun Yang · Linzheng Chai · Jiaqi Bai · Junran Peng · Xiaorong Hu · Chao Chen · Dongfeng Zhang · xu Shi · Tieqiao Zheng · liangfan zheng · Bo Zhang · Ke Xu · Zhoujun Li

Conversational Drug Editing Using Retrieval and Domain Feedback

Shengchao Liu · Jiongxiao Wang · Yijin Yang · Chengpeng Wang · Ling Liu · Hongyu Guo · Chaowei Xiao

A Multi-Level Framework for Accelerating Training Transformer Models

Longwei Zou · Han Zhang · Yangdong Deng

LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset

Lianmin Zheng · Wei-Lin Chiang · Ying Sheng · Tianle Li · Siyuan Zhuang · Zhanghao Wu · Yonghao Zhuang · Zhuohan Li · Zi Lin · Eric Xing · Joseph E Gonzalez · Ion Stoica · Hao Zhang

Pushing Mixture of Experts to the Limit: Extremely Parameter Efficient MoE for Instruction Tuning

Ted Zadouri · Ahmet Üstün · Arash Ahmadian · Beyza Ermis · Acyr Locatelli · Sara Hooker

Bayesian Low-rank Adaptation for Large Language Models

Adam Yang · Maxime Robeyns · Xi Wang · Laurence Aitchison

Instant3D: Fast Text-to-3D with Sparse-view Generation and Large Reconstruction Model

Jiahao Li · Hao Tan · Kai Zhang · Zexiang Xu · Fujun Luan · Yinghao Xu · Yicong Hong · Kalyan Sunkavalli · Greg Shakhnarovich · Sai Bi

In-Context Learning through the Bayesian Prism

Madhur Panwar · Kabir Ahuja · Navin Goyal

Towards Robust Multi-Modal Reasoning via Model Selection

Xiangyan Liu · Rongxue LI · Wei Ji · Tao Lin

Batch Calibration: Rethinking Calibration for In-Context Learning and Prompt Engineering

Han Zhou · Xingchen Wan · Lev Proleev · Diana Mincu · Jilin Chen · Katherine Heller · Subhrajit Roy

Sum-Product-Set Networks: Deep Tractable Models for Tree-Structured Graphs

Milan Papez · Martin Rektoris · Vaclav Smidl · Tomáš Pevný

Knowledge Card: Filling LLMs' Knowledge Gaps with Plug-in Specialized Language Models

Shangbin Feng · Weijia Shi · Yuyang Bai · Vidhisha Balachandran · Tianxing He · Yulia Tsvetkov

Few-Shot Detection of Machine-Generated Text using Style Representations

Rafael Rivera Soto · Kailin Koch · Aleem Khan · Barry Chen · Marcus Bishop · Nicholas Andrews

Stable Anisotropic Regularization

William Rudman · Carsten Eickhoff

GAIA: a benchmark for General AI Assistants

Grégoire Mialon · Clémentine Fourrier · Thomas Wolf · Yann LeCun · Thomas Scialom

Seeking Neural Nuggets: Knowledge Transfer in Large Language Models from a Parametric Perspective

Ming Zhong · Chenxin An · Weizhu Chen · Jiawei Han · Pengcheng He

LLM-Assisted Code Cleaning For Training Accurate Code Generators

Naman Jain · Tianjun Zhang · Wei-Lin Chiang · Joseph E Gonzalez · Koushik Sen · Ion Stoica

The Devil is in the Object Boundary: Towards Annotation-free Instance Segmentation using Foundation Models

cheng shi · Sibei Yang

RepoBench: Benchmarking Repository-Level Code Auto-Completion Systems

Tianyang Liu · Canwen Xu · Julian McAuley

Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE

Zeren Chen · ziqin wang · zhen wang · Huayang Liu · Zhenfei Yin · Si Liu · Lu Sheng · Wanli Ouyang · Jing Shao

Large Language Models Are Not Robust Multiple Choice Selectors

Chujie Zheng · Hao Zhou · Fandong Meng · Jie Zhou · Minlie Huang

Let's Verify Step by Step

Hunter Lightman · Vineet Kosaraju · Yuri Burda · Harrison Edwards · Bowen Baker · Teddy Lee · Jan Leike · John Schulman · Ilya Sutskever · Karl Cobbe

Is Self-Repair a Silver Bullet for Code Generation?

Theo X. Olausson · Jeevana Priya Inala · Chenglong Wang · Jianfeng Gao · Armando Solar-Lezama

Detecting Pretraining Data from Large Language Models

Weijia Shi · Anirudh Ajith · Mengzhou Xia · Yangsibo Huang · Daogao Liu · Terra Blevins · Danqi Chen · Luke Zettlemoyer

PerceptionCLIP: Visual Classification by Inferring and Conditioning on Contexts

Bang An · Sicheng Zhu · Michael-Andrei Panaitescu-Liess · Chaithanya Kumar Mummadi · Furong Huang

INViTE: INterpret and Control Vision-Language Models with Text Explanations

Haozhe Chen · Junfeng Yang · Carl Vondrick · Chengzhi Mao

Dynamic Neural Response Tuning

Tian Qiu · Xu Wenxiang · lin chen · Zhou Linyun · Zunlei Feng · Mingli Song

Unconstrained Stochastic CCA: Unifying Multiview and Self-Supervised Learning

James Chapman · Lennie Wells · Ana Lawry Aguila

Go to Event Page

Affinity Workshop

Blog Track Session 7

David Dobre · Leo Schwinn · Claire Vernade · Charlie Gauthier · Fabian Pedregosa · Gauthier Gidel

10:45 AM - 12:45 PM

Affinity Workshop

Tiny Papers Poster Session 7

Krystal Maughan · Thomas F Burns

10:45 AM - 12:45 PM

12:45 PM - 1:30 PM

Alexander "Sasha" Rush is an Associate Professor at Cornell Tech and a researcher at Hugging Face. His research interest is in the study of language models with applications in controllable text generation, efficient inference, and applications in summarization and information extraction. In addition to research, he has written several popular open-source software projects supporting NLP research, programming for deep learning, and virtual academic conferences. His projects have received paper and demo awards at major NLP, ML, visualization, and hardware conferences, an NSF Career Award, and a Sloan Fellowship.

... more

Mentorship

Moritz Hardt

12:45 PM - 1:30 PM

Moritz Hardt is a director at the Max Planck Institute for Intelligent Systems. Prior to joining the institute, he was Associate Professor for Electrical Engineering and Computer Sciences at the University of California, Berkeley. His research contributes to the scientific foundations of machine learning and algorithmic decision making with a focus on social questions.

... more

Mentorship

Hanwang Zhang

12:45 PM - 1:30 PM

Hanwang Zhang is currently Associate Professor at School of Computer Science and Engineering, NTU. He joined in NTU as Nanyang Assistant Professor in 2018. He was a research scientist (postdoc) at Columbia University in 2017-2018, and a senior research fellow at NUS in 2014-2016. He received a Ph.D. from NUS in 2014 and a B.Eng from Zhejiang University, China in 2009, both in Computer Science. His research interests include Computer Vision, Natural Language Processing, Causal Inference, and their combinations. Due to his contribution in applied causality, he has received numerous awards including the Singapore President Award Young Scientist 2021, IEEE AI’s-10-To-Watch 2020, Alibaba Innovative Research Award 2019, Nanyang Assistant Professorship 2018, and several best paper awards.

... more

Affinity Workshop

Kyunghyun Cho

2:15 PM - 3:10 PM

Together with two other co-founders, Rich Bonneau and Vlad Gligorijevic, I founded Prescient Design in January 2021, in order to build a lab-in-the-loop protein design platform based on our earlier research. Prescient Design was fully acquired by Genentech (Roche) on August 2021, and began to focus more specifically on antibody design. It has been more than three years since its founding and more than 2.5 years since the acquisition. In this talk, I will share Prescient Design's lab-in-the-loop antibody design, both the platform and the outcome, as well as what went behind in building this platform from the perspective of machine learning.

... more

Speaker Bio

LEGO-Prover: Neural Theorem Proving with Growing Libraries

Haiming Wang · Huajian Xin · Chuanyang Zheng · Zhengying Liu · Qingxing Cao · Yinya Huang · Jing Xiong · Han Shi · Enze Xie · Jian Yin · Zhenguo Li · Xiaodan Liang

Go to Event Page

Poster

Policy Rehearsing: Training Generalizable Policies for Reinforcement Learning

Chengxing Jia · Chen-Xiao Gao · Hao Yin · Fuxiang Zhang · XiongHui Chen · Tian Xu · Lei Yuan · Zongzhang Zhang · Zhi-Hua Zhou · Yang Yu

4:30 PM - 6:30 PM

Human beings can make adaptive decisions in a preparatory manner, i.e., by making preparations in advance, which offers significant advantages in scenarios where both online and offline experiences are expensive and limited. Meanwhile, current reinforcement learning methods commonly rely on numerous environment interactions but hardly obtain generalizable policies. In this paper, we introduce the idea of \textit{rehearsal} into policy optimization, where the agent plans for all possible outcomes in mind and acts adaptively according to actual responses from the environment. To effectively rehearse, we propose ReDM, an algorithm that generates a diverse and eligible set of dynamics models and then rehearse the policy via adaptive training on the generated model set. Rehearsal enables the policy to make decision plans for various hypothetical dynamics and to naturally generalize to previously unseen environments. Our experimental results demonstrate that ReDM is capable of learning a valid policy solely through rehearsal, even with \emph{zero} interaction data. We further extend ReDM to scenarios where limited or mismatched interaction data is available, and our experimental results reveal that ReDM produces high-performing policies compared to other offline RL baselines.

... more

Affinity Workshop

Tiny Papers Poster Session 8

Krystal Maughan · Thomas F Burns

4:30 PM - 6:30 PM

Poster

Poster Session 8

4:30 PM - 6:30 PM

237 Events in this session

Transferring Labels to Solve Annotation Mismatches Across Object Detection Datasets

Yuan-Hong Liao · David Acuna · Rafid Mahmood · James Lucas · Viraj Prabhu · Sanja Fidler

Real-Fake: Effective Training Data Synthesis Through Distribution Matching

Jianhao Yuan · Jie Zhang · Shuyang Sun · Philip Torr · Bo ZHAO

Understanding the robustness difference between stochastic gradient descent and adaptive gradient methods

Avery Ma · Yangchen Pan · Amir-massoud Farahmand

Uncertainty Quantification via Stable Distribution Propagation

Felix Petersen · Aashwin Mishra · Hilde Kuehne · Christian Borgelt · Oliver Deussen · Mikhail Yurochkin

DAFA: Distance-Aware Fair Adversarial Training

Hyungyu Lee · Saehyung Lee · Hyemi Jang · Junsung Park · Ho Bae · Sungroh Yoon

The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing

Blaise Delattre · Alexandre Araujo · Quentin Barthélemy · Alexandre Allauzen

Unraveling the Key Components of OOD Generalization via Diversification

Harold Benoit · Liangze Jiang · Andrei Atanov · Oguzhan Kar · Mattia Rigotti · Amir Zamir

Discovering Temporally-Aware Reinforcement Learning Algorithms

Matthew T Jackson · Chris Lu · Louis Kirsch · Robert Lange · Shimon Whiteson · Jakob Foerster

The Curse of Diversity in Ensemble-Based Exploration

Zhixuan Lin · Pierluca D'Oro · Evgenii Nikishin · Aaron Courville

When should we prefer Decision Transformers for Offline Reinforcement Learning?

Prajjwal Bhargava · Rohan Chitnis · Alborz Geramifard · Shagun Sodhani · Amy Zhang

Retrieval-Guided Reinforcement Learning for Boolean Circuit Minimization

Animesh Basak Chowdhury · Marco Romanelli · Benjamin Tan · Ramesh Karri · Siddharth Garg

Can Transformers Capture Spatial Relations between Objects?

Chuan Wen · Dinesh Jayaraman · Yang Gao

S$2$AC: Energy-Based Reinforcement Learning with Stein Soft Actor Critic

Safa Messaoud · Billel Mokeddem · Zhenghai Xue · Linsey Pang · Bo An · Haipeng Chen · Sanjay Chawla

Selective Visual Representations Improve Convergence and Generalization for Embodied AI

Ainaz Eftekhar · Kuo-Hao Zeng · Jiafei Duan · Ali Farhadi · Aniruddha Kembhavi · Ranjay Krishna

Multi-Task Reinforcement Learning with Mixture of Orthogonal Experts

Ahmed Hendawy · Jan Peters · Carlo D'Eramo

MAMBA: an Effective World Model Approach for Meta-Reinforcement Learning

Zohar Rimon · Tom Jurgenson · Orr Krupnik · Gilad Adler · Aviv Tamar

A Lightweight Method for Tackling Unknown Participation Statistics in Federated Averaging

Shiqiang Wang · Mingyue Ji

Adaptive Stochastic Gradient Algorithm for Black-box Multi-Objective Learning

Feiyang YE · YUEMING LYU · Xuehao Wang · Yu Zhang · Ivor Tsang

Adversarial Causal Bayesian Optimization

Scott Sussex · Pier Giuseppe Sessa · Anastasia Makarova · Andreas Krause

One Forward is Enough for Neural Network Training via Likelihood Ratio Method

Jinyang Jiang · Zeliang Zhang · Chenliang Xu · Zhaofei Yu · Yijie Peng

InfoBatch: Lossless Training Speed Up by Unbiased Dynamic Data Pruning

Ziheng Qin · Kai Wang · Zangwei Zheng · Jianyang Gu · Xiangyu Peng · Zhaopan Xu · Zhou Daquan · Lei Shang · Baigui Sun · Xuansong Xie · Yang You

Fast Equilibrium of SGD in Generic Situations

Zhiyuan Li · Yi Wang · Zhiren Wang

DiffusionSat: A Generative Foundation Model for Satellite Imagery

Samar Khanna · Patrick Liu · Linqi Zhou · Chenlin Meng · Robin Rombach · Marshall Burke · David Lobell · Stefano Ermon

Towards Imitation Learning to Branch for MIP: A Hybrid Reinforcement Learning based Sample Augmentation Approach

Changwen Zhang · wenli ouyang · Hao Yuan · Liming Gong · Yong Sun · Ziao Guo · Zhichen Dong · Junchi Yan

Generative Learning for Solving Non-Convex Problem with Multi-Valued Input-Solution Mapping

Enming Liang · Minghua Chen

Efficient Continual Finite-Sum Minimization

Ioannis Mavrothalassitis · Stratis Skoulakis · Leello Dadi · Volkan Cevher

Dropout Enhanced Bilevel Training

Peiran Yu · Junyi Li · Heng Huang

Graph Metanetworks for Processing Diverse Neural Architectures

Derek Lim · Haggai Maron · Marc T Law · Jonathan Lorraine · James Lucas

Is attention required for ICL? Exploring the Relationship Between Model Architecture and In-Context Learning Ability

Ivan Lee · Nan Jiang · Taylor Berg-Kirkpatrick

H2O-SDF: Two-phase Learning for 3D Indoor Reconstruction using Object Surface Fields

Minyoung Park · MIRAE DO · Yeon Jae Shin · Jaeseok Yoo · Jongkwang Hong · Joongrock Kim · Chul Lee

Towards Enhancing Time Series Contrastive Learning: A Dynamic Bad Pair Mining Approach

Xiang Lan · Hanshu Yan · Shenda Hong · Mengling Feng

Learning Hierarchical Polynomials with Three-Layer Neural Networks

Zihao Wang · Eshaan Nichani · Jason Lee

V-DETR: DETR with Vertex Relative Position Encoding for 3D Object Detection

Yichao Shen · Zigang Geng · YUHUI YUAN · Yutong Lin · Ze Liu · Chunyu Wang · Han Hu · Nanning Zheng · Baining Guo

LDReg: Local Dimensionality Regularized Self-Supervised Learning

Hanxun Huang · Ricardo Campello · Sarah Erfani · Xingjun Ma · Michael E. Houle · James Bailey

MCM: Masked Cell Modeling for Anomaly Detection in Tabular Data

Jiaxin Yin · Yuanyuan Qiao · Zitang Zhou · Xiangchao Wang · Jie Yang

AUC-CL: A Batchsize-Robust Framework for Self-Supervised Contrastive Representation Learning

Rohan Sharma · Kaiyi Ji · Zhiqiang Xu · Changyou Chen

On the Role of General Function Approximation in Offline Reinforcement Learning

Chenjie Mao · Qiaosheng Zhang · Zhen Wang · Xuelong Li

On the Role of Discrete Tokenization in Visual Representation Learning

Tianqi Du · Yifei Wang · Yisen Wang

Safe and Robust Watermark Injection with a Single OoD Image

Shuyang Yu · Junyuan Hong · Haobo Zhang · Haotao Wang · Zhangyang Wang · Jiayu Zhou

Rotation Has Two Sides: Evaluating Data Augmentation for Deep One-class Classification

Guodong Wang · Yunhong Wang · Xiuguo Bao · Di Huang

Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding

Yuanhao Xiong · Long Zhao · Boqing Gong · Ming-Hsuan Yang · Florian Schroff · Ting Liu · Cho-Jui Hsieh · Liangzhe Yuan

TiC-CLIP: Continual Training of CLIP Models

Saurabh Garg · Mehrdad Farajtabar · Hadi Pouransari · Raviteja Vemulapalli · Sachin Mehta · Oncel Tuzel · Vaishaal Shankar · Fartash Faghri

CoT3DRef: Chain-of-Thoughts Data-Efficient 3D Visual Grounding

eslam Abdelrahman · Mohamed Ayman Mohamed · Mahmoud Ahmed · Habib · Mohamed Elhoseiny

Scaling for Training Time and Post-hoc Out-of-distribution Detection Enhancement

Kai Xu · Rongyu Chen · Gianni Franchi · Angela Yao

Vision-Language Models are Zero-Shot Reward Models for Reinforcement Learning

Juan Rocamonde · Victoriano Montesinos · Elvis Nava · Ethan Perez · David Lindner

Reward-Free Curricula for Training Robust World Models

Marc Rigter · Minqi Jiang · Ingmar Posner

Entity-Centric Reinforcement Learning for Object Manipulation from Pixels

Dan Haramati · Tal Daniel · Aviv Tamar

Game-Theoretic Robust Reinforcement Learning Handles Temporally-Coupled Perturbations

Yongyuan Liang · Yanchao Sun · Ruijie Zheng · Xiangyu Liu · Benjamin Eysenbach · Tuomas Sandholm · Furong Huang · Stephen McAleer

Meta Inverse Constrained Reinforcement Learning: Convergence Guarantee and Generalization Analysis

Shicheng Liu · Minghui Zhu

Provable Benefits of Multi-task RL under Non-Markovian Decision Making Processes

Ruiquan Huang · Yuan Cheng · Jing Yang · Vincent Tan · Yingbin Liang

Robust Model Based Reinforcement Learning Using $\mathcal{L}_1$ Adaptive Control

Minjun Sung · Sambhu Harimanas Karumanchi · Aditya Gahlawat · Naira HOVAKIMYAN

Expected flow networks in stochastic environments and two-player zero-sum games

Marco Jiralerspong · Bilun Sun · Danilo Vucetic · Tianyu Zhang · Yoshua Bengio · Gauthier Gidel · Nikolay Malkin

MixSup: Mixed-grained Supervision for Label-efficient LiDAR-based 3D Object Detection

Yuxue Yang · Lue Fan · Zhaoxiang Zhang

Meta-VBO: Utilizing Prior Tasks in Optimizing Risk Measures with Gaussian Processes

Quoc Phong Nguyen · Bryan Kian Hsiang Low · Patrick Jaillet

Learning Large DAGs is Harder than you Think: Many Losses are Minimal for the Wrong DAG

Jonas Seng · Matej Zečević · Devendra Singh Dhami · Kristian Kersting

Variational Inference for SDEs Driven by Fractional Noise

Rembert Daems · Manfred Opper · Guillaume Crevecoeur · Tolga Birdal

Improved Active Learning via Dependent Leverage Score Sampling

Atsushi Shimizu · Xiaoou Cheng · Christopher Musco · Jonathan Weare

Provable Compositional Generalization for Object-Centric Learning

Thaddäus Wiedemer · Jack Brady · Alexander Panfilov · Attila Juhos · Matthias Bethge · Wieland Brendel

Koopman-based generalization bound: New aspect for full-rank weights

Yuka Hashimoto · Sho Sonoda · Isao Ishikawa · Atsushi Nitanda · Taiji Suzuki

Improved Regret Bounds for Non-Convex Online-Within-Online Meta Learning

Jiechao GUAN · Hui Xiong

Toward Optimal Policy Population Growth in Two-Player Zero-Sum Games

Stephen McAleer · John Banister Lanier · Kevin A. Wang · Pierre Baldi · Tuomas Sandholm · Roy Fox

Unraveling the Enigma of Double Descent: An In-depth Analysis through the Lens of Learned Feature Space

Yufei Gu · Xiaoqing Zheng · Tomaso Aste

Mask-Based Modeling for Neural Radiance Fields

Ganlin Yang · Guoqiang Wei · Zhizheng Zhang · Yan Lu · Dong Liu

Optimal Sample Complexity of Contrastive Learning

Noga Alon · Dmitrii Avdiukhin · Dor Elboim · Orr Fischer · Grigory Yaroslavtsev

Flat Minima in Linear Estimation and an Extended Gauss Markov Theorem

Simon Segert

Transformers as Decision Makers: Provable In-Context Reinforcement Learning via Supervised Pretraining

Licong Lin · Yu Bai · Song Mei

Bandits with Replenishable Knapsacks: the Best of both Worlds

Martino Bernasconi · Matteo Castiglioni · Andrea Celli · Federico Fusco

Symmetric Mean-field Langevin Dynamics for Distributional Minimax Problems

Juno Kim · Kakei Yamamoto · Kazusato Oko · Zhuoran Yang · Taiji Suzuki

STARC: A General Framework For Quantifying Differences Between Reward Functions

Joar Skalse · Lucy Farnik · Sumeet Motwani · Erik Jenner · Adam Gleave · Alessandro Abate

Mathematical Justification of Hard Negative Mining via Isometric Approximation Theorem

Albert Xu · Jhih-Yi Hsieh · Bhaskar Vundurthy · Nithya Kemp · Eliana Cohen · Lu Li · Howie Choset

Identifying Representations for Intervention Extrapolation

Sorawit (James) Saengkyongam · Elan Rosenfeld · Pradeep K Ravikumar · Niklas Pfister · Jonas Peters

A Neural Framework for Generalized Causal Sensitivity Analysis

Dennis Frauen · Fergus Imrie · Alicia Curth · Valentyn Melnychuk · Stefan Feuerriegel · Mihaela van der Schaar

FedImpro: Measuring and Improving Client Update in Federated Learning

Zhenheng Tang · Yonggang Zhang · Shaohuai Shi · Xinmei Tian · Tongliang Liu · Bo Han · Xiaowen Chu

Learning semilinear neural operators: A unified recursive framework for prediction and data assimilation.

Ashutosh Singh · Ricardo Borsoi · Deniz Erdogmus · Tales Imbiriba

Pooling Image Datasets with Multiple Covariate Shift and Imbalance

Sotirios Panagiotis Chytas · Vishnu Lokhande · Vikas Singh

Cauchy-Schwarz Divergence Information Bottleneck for Regression

Shujian Yu · Xi Yu · Sigurd Løkse · Robert Jenssen · Jose Principe

Asymptotically Free Sketched Ridge Ensembles: Risks, Cross-Validation, and Tuning

Pratik Patil · Daniel LeJeune

Consistent algorithms for multi-label classification with macro-at-$k$ metrics

Erik Schultheis · Wojciech Kotlowski · Marek Wydmuch · Rohit Babbar · Strom Borman · Krzysztof Dembczynski

Local Graph Clustering with Noisy Labels

Artur Back de Luca · Kimon Fountoulakis · Shenghao Yang

DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior

Jingxiang Sun · Bo Zhang · Ruizhi Shao · Lizhen Wang · Wen Liu · Zhenda Xie · Yebin Liu

A 2-Dimensional State Space Layer for Spatial Inductive Bias

Ethan Baron · Itamar Zimerman · Lior Wolf

OMNI: Open-endedness via Models of human Notions of Interestingness

Jenny Zhang · Joel Lehman · Kenneth Stanley · Jeff Clune

Removing Biases from Molecular Representations via Information Maximization

Chenyu Wang · Sharut Gupta · Caroline Uhler · Tommi Jaakkola

Generating Images with 3D Annotations Using Diffusion Models

Wufei Ma · Qihao Liu · Jiahao Wang · Angtian Wang · Xiaoding Yuan · Yi Zhang · Zihao Xiao · Guofeng Zhang · Beijia Lu · Ruxiao Duan · Yongrui Qi · Adam Kortylewski · Yaoyao Liu · Alan Yuille

Towards Optimal Regret in Adversarial Linear MDPs with Bandit Feedback

Haolin Liu · Chen-Yu Wei · Julian Zimmert

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

Hong Liu · Zhiyuan Li · David Hall · Percy Liang · Tengyu Ma

LEGO-Prover: Neural Theorem Proving with Growing Libraries

Haiming Wang · Huajian Xin · Chuanyang Zheng · Zhengying Liu · Qingxing Cao · Yinya Huang · Jing Xiong · Han Shi · Enze Xie · Jian Yin · Zhenguo Li · Xiaodan Liang

Mastering Memory Tasks with World Models

Mohammad Reza Samsami · Artem Zholus · Janarthanan Rajendran · Sarath Chandar

Scalable Real-Time Recurrent Learning Using Columnar-Constructive Networks

Khurram Javed · Haseeb Shah · Richard Sutton · Martha White

Safe Collaborative Filtering

Riku Togashi · Tatsushi Oka · Naoto Ohsaka · Tetsuro Morimura

Catastrophic Jailbreak of Open-source LLMs via Exploiting Generation

Yangsibo Huang · Samyak Gupta · Mengzhou Xia · Kai Li · Danqi Chen

Can LLM-Generated Misinformation Be Detected?

Canyu Chen · Kai Shu

Does Writing with Language Models Reduce Content Diversity?

Vishakh Padmakumar · He He

Composed Image Retrieval with Text Feedback via Multi-grained Uncertainty Regularization

Yiyang Chen · Zhedong Zheng · Wei Ji · Leigang Qu · Tat-Seng Chua

Towards Robust Fidelity for Evaluating Explainability of Graph Neural Networks

Xu Zheng · Farhad Shirani · Tianchun Wang · Wei Cheng · Zhuomin Chen · Haifeng Chen · Hua Wei · Dongsheng Luo

Piecewise Linear Parametrization of Policies: Towards Interpretable Deep Reinforcement Learning

Maxime Wabartha · Joelle Pineau

Towards Faithful XAI Evaluation via Generalization-Limited Backdoor Watermark

Mengxi Ya · Yiming Li · Tao Dai · Bin Wang · Yong Jiang · Shu-Tao Xia

Energy-Based Concept Bottleneck Models: Unifying Prediction, Concept Intervention, and Probabilistic Interpretations

Xinyue Xu · Yi Qin · Lu Mi · Hao Wang · Xiaomeng Li

Machine Unlearning for Image-to-Image Generative Models

Guihong Li · Hsiang Hsu · Chun-Fu Chen · Radu Marculescu

Adversarial Attacks on Fairness of Graph Neural Networks

Binchi Zhang · Yushun Dong · Chen Chen · Yada Zhu · Minnan Luo · Jundong Li

Backdoor Contrastive Learning via Bi-level Trigger Optimization

Weiyu Sun · Xinyu Zhang · Hao LU · YINGCONG CHEN · Ting Wang · Jinghui Chen · Lu Lin

ArchLock: Locking DNN Transferability at the Architecture Level with a Zero-Cost Binary Predictor

Tong Zhou · Shaolei Ren · Xiaolin Xu

Adversarial Feature Map Pruning for Backdoor

Dong HUANG · Qingwen Bu

Boundary Denoising for Video Activity Localization

Mengmeng Xu · Mattia Soldan · Jialin Gao · Shuming Liu · Juan-Manuel Perez-Rua · Bernard Ghanem

Interpreting Robustness Proofs of Deep Neural Networks

Debangshu Banerjee · Avaljot Singh · Gagandeep Singh

AutoDAN: Generating Stealthy Jailbreak Prompts on Aligned Large Language Models

Xiaogeng Liu · Nan Xu · Muhao Chen · Chaowei Xiao

ConjNorm: Tractable Density Estimation for Out-of-Distribution Detection

Bo Peng · Yadan Luo · Yonggang Zhang · Yixuan Li · Zhen Fang

Privacy Amplification for Matrix Mechanisms

Christopher Choquette-Choo · Arun Ganesh · Thomas Steinke · Abhradeep Guha Thakurta

Confidential-DPproof: Confidential Proof of Differentially Private Training

Ali Shahin Shamsabadi · Gefei Tan · Tudor Cebere · Aurélien Bellet · Hamed Haddadi · Nicolas Papernot · Xiao Wang · Adrian Weller

Detecting, Explaining, and Mitigating Memorization in Diffusion Models

Yuxin Wen · Yuchen Liu · Chen Chen · Lingjuan Lyu

Learning in reverse causal strategic environments with ramifications on two sided markets

Seamus Somerstep · Yuekai Sun · Yaacov Ritov

Fantastic Gains and Where to Find Them: On the Existence and Prospect of General Knowledge Transfer between Any Pretrained Model

Karsten Roth · Lukas Thede · A. Sophia Koepke · Oriol Vinyals · Olivier Henaff · Zeynep Akata

First-order ANIL provably learns representations despite overparametrisation

Oğuz Kaan Yüksel · Etienne Boursier · Nicolas Flammarion

AUGCAL: Improving Sim2Real Adaptation by Uncertainty Calibration on Augmented Synthetic Images

Prithvijit Chattopadhyay · Bharat Goyal · Boglarka Ecsedi · Viraj Prabhu · Judy Hoffman

Remote Sensing Vision-Language Foundation Models without Annotations via Ground Remote Alignment

Utkarsh Kumar Mall · Cheng Perng Phoo · Meilin Liu · Carl Vondrick · Bharath Hariharan · Kavita Bala

A Unified and General Framework for Continual Learning

Zhenyi Wang · Yan Li · Li Shen · Heng Huang

The LLM Surgeon

Tycho van der Ouderaa · Markus Nagel · Mart van Baalen · Tijmen Blankevoort

Parallelizing non-linear sequential models over the sequence length

Yi Heng Lim · Qi Zhu · Joshua Selfridge · Muhammad Firmansyah

Building Cooperative Embodied Agents Modularly with Large Language Models

Hongxin Zhang · Weihua Du · Jiaming Shan · Qinhong Zhou · Yilun Du · Joshua B Tenenbaum · Tianmin Shu · Chuang Gan

Multisize Dataset Condensation

Yang He · Lingao Xiao · Joey Tianyi Zhou · Ivor Tsang

PTaRL: Prototype-based Tabular Representation Learning via Space Calibration

Hangting Ye · Wei Fan · Xiaozhuang Song · Shun Zheng · He Zhao · Dandan Guo · Yi Chang

DreamFlow: High-quality text-to-3D generation by Approximating Probability Flow

Kyungmin Lee · Kihyuk Sohn · Jinwoo Shin

Improved algorithm and bounds for successive projection

Jiashun Jin · Tracy Ke · Gabriel Moryoussef · Jiajun Tang · Jingming Wang

Chain-of-Experts: When LLMs Meet Complex Operations Research Problems

Ziyang Xiao · Dongxiang Zhang · Yangjun Wu · Lilin Xu · Yuan Wang · Xiongwei Han · Xiaojin Fu · Tao Zhong · Jia Zeng · Mingli Song · Gang Chen

Particle Guidance: non-I.I.D. Diverse Sampling with Diffusion Models

Gabriele Corso · Yilun Xu · Valentin De Bortoli · Regina Barzilay · Tommi Jaakkola

Yet Another ICU Benchmark: A Flexible Multi-Center Framework for Clinical ML

Robin van de Water · Hendrik Schmidt · Paul Elbers · Patrick Thoral · Bert Arnrich · Patrick Rockenschaub

The False Promise of Imitating Proprietary Language Models

Arnav Gudibande · Eric Wallace · Charlie Snell · Xinyang Geng · Hao Liu · Pieter Abbeel · Sergey Levine · Dawn Song

Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with Complex Semantic Prompts

Xinhua Cheng · Tianyu Yang · Jianan Wang · Yu Li · Lei Zhang · Jian Zhang · Yuan Li

Improved statistical and computational complexity of the mean-field Langevin dynamics under structured data

Atsushi Nitanda · Kazusato Oko · Taiji Suzuki · Denny Wu

Less is More: One-shot Subgraph Reasoning on Large-scale Knowledge Graphs

Zhanke Zhou · Yongqi Zhang · Jiangchao Yao · Quanming Yao · Bo Han

Overthinking the Truth: Understanding how Language Models Process False Demonstrations

Danny Halawi · Jean-Stanislas Denain · Jacob Steinhardt

Plug-and-Play: An Efficient Post-training Pruning Method for Large Language Models

Yingtao Zhang · Haoli Bai · Haokun Lin · Jialin Zhao · LU HOU · Carlo Vittorio Cannistraci

How to Fine-Tune Vision Models with SGD

Ananya Kumar · Ruoqi Shen · Sebastien Bubeck · Suriya Gunasekar

INSIDE: LLMs' Internal States Retain the Power of Hallucination Detection

Chao Chen · Kai Liu · Ze Chen · Yi Gu · Yue Wu · Mingyuan Tao · Zhihang Fu · Jieping Ye

Large-scale Training of Foundation Models for Wearable Biosignals

Salar Abbaspourazad · Oussama Elachqar · Andrew Miller · Saba Emrani · Udhyakumar Nallasamy · Ian Shapiro

A Topological Perspective on Demystifying GNN-Based Link Prediction Performance

Yu Wang · Tong Zhao · Yuying Zhao · Yunchao Liu · Xueqi Cheng · Neil Shah · Tyler Derr

Generalized Policy Iteration using Tensor Approximation for Hybrid Control

Suhan Shetty · Teng Xue · Sylvain Calinon

UniAdapter: Unified Parameter-Efficient Transfer Learning for Cross-modal Modeling

Haoyu Lu · Yuqi Huo · Guoxing Yang · Zhiwu Lu · Wei Zhan · Masayoshi Tomizuka · Mingyu Ding

Unveiling the Pitfalls of Knowledge Editing for Large Language Models

Zhoubo Li · Ningyu Zhang · Yunzhi Yao · Mengru Wang · Xi Chen · Huajun Chen

AuG-KD: Anchor-Based Mixup Generation for Out-of-Domain Knowledge Distillation

Zihao Tang · Zheqi Lv · Shengyu Zhang · Yifan Zhou · Xinyu Duan · Fei Wu · Kun Kuang

Language Model Beats Diffusion - Tokenizer is key to visual generation

Lijun Yu · José Lezama · Nitesh Bharadwaj Gundavarapu · Luca Versari · Kihyuk Sohn · David Minnen · Yong Cheng · Agrim Gupta · Xiuye Gu · Alexander G Hauptmann · Boqing Gong · Ming-Hsuan Yang · Irfan Essa · David Ross · Lu Jiang

How Do Transformers Learn In-Context Beyond Simple Functions? A Case Study on Learning with Representations

Tianyu Guo · Wei Hu · Song Mei · Huan Wang · Caiming Xiong · Silvio Savarese · Yu Bai

Jointly-Learned Exit and Inference for a Dynamic Neural Network

Florence Regol · Joud Chataoui · Mark Coates

COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically for Model-Based RL

Xiyao Wang · Ruijie Zheng · Yanchao Sun · Ruonan Jia · Wichayaporn Wongkamjan · Huazhe Xu · Furong Huang

C-TPT: Calibrated Test-Time Prompt Tuning for Vision-Language Models via Text Feature Dispersion

Hee Suk Yoon · Eunseop Yoon · Joshua Tian Jin Tee · Mark Hasegawa-Johnson · Yingzhen Li · Chang Yoo

MetaPhysiCa: Improving OOD Robustness in Physics-informed Machine Learning

S Chandra Mouli · Muhammad Alam · Bruno Ribeiro

Simple Hierarchical Planning with Diffusion

Chang Chen · Fei Deng · Kenji Kawaguchi · Caglar Gulcehre · Sungjin Ahn

Large Language Models as Automated Aligners for benchmarking Vision-Language Models

Yuanfeng Ji · Chongjian GE · Weikai Kong · Enze Xie · Zhengying Liu · Zhenguo Li · Ping Luo

Deep Neural Networks Tend To Extrapolate Predictably

Katie Kang · Amrith Setlur · Claire Tomlin · Sergey Levine

Policy Rehearsing: Training Generalizable Policies for Reinforcement Learning

Chengxing Jia · Chen-Xiao Gao · Hao Yin · Fuxiang Zhang · XiongHui Chen · Tian Xu · Lei Yuan · Zongzhang Zhang · Zhi-Hua Zhou · Yang Yu

Leveraging Uncertainty Estimates To Improve Classifier Performance

Gundeep Arora · Srujana Merugu · Anoop Saladi · Rajeev Rastogi

LoTa-Bench: Benchmarking Language-oriented Task Planners for Embodied Agents

Jae-Woo Choi · Youngwoo Yoon · Youngwoo Yoon · Hyobin Ong · Jaehong Kim · Minsu Jang

Unleashing Large-Scale Video Generative Pre-training for Visual Robot Manipulation

Hongtao Wu · Ya Jing · Chilam Cheang · Guangzeng Chen · Jiafeng Xu · Xinghang Li · Minghuan Liu · Hang Li · Tao Kong

Memory-Consistent Neural Networks for Imitation Learning

Kaustubh Sridhar · Souradeep Dutta · Dinesh Jayaraman · James Weimer · Insup Lee

Enhancing Neural Subset Selection: Integrating Background Information into Set Representations

Binghui Xie · Yatao Bian · Kaiwen Zhou · Yongqiang Chen · Peilin Zhao · Bo Han · Wei Meng · James Cheng

PolyVoice: Language Models for Speech to Speech Translation

Qianqian Dong · Zhiying Huang · Qiao Tian · Chen Xu · Tom Ko · yunlong zhao · Siyuan Feng · Tang Li · Kexin Wang · Xuxin Cheng · Fengpeng Yue · Ye Bai · Xi Chen · Lu Lu · Zejun MA · Yuping Wang · Mingxuan Wang · Yuxuan Wang

Inherently Interpretable Time Series Classification via Multiple Instance Learning

Joseph Early · Gavin Cheung · Kurt Cutajar · Hanting Xie · Jas Kandola · Niall Twomey

Language Model Inversion

John X. Morris · Wenting Zhao · Justin Chiu · Vitaly Shmatikov · Alexander Rush

End-to-End (Instance)-Image Goal Navigation through Correspondence as an Emergent Phenomenon

Guillaume Bono · Leonid Antsfeld · Boris Chidlovskii · Philippe Weinzaepfel · Christian Wolf

Large Language Models as Tool Makers

Tianle Cai · Xuezhi Wang · Tengyu Ma · Xinyun Chen · Denny Zhou

Neural Contractive Dynamical Systems

Hadi Beik Mohammadi · Søren Hauberg · Georgios Arvanitidis · Nadia Figueroa · Gerhard Neumann · Leonel Rozo

Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy Optimization

Kun LEI · Zhengmao He · Chenhao Lu · Kaizhe Hu · Yang Gao · Huazhe Xu

Conditional Information Bottleneck Approach for Time Series Imputation

MinGyu Choi · Changhee Lee

TEST: Text Prototype Aligned Embedding to Activate LLM's Ability for Time Series

Chenxi Sun · Hongyan Li · Yaliang Li · Shenda Hong

SaProt: Protein Language Modeling with Structure-aware Vocabulary

Jin Su · Chenchen Han · Yuyang Zhou · Junjie Shan · Xibin Zhou · Fajie Yuan

BEND: Benchmarking DNA Language Models on Biologically Meaningful Tasks

Frederikke Marin · Felix Teufel · Marc Horlacher · Dennis Madsen · Dennis Pultz · Ole Winther · Wouter Boomsma

Vision-Language Foundation Models as Effective Robot Imitators

Xinghang Li · Minghuan Liu · Hanbo Zhang · Cunjun Yu · Jie Xu · Hongtao Wu · Chilam Cheang · Ya Jing · Weinan Zhang · Huaping Liu · Hang Li · Tao Kong

A Graph is Worth 1-bit Spikes: When Graph Contrastive Learning Meets Spiking Neural Networks

Jintang Li · Huizhe Zhang · Ruofan Wu · Zulun Zhu · Baokun Wang · Changhua Meng · Zibin Zheng · Liang Chen

DREAM: Dual Structured Exploration with Mixup for Open-set Graph Domain Adaption

Nan Yin · Mengzhu Wang · Mengzhu Wang · Zhenghan Chen · Li Shen · Huan Xiong · Bin Gu · Xiao Luo

Understanding Expressivity of GNN in Rule Learning

Haiquan Qiu · Yongqi Zhang · Yong Li · Quanming Yao

Efficient and Scalable Graph Generation through Iterative Local Expansion

Andreas Bergmeister · Karolis Martinkus · Nathanaël Perraudin · Roger Wattenhofer

Energy-conserving equivariant GNN for elasticity of lattice architected metamaterials

Ivan Grega · Ilyes Batatia · Gábor Csányi · Sri Karlapati · Vikram Deshpande

Likelihood Training of Cascaded Diffusion Models via Hierarchical Volume-preserving Maps

Henry Li · Ronen Basri · Yuval Kluger

Universal Guidance for Diffusion Models

Arpit Bansal · Hong-Min Chu · Avi Schwarzschild · Roni Sengupta · Micah Goldblum · Jonas Geiping · Tom Goldstein

Manifold Preserving Guided Diffusion

Yutong He · Naoki Murata · Chieh-Hsin Lai · Yuhta Takida · Toshimitsu Uesaka · Dongjun Kim · WeiHsiang Liao · Yuki Mitsufuji · J Kolter · Ruslan Salakhutdinov · Stefano Ermon

Lifting Architectural Constraints of Injective Flows

Peter Sorrenson · Felix Draxler · Armand Rousselot · Sander Hummerich · Lea Zimmermann · Ullrich Koethe

Generative Human Motion Stylization in Latent Space

chuan guo · Yuxuan Mu · Xinxin Zuo · Peng Dai · Youliang Yan · Juwei Lu · Li Cheng

Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition

Sihyun Yu · Weili Nie · De-An Huang · Boyi Li · Jinwoo Shin · anima anandkumar

Latent 3D Graph Diffusion

Yuning You · Ruida Zhou · Jiwoong Park · Haotian Xu · Chao Tian · Zhangyang Wang · Yang Shen

The Unlocking Spell on Base LLMs: Rethinking Alignment via In-Context Learning

Bill Yuchen Lin · Abhilasha Ravichander · Ximing Lu · Nouha Dziri · Melanie Sclar · Khyathi Chandu · Chandra Bhagavatula · Yejin Choi

Localizing and Editing Knowledge In Text-to-Image Generative Models

Samyadeep Basu · Nanxuan Zhao · Vlad Morariu · Soheil Feizi · Varun Manjunatha

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

Suttisak Wisadwongsa · Worameth Chinchuthakun · Pramook Khungurn · Amit Raj · Supasorn Suwajanakorn

Str2Str: A Score-based Framework for Zero-shot Protein Conformation Sampling

Jiarui Lu · Bozitao Zhong · Zuobai Zhang · Jian Tang

DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image Generation

Hong Chen · Yipeng Zhang · Simin Wu · Xin Wang · Xuguang Duan · Yuwei Zhou · Wenwu Zhu

Ito Diffusion Approximation of Universal Ito Chains for Sampling, Optimization and Boosting

Aleksei Ustimenko · Aleksandr Beznosikov

Mixed-Type Tabular Data Synthesis with Score-based Diffusion in Latent Space

Hengrui Zhang · Jiani Zhang · Zhengyuan Shen · Balasubramaniam Srinivasan · Xiao Qin · Christos Faloutsos · Huzefa Rangwala · George Karypis

DORSal: Diffusion for Object-centric Representations of Scenes $\textit{et al.}$

Allan Jabri · Sjoerd van Steenkiste · Emiel Hoogeboom · Mehdi S. M. Sajjadi · Thomas Kipf

A Simple Romance Between Multi-Exit Vision Transformer and Token Reduction

Dongyang Liu · Meina Kan · Shiguang Shan · Xilin CHEN

Simplifying Transformer Blocks

Bobby He · Thomas Hofmann

The Unreasonable Effectiveness of Linear Prediction as a Perceptual Metric

Daniel Severo · Lucas Theis · Johannes Ballé

ASMR: Activation-Sharing Multi-Resolution Coordinate Networks for Efficient Inference

Jason Chun Lok Li · Steven Luo · Le Xu · Ngai Wong

Guaranteed Approximation Bounds for Mixed-Precision Neural Operators

Renbo Tu · Colin White · Jean Kossaifi · Boris Bonev · Gennady Pekhimenko · Kamyar Azizzadenesheli · anima anandkumar

Boosting Vanilla Lightweight Vision Transformers via Re-parameterization

Zhentao Tan · Xiaodan Li · Yue Wu · Qi Chu · Le Lu · Nenghai Yu · Jieping Ye

LRR: Language-Driven Resamplable Continuous Representation against Adversarial Tracking Attacks

Jianlang Chen · Xuhong Ren · Qing Guo · Felix Juefei-Xu · Di Lin · Wei Feng · Lei Ma · Jianjun Zhao

ImplicitSLIM and How it Improves Embedding-based Collaborative Filtering

Ilya Shenbin · Sergey Nikolenko

Traveling Waves Encode The Recent Past and Enhance Sequence Learning

T. Anderson Keller · Lyle Muller · Terrence Sejnowski · Max Welling

Estimating Shape Distances on Neural Representations with Limited Samples

Dean Pospisil · Brett Larsen · Sarah Harvey · Alex Williams

Decoding Natural Images from EEG for Object Recognition

Yonghao Song · Bingchuan Liu · Xiang Li · Nanlin Shi · Yijun Wang · Xiaorong Gao

A Cognitive Model for Learning Abstract Relational Structures from Memory-based Decision-Making Tasks

Haruo Hosoya

SetCSE: Set Operations using Contrastive Learning of Sentence Embeddings

Kang Liu

Tailoring Self-Rationalizers with Multi-Reward Distillation

Sahana Ramnath · Brihi Joshi · Skyler Hallinan · Ximing Lu · Liunian Li · Aaron Chan · Jack Hessel · Yejin Choi · Xiang Ren

CLaM-TTS: Improving Neural Codec Language Model for Zero-Shot Text-to-Speech

Jaehyeon Kim · Keon Lee · Seungjun Chung · Jaewoong Cho

Emergent Communication with Conversational Repair

Mitja Nikolaus

Sign2GPT: Leveraging Large Language Models for Gloss-Free Sign Language Translation

Ryan Wong · Necati Cihan Camgoz · Richard Bowden

Efficient Sharpness-Aware Minimization for Molecular Graph Transformer Models

Yili Wang · Kaixiong Zhou · Ninghao Liu · Ying Wang · Xin Wang

BooookScore: A systematic exploration of book-length summarization in the era of LLMs

Yapei Chang · Kyle Lo · Tanya Goyal · Mohit Iyyer

To the Cutoff... and Beyond? A Longitudinal Perspective on LLM Data Contamination

Manley Roberts · Himanshu Thakur · Christine Herlihy · Colin White · Samuel Dooley

CoRe-GD: A Hierarchical Framework for Scalable Graph Visualization with GNNs

Florian Grötschla · Joël Mathys · Róbert Veres · Roger Wattenhofer

Workflow Discovery from Dialogues in the Low Data Regime

David Vazquez · Stefania Raimondo · Christopher Pal · Pau Rodriguez · Amine El hattami · Issam Laradji

Self-Alignment with Instruction Backtranslation

Xian Li · Ping Yu · Chunting Zhou · Timo Schick · Omer Levy · Luke Zettlemoyer · Jason E Weston · Mike Lewis

BTR: Binary Token Representations for Efficient Retrieval Augmented Language Models

Qingqing Cao · Sewon Min · Yizhong Wang · Hannaneh Hajishirzi

On-Policy Distillation of Language Models: Learning from Self-Generated Mistakes

Rishabh Agarwal · Nino Vieillard · Yongchao Zhou · Piotr Stanczyk · Sabela Ramos Garea · Matthieu Geist · Olivier Bachem

Multiscale Positive-Unlabeled Detection of AI-Generated Texts

Yuchuan Tian · Hanting Chen · Xutao Wang · Zheyuan Bai · QINGHUA ZHANG · Ruifeng Li · Chao Xu · Yunhe Wang

OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models

Wenqi Shao · Mengzhao Chen · Zhaoyang Zhang · Peng Xu · Lirui Zhao · Zhiqian Li · Kaipeng Zhang · Gao Peng · Yu Qiao · Ping Luo

FLASK: Fine-grained Language Model Evaluation based on Alignment Skill Sets

Seonghyeon Ye · Doyoung Kim · Sungdong Kim · Hyeonbin Hwang · Seungone Kim · Yongrae Jo · James Thorne · Juho Kim · Minjoon Seo

Neural Optimal Transport with General Cost Functionals

Arip Asadulaev · Alexander Korotin · Vage Egiazarian · Petr Mokrov · Evgeny Burnaev

Identifying the Risks of LM Agents with an LM-Emulated Sandbox

Yangjun Ruan · Honghua Dong · Andrew Wang · Silviu Pitis · Yongchao Zhou · Jimmy Ba · Yann Dubois · Chris Maddison · Tatsunori Hashimoto

SKILL-MIX: a Flexible and Expandable Family of Evaluations for AI Models

Dingli Yu · Simran Kaur · Arushi Gupta · Jonah Brown-Cohen · Anirudh Goyal · Sanjeev Arora

Disentangling Time Series Representations via Contrastive Independence-of-Support on l-Variational Inference

Khalid OUBLAL · Said Ladjal · David Benhaiem · Emmanuel LE BORGNE · François Roueff

WizardCoder: Empowering Code Large Language Models with Evol-Instruct

Ziyang Luo · Can Xu · Pu Zhao · Qingfeng Sun · Xiubo Geng · Wenxiang Hu · Chongyang Tao · Jing Ma · Qingwei Lin · Daxin Jiang

Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources

Xingxuan Li · Ruochen Zhao · Yew Ken Chia · Bosheng Ding · Shafiq Joty · Soujanya Poria · Lidong Bing

Closing the Curious Case of Neural Text Degeneration

Matthew Finlayson · John Hewitt · Alexander Koller · Swabha Swayamdipta · Ashish Sabharwal

OctoPack: Instruction Tuning Code Large Language Models

Niklas Muennighoff · Qian Liu · Armel Zebaze · Qinkai Zheng · Binyuan Hui · Terry Yue Zhuo · Swayam Singh · Xiangru Tang · Leandro Von Werra · Shayne Longpre

BESA: Pruning Large Language Models with Blockwise Parameter-Efficient Sparsity Allocation

Peng Xu · Wenqi Shao · Mengzhao Chen · Shitao Tang · Kaipeng Zhang · Gao Peng · Fengwei An · Yu Qiao · Ping Luo

Functional Interpolation for Relative Positions improves Long Context Transformers

Shanda Li · Chong You · Guru Guruganesh · Joshua Ainslie · Santiago Ontanon · Manzil Zaheer · Sumit Sanghai · Yiming Yang · Sanjiv Kumar · Srinadh Bhojanapalli

Branch-GAN: Improving Text Generation with (not so) Large Language Models

Fredrik Carlsson · Johan Broberg · Erik Hillbom · Magnus Sahlgren · Joakim Nivre

M3C: A Framework towards Convergent, Flexible, and Unsupervised Learning of Mixture Graph Matching and Clustering

Jiaxin Lu · Zetian Jiang · Tianzhe Wang · Junchi Yan

Let Models Speak Ciphers: Multiagent Debate through Embeddings

Chau Pham · Boyi Liu · Yingxiang Yang · Zhengyu Chen · Tianyi Liu · Jianbo Yuan · Bryan Plummer · Zhaoran Wang · Hongxia Yang

RLCD: Reinforcement Learning from Contrastive Distillation for LM Alignment

Kevin Yang · Dan Klein · Asli Celikyilmaz · Nanyun (Violet) Peng · Yuandong Tian

Retrieval meets Long Context Large Language Models

Peng Xu · Wei Ping · Xianchao Wu · Lawrence McAfee · Chen Zhu · Zihan Liu · Sandeep Subramanian · Evelina Bakhturina · Mohammad Shoeybi · Bryan Catanzaro

Attention-based Iterative Decomposition for Tensor Product Representation

Taewon Park · inchul choi · Minho Lee

Differentiable Euler Characteristic Transforms for Shape Classification

Ernst Roell · Bastian Rieck

T-MARS: Improving Visual Representations by Circumventing Text Feature Learning

Pratyush Maini · Sachin Goyal · Zachary Lipton · J Kolter · Aditi Raghunathan

Approximately Piecewise E(3) Equivariant Point Networks

Matan Atzmon · Jiahui Huang · Francis Williams · Or Litany

State Representation Learning Using an Unbalanced Atlas

Li Meng · Morten Goodwin · Anis Yazidi · Paal Engelstad

Successor Heads: Recurring, Interpretable Attention Heads In The Wild

Rhys Gould · Euan Ong · George Ogden · Arthur Conmy

A Lie Group Approach to Riemannian Batch Normalization

Ziheng Chen · Yue Song · Yunmei Liu · Nicu Sebe

Go to Event Page

Affinity Workshop

Blog Track Session 8

David Dobre · Leo Schwinn · Claire Vernade · Charlie Gauthier · Fabian Pedregosa · Gauthier Gidel

4:30 PM - 6:30 PM