Boomda: 多模态域适应的平衡多目标优化
论文信息
| 项目 | 内容 |
|---|---|
| 论文标题 | Boomda: Balanced Multi-objective Optimization for Multimodal Domain Adaptation |
| 发表会议 | AAAI 2026 (The Fortieth AAAI Conference on Artificial Intelligence) |
| 作者 | Jun Sun, Xinxin Zhang, Simin Hong, Jian Zhu, Xiang Gao |
| 机构 | Zhejiang Lab; Hangzhou Institute for Advanced Study, UCAS |
| 代码 | https://github.com/sunjunaimer/Boomda.git |
| 扩展版本 | arXiv:2511.08152 |
| 关键词 | 多模态学习、无监督域适应、信息瓶颈、多目标优化、相关对齐 |
讲义简介
本讲义面向研究生及高年级本科生,系统讲解 Boomda 这篇 AAAI 2026 论文的核心思想、方法细节、代码实现与实验验证。通过本讲义的学习,读者将能够:
- 理解异质多模态域适应(Heterogeneous Multimodal Domain Adaptation)的基本概念与挑战
- 掌握信息瓶颈(Information Bottleneck)理论在多模态表示学习中的应用
- 理解相关对齐(Correlation Alignment, Coral)在域适应中的作用
- 深入理解多目标优化(Multi-objective Optimization)及其在多模态平衡中的价值
- 通过代码解析掌握 Boomda 的实际实现细节
- 分析实验结果,理解模态平衡对多模态域适应性能的影响
导读问题
在阅读各章节之前,建议先思考以下问题:
- 为什么异质多模态域适应比同质多模态域适应更具挑战性?
- 信息瓶颈理论如何帮助学习各模态的最优表示?
- 将多模态对齐问题建模为多目标优化有何优势?
- 如何在不增加过多计算开销的前提下求得Pareto最优解?
建议阅读顺序:按照目录顺序逐章阅读,每章末尾设有本节小结,帮助巩固核心概念。