CVPR 2026收到逾1.6万篇AI技术论文创历史新高

网易专栏4小时前发布 nxnqh
1 0 0

🤖 AI总结

主题

CVPR 2026大会技术议程及投稿录用情况

摘要

CVPR 2026发布技术议程,投稿量创新高,热门方向聚焦图像合成与医学视觉,多篇获奖候选论文亮相。

关键信息

  • 1 CVPR 2026收到论文投稿16,092篇,增长24%,录用率约25%。
  • 2 热门研究方向包括图像合成、多模态学习、医学视觉等。
  • 3 部分获奖候选论文如NitroGen、R2Seg等被介绍。

CVPR 2026收到逾1.6万篇AI技术论文创历史新高

全球顶级人工智能与计算机视觉研究盛会——2026年计算机视觉与模式识别大会(CVPR)项目委员会,近日正式发布了本届大会技术议程的详细信息。

CVPR 2026由IEEE计算机学会(CS)与计算机视觉基金会(CVF)联合主办,本届大会共收到论文投稿16,092篇,较2025年增长24%,创历史新高。经过严格的同行评审流程,约四分之一的论文获得录用,共计4,089篇论文将在大会上进行展示。

“过去五年间,CVPR的投稿数量已翻倍有余,但录用率始终保持在较低水平,稳定维持在20%出头的区间,竞争极为激烈。”伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系副教授、CVPR 2026项目联席主席Alexander G. Schwing表示,”尽管AI需求推动了研究规模的持续扩张,CVPR依然是该领域最具选拔性和权威性的顶级学术活动之一。”

本届大会项目委员会收到投稿数量最多的研究方向,集中在图像与视频合成及生成、视觉、语言与推理、多模态学习、基于多视角与传感器的三维重建,以及医学与生物视觉和细胞显微镜学等领域。

此外,具身智能与智能体智能、计算成像、视觉安全等方向也取得了重要研究进展,将为后续研究提供有力支撑。以下为部分获奖候选论文:

NitroGen:通用游戏智能体的开放基础模型

由英伟达、斯坦福大学、加州理工学院、芝加哥大学及德克萨斯大学奥斯汀分校的研究人员联合提出。NitroGen是一个面向通用游戏智能体的视觉-动作基础模型,基于超过1000款游戏的4万小时游戏视频训练而成,在多个不同领域均展现出强大的综合能力。

基于扩散框架的真实感与高效散景渲染

来自深圳先进技术研究院、vivo BlueImage Lab及深圳技术大学的研究人员指出,现有移动设备受限于紧凑型光学设计(如小光圈),难以呈现自然、光学真实的散景效果。实验结果表明,所提方法能够高效生成真实感散景效果,尤其在真实低分辨率图像上表现突出,为未来技术发展奠定了基础。

针对微调扩散模型的黑盒成员推断攻击

弗吉尼亚大学两位研究人员的研究成果,提出了首个基于重建的成员推断攻击框架,专为扩散模型设计,适用于更严格的黑盒访问场景。该框架涵盖四种攻击场景与三类攻击方式,能够针对主流条件生成模型实施攻击,并实现较高精度。

R2Seg:基于解剖推理与统计拒绝的免训练OOD医学肿瘤分割

由卡内基梅隆大学、剑桥大学、浙江大学、苏黎世联邦理工学院及伊利诺伊大学厄巴纳-香槟分校的研究人员联合提出。R2Seg是一个免训练的鲁棒OOD肿瘤分割框架,通过两阶段”推理-拒绝”流程运行,在Dice系数、特异性和灵敏度等指标上均大幅超越强基线方法及原始基础模型。

“随着计算机视觉的基础概念渗透至更多新兴应用场景,我们观察到投稿研究与特定学科领域之间的关联性正在增强。”新加坡南洋理工大学计算与数据科学学院校长讲席教授、CVPR 2026项目联席主席吕健勤表示,”例如,医学与生物视觉及细胞显微镜学方向的研究重心今年显著提升,尽管目前尚处于起步阶段,但随着技术不断应对新挑战,我们预计这一领域及其他应用型计算机视觉方向将持续壮大。”

完整技术论文列表已收录于大会议程,论文摘要及详细信息将向所有注册参会者开放。

CVPR的技术议程年复一年地产出AI与计算机视觉领域引用量最高的论文,历届会议论文集在谷歌2025年学术指标中位列第二,超越了多本享有盛誉的科学期刊。此外,Research.com将CVPR评为计算机科学、图像处理与计算机视觉、机器学习与人工智能领域的顶级会议。

Q&A

Q1:CVPR 2026今年的投稿数量和录用率是多少?

A:CVPR 2026共收到论文投稿16,092篇,比2025年增长了24%,创历史新高。经过严格的同行评审,约四分之一的论文获得录用,最终共有4,089篇论文入选,录用率维持在20%出头的水平,竞争十分激烈。

Q2:CVPR 2026哪些研究方向投稿最多?

A:本届大会投稿数量最多的方向集中在图像与视频合成及生成、视觉语言与推理、多模态学习、基于多视角与传感器的三维重建,以及医学与生物视觉和细胞显微镜学等领域。此外,具身智能与智能体智能、计算成像、视觉安全等方向也备受关注。

Q3:NitroGen模型是什么,有什么特别之处?

A:NitroGen是由英伟达、斯坦福大学等机构联合提出的一个面向通用游戏智能体的视觉-动作基础模型。它基于超过1000款游戏的4万小时游戏视频进行训练,能够在多个不同游戏领域展现出强大的综合能力,是CVPR 2026的获奖候选论文之一。

© 版权声明

相关文章