NeurIPS 2025 大会上,何恺明团队凭借《Faster R-CNN》荣获“时间检验奖”,同时何恺明发表了《视觉目标检测简史》的演讲。文章围绕此次演讲,系统梳理了视觉目标检测从 90 年代的人脸检测和特征工程,到深度学习时代 AlexNet、R-CNN 的出现,再到 Faster R-CNN 实现端到端实时检测的里程碑。随后,文章进一步介绍了 YOLO、SSD、Focal Loss、Mask R-CNN 等一系列后续优化技术,并展望了 Transformer(DETR)和视觉大模型(SAM)在目标检测领域的最新进展。整篇文章以时间线为主轴,详细阐述了每个阶段的关键技术突破及其对领域发展的深远影响,揭示了从“人设计特征”到“模型自主学习特征”再到“全局注意力机制”的趋势。