文章
文章详细描绘了 Anthropic CEO Dario Amodei 的传奇人生与 AI 理念。从其父亲因医学技术滞后离世的悲剧,到他在 AI 中寻求突破人类极限的执念,Amodei 的个人经历深刻影响了他对 AI 加速发展与安全问题的重视。文章回顾了他在百度和 OpenAI 的早期工作,特别是对“Scaling Law”的发现和 GPT-3 的贡献。随后,文章深入探讨了他因对 AI 安全和公司发展方向的分歧,带领团队从 OpenAI 出走并创立 Anthropic 的历程。Anthropic 凭借独特的企业级 AI 商业模式和 Claude 系列模型,实现了惊人的营收增长和高额融资,估值飙升至 1700 亿美元。文章也揭示了 Anthropic 在快速扩张中面临的成本、稳定性和行业竞争挑战,以及 Amodei 与黄仁勋、Sam Altman 等行业巨头的激烈交锋。整体而言,文章通过人物传记的形式,展现了 AI 行业最前沿的竞争格局、商业策略与技术伦理冲突。
文章基于 Menlo Ventures 年中报告,深入剖析了 2025 年 LLM 企业级市场的最新格局。报告指出,Anthropic 已凭借 32%的市场份额超越 OpenAI(25%)成为新领导者,谷歌位居第三。这一显著转变主要得益于代码生成成为 AI 的首个杀手级应用、带验证器的强化学习提升模型智能,以及将模型训练为使用工具的“智能体”等三大颠覆性行业趋势。报告同时揭示了 LLM 商业化的四大趋势:企业采纳开源技术趋势放缓、企业更换模型更看重性能而非价格、以及计算资源支出正从模型训练转向推理阶段。文章强调,LLM 市场已进入“应用为王”的新时代,ROI 成为衡量成功的关键。
文章详细介绍了上海 AI 实验室在 WAIC 2025 大会上发布的开源科学多模态大模型 Intern-S1。该模型被誉为“全能高手+科学明星”,不仅在多模态通用能力上比肩国内外一流模型,更在化学、材料、地球等多学科专业任务基准上超越了顶尖闭源模型 Grok-4,实现了科学能力的国际领先。Intern-S1 创新性地提出“多任务通专融合”新范式,通过架构优化和系统算法协同,大幅降低了强化学习训练成本。文章还强调了其配套的全链路开源工具体系,旨在降低大模型研发和应用门槛,助力重构科研生产力,并提供了具体应用案例。
文章详细介绍了由加利福尼亚大学圣迭戈分校和纽约大学研究人员联合推出并开源的 MIRIX 系统。该系统被誉为全球首个真正意义上的多模态、多智能体 AI 记忆系统,标志着 AI 进入大模型 3.0 时代,旨在解决当前大模型“短暂陪伴”和 RAG“现查现贴”的局限,实现 AI 的长期、多模态记忆。文章重点阐述了 MIRIX 独特的六大记忆模块(核心、情景、语义、程序、资源、知识金库)及其多智能体工作流、更新与检索对话流程。通过在 ScreenshotVQA 和 LOCOMO 基准测试中的出色表现,证明其在准确率和存储效率上远超现有 RAG 和长文本方法。更重要的是,MIRIX 团队同步推出了桌面端 APP,让用户能够直接体验并构建专属 AI 个人助理,将科研成果转化为实用产品,并强调所有记忆本地存储以保护用户隐私。
文章详细报道了 AI 教父 Geoffrey Hinton 首次访华期间,与上海人工智能实验室主任周伯文教授进行的一场 17 分钟尖峰对话。对话涵盖了多个前沿 AI 议题,包括 Hinton 首次公开表示当今多模态大模型已具“意识”的观点,以及如何以不同技术训练“聪明”与“善良”AI 的设想。两位科学家还探讨了 AI 主观体验的本质、AI 促进科学发展的路径,以及对年轻科研者的宝贵建议。周伯文教授在对话前介绍了上海人工智能实验室的“通专融合 AGI”路径及科学多模态大模型 Intern-S1。整篇文章以对话实录形式呈现,展现了两位顶尖科学家对 AI 未来的深刻洞察和前瞻思考,为读者提供了宝贵的行业前沿信息和思考启发。
文章详细介绍了香港科技大学团队提出的新型大语言模型(LLM)越狱攻击评估基准 GuidedBench。该基准旨在解决现有评估方法(如关键词检测和 LLM 法官)存在的误判和主观性问题。GuidedBench 包含一个高质量的有害问题数据集和创新的 GuidedEval 评估框架,通过为每个有害问题制定详细的“评分指南”(包含关键实体和行动),将评估从主观判断转变为客观的信息核对。实证结果显示,此前宣称高达 90%+成功率的越狱方法,在 GuidedBench 下攻击成功率均未超过 30%,纠正了对 AI 安全风险的认知偏差。文章强调了细粒度评估的重要性,并揭示了详细指令在某些情况下反而会提升攻击成功率的新发现,为未来 AI 安全研究提供了关键方向。
文章揭示了 Meta 为打造“超级智能”AI 实验室而投入巨资招聘顶尖 AI 人才的内幕,包括对清华校友、LoRA 合著者 Yuanzhi Li 等教授级研究员的重金挖角。同时,文章强调了 AI 行业对高质量数据的日益重视,指出 Meta、亚马逊贝索斯等正投资数据服务商,并高薪聘请物理学家、生物学家等领域专家担任 AI 的“老师”,以取代传统的低成本数据标注员。这一趋势标志着数据标注行业的产业升级,对 AI 模型推理能力提升至关重要,也预示着未来 AI 人才需求的结构性变化。
该文章详细介绍了上海交通大学研究团队在无人机自主导航领域的最新突破。传统无人机导航往往依赖高复杂度模块和昂贵设备,而该团队提出了一种融合无人机物理建模与深度学习的端到端方法。通过首次将可微分物理训练策略成功部署到实际机器人中,他们实现了一套真正意义上的“轻量、可部署、可协同”无人机集群端到端自主导航方案。该方案仅使用超低分辨率深度图作为输入,结合三层 CNN 的超小神经网络,可部署于 150 元廉价嵌入式计算平台。核心思想是抛弃复杂无人机动力学,利用极简质点动力学模型,通过可微物理引擎训练端到端网络,从而实现“训练一次,多机共享权重”的零通信协同飞行。实验证明,该方法在未知复杂环境中导航成功率高达 90%,单机飞行速度可达 20 米/秒,多机协同展现出极高鲁棒性和自组织行为,且所有测试环境均实现零样本迁移。文章还深入对比了强化学习和模仿学习,强调了物理驱动训练的高效性、收敛性和泛化能力,并引发了对“小模型”和“粗糙感知”在强智能中重要性的哲学思考。
本文全面总结了计算机体系结构顶级会议 ISCA'25 的最新动态与研究趋势。会议录用论文显示,加速器和机器学习(特别是大模型加速)已成为增长最快的核心研究方向。值得关注的是,中国科研团队在本次会议上表现突出,录用论文数量显著增加,并首次斩获最佳论文奖,标志着中国在体系结构领域地位的跃升。文章详细介绍了两篇最佳论文,分别代表了传统架构问题的现代突破(精确异常处理)和新兴 AI 应用的前沿探索(边缘 LLM 推理架构)。此外,文章还深入探讨了晶圆级计算、混合键合、光计算等新兴制造工艺对计算架构的颠覆性影响,以及 AI 时代下存储系统设计与优化的新范式,包括应用驱动的存储功能扩展(如 RAG 加速)和存算一体从“架构设计”到“软硬件协同优化”的演进,并涵盖了存储安全性研究。
文章详细介绍了上海科学智能研究院、复旦大学和无限光年联合发布的“星河启智科学智能开放平台”。该平台旨在推动科学智能进入 2.0 时代,以科学家为中心,提供覆盖高价值科学数据、开源科学模型、高效智算、干湿实验闭环、多智能体推理规划及多学科众研的全栈基础设施。文章强调了平台通过原生 Agent 实现科研全链路自动化与闭环,汇聚了多学科科学模型,提供了高效智算服务,并支持 AI 仿真与物理实验的闭环验证。此外,平台还构建了可信科学数据生态和多学科交叉众研社区,旨在降低科学家使用 AI 的门槛,加速科学发现进程,实现“科学的 AI 次方”效应。文章通过多个典型案例(如观心大模型、女娲 RNA 模型、燧人分子大模型等)展示了平台在医疗、生物、材料科学、气象等领域的应用潜力。