文章
本文宣布谷歌 AI Ultra 订阅者可在 Gemini 应用中使用 Deep Think。与之前版本相比,Deep Think 实现了显著改进,例如在 2025 年 IMO 基准测试中达到了 Bronze 级别性能。Deep Think 采用并行计算技术,增强了 Gemini 的问题解决能力,允许模型同时探索多个假设,并在延长的推理时间内修改和组合想法。这种方法与新型强化学习相结合,能够实现更具创造性和直观性的解决方案。 本文展示了 Deep Think 在各个领域的卓越性能,包括迭代开发与设计(例如 Web 开发)、科学与数学发现(猜想公式化、复杂文献分析)以及算法开发与高难度编码问题。它在 LiveCodeBench V6 和“人类最终测试”等基准测试中取得了最佳结果。谷歌还强调了其对负责任的 AI 开发的承诺,指出与 Gemini 2.5 Pro 相比,Deep Think 的内容安全性和语气客观性有所提高,同时还在进行前沿安全评估。Deep Think 集成了代码执行和 Google Search 等工具,未来计划为开发者和企业提供 API 访问。
本文介绍了 Google DeepMind 的 AI 模型 AlphaEarth Foundations,该模型旨在充当“虚拟卫星”。它通过将拍字节级的海量数据(包括光学卫星图像、雷达、3D 激光测绘和气候模拟)整合到名为“向量嵌入”的统一数字表示中,从而解决了地球观测中的数据过载和不一致性挑战。这项创新能够以清晰的 10x10 米方格表征陆地和沿海水域,并以高精度跟踪随时间的变化。一项关键突破是该模型能够创建高度紧凑的数据摘要,与其他 AI 系统相比,所需的存储空间减少 16 倍,从而大大降低了行星尺度分析的成本。Google 正在 Google Earth Engine 中发布 AlphaEarth Foundations 的年度向量嵌入,并将其作为卫星嵌入数据集,该数据集已被 50 多个组织用于实际应用,例如对未绘制地图的生态系统进行分类以及监测农业和环境变化。严格的测试表明,即使在标签数据稀缺的情况下,AlphaEarth Foundations 也始终更加准确,误差率降低 24%。该技术代表了全球地图绘制和监测方面的重大进步。未来,它还具有与 Gemini 等 LLM 代理集成的潜力。