文章
Google 通过提供开发者更多控制和灵活性的新工具,增强其 AI 辅助编码工具 Jules。Jules 在软件开发生命周期的各个阶段为开发者提供帮助,从生成代码、修复错误到编写测试和提高性能,充当协作伙伴。主要更新包括:Jules 工具(轻量级命令行界面,允许在终端与 Jules 交互)和 Jules API(早期预览版)。该 API 能够将 Jules 深度集成到现有系统和工作流程中,从而促进由事件(例如,在 Slack 中提交错误)或在 CI/CD 管道中触发的自动化任务。这些新增功能旨在将 Jules 无缝嵌入到开发者首选的环境中。此外,最近的更新侧重于提高 Jules 的可靠性和质量,包括减少延迟、修复环境设置问题、用于收紧上下文的文件选择器、用于保留偏好的内存以及结构化的环境变量管理。文章强调,使用 AI 助手的编码的未来已经到来,并鼓励开发者开始使用这些新功能进行构建。
本文宣布了 Google 的 Gemini 2.5 计算机应用模型,这是一种基于 Gemini 2.5 Pro 的视觉理解和推理能力构建的全新专业 AI 模型。该模型使 AI 代理能够直接与图形用户界面 (UI) 交互,执行点击、输入、滚动等类似人工的操作,这对于自动化复杂的数字任务(如填写表单或操作交互元素)至关重要。该系统在迭代循环中运行,模型分析用户请求、环境屏幕截图和操作历史记录,以生成适当的 UI 操作。它主要针对 Web 浏览器进行了优化,并在移动 UI 控制方面展现出强大的前景。性能基准测试表明,与各种 Web 和移动控制任务中的领先替代方案相比,该模型具有卓越的性能和更低的延迟。Google 强调以负责任的态度开发 AI 代理,将安全功能直接集成到模型中,并为开发人员提供诸如逐步骤安全服务之类的控件,以防止高风险操作。包括 Google 内部团队在内的早期测试人员已成功部署该模型,用于 UI 测试、工作流程自动化和个人助理等用例,报告了速度和可靠性的显著提高。Gemini 2.5 计算机应用模型现已通过 Google AI Studio 和 Vertex AI 中的 Gemini API 公开预览。