Claude
@claudeai · 5天前Claude Code 现在在我们的桌面应用中可用。
并行运行多个会话:同时进行编码、研究和更新工作。
计划模式也已升级至 Opus 4.5 —— Claude 会预先提问以明确需求,然后自主完成任务。

00:20
27
87
1,218
215
190
Claude Code 现在在我们的桌面应用中可用。
并行运行多个会话:同时进行编码、研究和更新工作。
计划模式也已升级至 Opus 4.5 —— Claude 会预先提问以明确需求,然后自主完成任务。

推荐
Here's my new tutorial that shows you how to build 10 beautiful websites in 12 minutes using @Replit and Gemini 3.
Some favorites:
→ A beautiful travel catalog with videos
→ A retro Windows 95 personal desktop
→ A poker game with great animations
→ A music sequencer that plays real beats
→ Luxury car and design agency showcases
📌 Watch now:youtu.be/47SlwClRJYEK
好的提示带来卓越的结果。
it’s insane how much AI image gen has improved.
> nano banana pro btw 🍌
转译:Claude Opus 4.5 的提示词(Prompting)实战指南
为了帮助大家更好地驾驭新模型,我们的研究与应用团队经过大量内部测试和“折腾”,总结了一份针对 Claude Opus 4.5 的提示词(Prompting)实战指南。
以下是我们目前摸索出的“独家秘籍”,教你如何榨干它的潜能,获得最佳效果:
1. 用好 effort 参数,想多聪明你说了算
新的 effort(努力值)参数简直是个神器。它能让你大体控制 Claude 在输出内容时消耗多少算力。这就好比你有了一个调节旋钮:你可以通过它,在“智能程度”与“成本/响应速度”之间做一个权衡 (向左转省钱快出结果,向右转费点时间但智商爆表)。
这个参数对所有类型的 Token (AI 处理文本的最小单位,相当于单词或汉字) 都有效,包括模型的思考过程、正式回复以及工具调用。
2. 别太凶,温柔点:调整工具触发率
你可能会发现工具触发的频率变了。这是因为 Opus 4.5 对系统提示词(System Prompts)的反应更加灵敏。
以前为了防止它“偷懒”不调用工具 (Undertriggering,即触发不足),你的旧提示词可能使用过非常激进或严厉的语言。但在新版本里,这样反而会导致它变得太敏感,动不动就乱用工具 (Overtriggering,即触发过度)。
所以,是时候把语气放缓了。将原来那种 “CRITICAL: You MUST use this tool”(严重警告:你必须使用此工具)的命令,改成平和的 “Use this tool when...”(当出现……情况时,使用此工具)就可以了。
3. 防止“加戏”:避免过度设计
Opus 4.5 有时候会有点“想太多”,导致过度设计 (Overengineer,即把简单问题复杂化),比如凭空增加不必要的文件或者搞一堆复杂的抽象层。
要解决这个问题,你得在提示词里把话说明白,比如加上:“Only make changes that are directly requested. Keep solutions simple and focused.”(只修改我明确要求的部分。保持解决方案简洁、聚焦。)
4. 拒绝“云写代码”:强制它先读后写
在探索代码库时,Opus 4.5 有时会表现得比较保守。
如果你发现它没看代码就直接瞎提修改建议,请直接给它下死命令:“ALWAYS read and understand relevant files before proposing edits. Do not speculate about code you have not inspected.”(在提出修改建议前,必须总是先阅读并理解相关文件。绝对不要对自己没检查过的代码进行猜测。)
5. 眼神更好了:视觉能力大升级
Opus 4.5 的视觉能力有了显著提升,处理图像和提取数据的能力更强了,尤其是在同时处理多张图片的时候。
对于那些信息量巨大、密密麻麻的图片 (Dense Images),教你个绝招:给它配备一个裁剪工具,让它能像用放大镜一样“放大”并聚焦于局部细节。在我们的测试评估中,这一招能稳定提升它的表现。
如果你想快速应用上述所有技巧,将你的应用无缝迁移到 Opus 4.5,可以直接使用我们制作的这个 Claude Code 迁移插件:
github.com/anthropics/cla…
就连我们自己,每天也都还在挖掘这个新模型的潜力!如果你有什么独门秘籍,欢迎在下方分享。
We put together a prompting guide for Claude Opus 4.5 based on extensive internal testing by our research and applied AI teams.
Here's what we've learned so far about getting the best results:
我们今天发布了一个新的 API,让你可以解析任何 Excel 表格成为一个结构化的表格。
例如,以下展示了核心生产成本的解析效果 🌽:
1️⃣ 该表格位于 Excel 表格的中心区域,带有标题、脚注和分层列布局
2️⃣ 我们取回一个带有摘要的结构化表格,以及解析后的行/列表示
如果你正在构建一个 AI 代理,这可以让你直接基于这些数据运行 text-to-pandas/SQL 查询。此外,你也可以自行执行 ETL 流程。
请查看我们的博客了解更多信息!
博客:llamaindex.ai/blog/announcin…
试试看:cloud.llamaindex.ai
宣布 LlamaSheets 进入 beta 版 🔥
使用我们最新的 LlamaCloud API 📊 将您混乱的电子表格转换为 AI 就绪数据
LlamaSheets(在 beta 版中)是一个专门的 API,可自动构建复杂的电子表格,同时保留其语义意义和层次结构上下文。
📋 智能区域分类,可以理解诸如粗体标题、彩色单元格和合并区域之类的可视化格式,以提取有意义的结构
🔧 具有每个单元格 40 多个功能的多阶段处理管道,从而生成具有保留数据类型的干净 parquet 文件
💼 非常适合财务分析、预算解析、多区域数据整合和自动化报告工作流
🤖 简单的 5 行 Python 集成,可与包括 LlamaIndex、@claudeai Code 和 Cursor 在内的任何代理框架一起使用
您可以在我们的 playground UI 中免费试用 LlamaSheets,也可以通过我们的 Python SDK 和 REST API 直接集成。
阅读完整公告并开始使用:llamaindex.ai/blog/announcin…
并在此处观看我们的介绍视频:youtube.com/watch?v=eOp6_v…
代理运行时、框架和通用代理之间有什么区别?在这篇文章中,我们将详细阐述我们观察到的模式,何时应该使用不同的方法,以及事物是如何演变的。我们的简要心理模型如下:- 框架:帮助使用 LLMs (LangChain) 构建代理的抽象 - 运行时:具有持久执行、流式传输、人在环中等功能支持的基础设施层 (LangGraph) - 通用代理:通用代理 (Deep Agents) 阅读文章:blog.langchain.com/agent-framewor…
斯坦福大学的这篇论文值得了解👇🏻
他们构建了一个AI智能体框架,从零数据起步,没有人工标注,没有精心设计的任务,也没有任何演示,但它竟然超越了所有现有的自博弈方法。
这个框架名为Agent0:通过工具集成推理,从零数据中释放自我进化的智能体。
它所取得的成就令人难以置信。
你之前见过的所有“自我提升”的智能体都有一个致命的缺陷:它们只能生成比它们已经知道的稍微难一点的任务,所以它们会立即达到瓶颈。
Agent0打破了这个天花板。
关键在于:
他们从同一个基础LLM中生成两个智能体,并让他们竞争。
• 课程智能体 - 生成越来越难的任务
• 执行智能体 - 尝试使用推理+工具来解决这些任务
每当执行智能体变得更好时,课程智能体就会被迫提高难度。
每当任务变得更难时,执行智能体就会被迫进化。
这创造了一个闭环、自我强化的课程螺旋,而且这一切都是从头开始的,没有数据,没有人,什么都没有。
只是两个智能体互相推动,达到更高的智能水平。
然后他们添加了作弊码:
一个完整的Python工具解释器在循环中。
执行智能体学习通过代码来推理问题。
课程智能体学习创建需要使用工具的任务。
所以两个智能体都在不断升级。
结果呢?
→ 数学推理能力提高+18%
→ 一般推理能力提高+24%
→ 击败R-Zero、SPIRAL、Absolute Zero,甚至使用外部专有API的框架
→ 所有这些都来自零数据,只是自我进化的循环
他们甚至展示了难度曲线在迭代过程中上升:任务从基本的几何开始,最终达到约束满足、组合学、逻辑谜题和多步骤依赖工具的问题。
这是我们见过的最接近LLM中自主认知增长的东西。
Agent0不仅仅是“更好的RL”。
它是智能体引导自身智能的蓝图。
智能体时代已经解锁。
我们团队的最新研究:评估 VLM (视觉语言模型) 在机器人学习中处理长程家庭活动的能力 (BEHAVIOR 基准环境) 👇Most VLM benchmarks watch the world; few ask how actions *change* it from a robot's eye.
Embodied cognition tells us that intelligence isn't just watching – it's enacted through interaction.
👉We introduce ENACT: A benchmark that tests if VLMs can track the evolution of a home-scale environment from a robot's egocentric view.
enact-embodied-cognition.github.ioKkenact-embodied-cognition.github.io/enact.pdfMnD
1/N
Giving an agent too many tools doesn’t always make it smarter. Sometimes it just makes it slower. 🐢
So we trimmed GitHub Copilot's default toolset from 40 down to 13.
The result? ⚡️ 400ms faster responses 📈 2-5% higher success rates
Here's how we optimizedgithub.blog/ai-and-ml/gith…/t.co/gSu87EnVPt
隆重推出 LlamaSheets 🦙 - 一款专业的 AI 代理,它可以将复杂的电子表格转换为规范化的结构化数据。
Excel 文件可能非常复杂,例如包含半结构化的数值数据、复杂的格式和可视化层级结构。很多 Excel 文件在人眼看来像是表格,但如果直接读取原始单元格值,则难以将其解析为实际表格。
解析 Excel 文件需要一套与解析任何其他文档格式完全不同的技术栈。在过去的几个月中,我们一直在努力进行关于理解 Excel 文件的应用研究。
最终,我们创建了一个强大的算法,可以帮助识别、分割和输出结构化表格,并能保留多级行和列层级结构。输出结果是一个结构化的数据框。您可以直接对其运行查询,或将其作为工具提供给上游 AI 代理。
相比于尝试编写代码(例如 openpyxl)来操作原始 Excel 值,AI 代理将更容易理解这些结构化的值。这样做可以提高准确性并降低成本。
这是整个团队共同努力的成果,在此向所有为此做出贡献的人表示感谢。欢迎查看我们的视频、博客和文档,并在下面注册!
视频:youtube.com/watch?v=eOp6_v…
博客:llamaindex.ai/blog/announcin…
文档:developers.llamaindex.ai/python/cloud/l…
注册:cloud.llamaindex.ai
感恩节快乐 🦃
宣布 LlamaSheets 进入 beta 版 🔥
使用我们最新的 LlamaCloud API 📊 将您混乱的电子表格转换为 AI 就绪数据
LlamaSheets(在 beta 版中)是一个专门的 API,可自动构建复杂的电子表格,同时保留其语义意义和层次结构上下文。
📋 智能区域分类,可以理解诸如粗体标题、彩色单元格和合并区域之类的可视化格式,以提取有意义的结构
🔧 具有每个单元格 40 多个功能的多阶段处理管道,从而生成具有保留数据类型的干净 parquet 文件
💼 非常适合财务分析、预算解析、多区域数据整合和自动化报告工作流
🤖 简单的 5 行 Python 集成,可与包括 LlamaIndex、@claudeai Code 和 Cursor 在内的任何代理框架一起使用
您可以在我们的 playground UI 中免费试用 LlamaSheets,也可以通过我们的 Python SDK 和 REST API 直接集成。
阅读完整公告并开始使用:llamaindex.ai/blog/announcin…
并在此处观看我们的介绍视频:youtube.com/watch?v=eOp6_v…