推文

宝玉

5天前

我也是 Codex 长期用户，其实我对 Codex 的吐槽也有点来自一个忠实用户的“怒其不争”。

首先 Codex 模型能力我一直是很认可的，很多编程任务比 Claude 4.5 Opus 还要强。

然后 Codex cli 和 Claude Code 的一个主要理念上的差异在于 Codex 希望模型接管一切，可定制化的相对较少，所以像 skills、plugins 这样的都是 Claude Code 先提出来的，甚至于 subagent 也不支持，而这也局限于 codex 只能用于编程，其他方面并不是很好用。

因为模型接管一切反而不好定制，但是现实中的很多需求是需要自己定制工作流的。

Claude Code 可以在编程之外做很多事情，正在往“通用 Agent”的方向走，比如我现在写作很多辅助工作都是基于 Claude Code + Skill，连配图都是它帮我自动生成的，而 codex 模型的强项在编程，编程之外这些事 Codex 上就比较难做 。

你可以看到 Claude Code 在编程之外的很多应用，但是你看到 Codex 有么？！

123

4.3万

宝玉

5天前

重构屎山代码别指望 coding agent 一夜之间帮你做了，需要借助传统软件工程。

通常有两种做法：
1. 另起炉灶，从头搭建一套新系统，老系统先保障运行，最后一次性迁移
2. 局部替换，一个模块一个模块替换

各有优缺点

但有个共同点，就是你想做好，第一件事是完善好自动化测试，只有先保证你能自动化验证所有功能，才能保障重构后不会到处崩溃。

用好 Coding Agent 的关键也在于让它可以自动验证结果好坏。

YouZhi.Mu

5天前

@dotey 应该还是很难重构系统多年沉淀下来的屎山吧

2.5万

meng shao

5天前

“洗”出最强 AI Agent：如何保持 AI Agent 记忆的纯净与高效

来自 @CamelAIOrg 团队 @Hesamation 的文章，他表示：AI Agent 的智商很大程度上取决于它的“上下文工程”，Agent 变笨通常是因为上下文出现了“腐烂”，冗余信息淹没了关键指令，CAMEL 团队提出的三种核心技术及其背后的实战思考。

1. 上下文总结：对抗“支线任务”的干扰
场景痛点：当你让 Agent 写个代码，它可能会为了修一个数据库的小 Bug 而陷入长达 10 分钟的搜索。这段“支线剧情”会产生海量 Token，让 Agent 忘记最初的任务目标。
技术手段：
  · 自动触发：当 Token 使用率达到窗口的 80% 时自动压缩。
  · 智能保留：在总结时，CAMEL 会特意保留一小部分原始用户消息。这是为了防止 LLM 在总结时产生幻觉或遗漏细节，确保“最高指示”不走样。
价值：将 Agent 从细节泥潭中拉出来，重新聚焦于全局目标。

2. 工作流记忆：让 Agent 积累“错题本”
场景痛点：Agent 每次处理任务都是“冷启动”。如果它上次费了很大劲才学会如何爬取某个反爬严厉的网站，下次遇到同样任务，它可能还会再踩一遍坑。
技术手段：
  · 结构化归档：任务完成后，自动生成一份 Markdown 文档。包含：任务描述、成功的操作步骤、使用的工具、失败记录及修复策略。
  · 弃用 RAG：这是一个非常有趣的观点。作者认为对于工作流记忆，不需要复杂的向量检索。通过文件名匹配、标签筛选或让 Agent 在一小份清单中自主选择即可。
价值：将“过程性经验”转化为“确定性指令”，显著提升 Agent 在重复性任务中的成功率。

3. 工具输出缓存：一个谨慎的实验
场景痛点：工具调用（如读取万字文档）产生的输出极其庞大。这些数据可能只在被处理的那一秒有用，之后就成了昂贵的垃圾。
技术手段：
  · 引用机制：如果输出超过 2000 字符，就将其存入磁盘，在对话中只留下一个 ID、简短预览和检索指令。
反思与教训：
  · CAMEL 团队在实践后一度撤回了此功能。因为他们发现，如果预览信息不足，Agent 可能会因为“没看到全貌”而做出错误判断。
  · 这增加了 Agent 的认知负荷：它必须自己判断什么时候该去“提取旧文件”，什么时候只看预览就行。
启示：过度追求 Token 效率可能会损害 Agent 的推理能力，内存清理必须在“节省成本”与“信息完整”之间走钢丝。

核心解读与总结
文章的专业洞察在于：Agent 的性能优化已经从“卷模型规模”转向了“卷数据管理”。
· 脑干与记忆的分离：LLM 是脑干，而开发者需要构建一个高效的记忆过滤器。
· 极简主义原则：最好的上下文工程是“如无必要，勿增实体”。
· 可解释性：相比于全黑盒的记忆检索，CAMEL 倾向于使用 Markdown、标签和结构化 Prompt，让开发者能看懂 Agent 到底记住了什么。

博客地址
camel-ai.org/blogs/brainwas…

ℏεsam

2个月前

brainwash your agents.

context engineering doesn't have to be hard, there are so many low-hanging fruits. just keep the memory a holy place and drop the bs messages

I just wrote a blog post on how we do it at @CamelAIOrg. these are simple to implement, must-have techniques for apps that use agents, which can optimize the accuracy and the cost without crazy code changes.

🎁 BONUS: I created a number of bite-sized issues that you can get on right now and start your open-source arc. just open a PR, or help review one. 

read here:shorturl.at/zyCv7F

136

1,069

7.6万

7,905

Justine Moore

2天前

关于‘AI 垃圾内容’，一个有趣的观点是：它其实聪明绝顶。

这些视频在‘劫持’人类注意力方面，比传统娱乐公司甚至 TikTok 这样的 UGC 平台都要有效得多。

内容创作的门槛接近于零，所以迭代速度快得惊人。

4,045

AI Will

1周前

波士顿动力（现为现代汽车旗下公司）在 CES 2026 舞台上展示了新款 Atlas 人形机器人的静态原型。

2,508

AI Will

1周前

Grok Imagine 迎来一次重大的画质和声音更新。

这 100% 是 AI 生成的。

10 个炸裂示例：

00:06

1,967

向阳乔木

1周前

① 打开首页，点击“视频模式”

②默认是视频生成，输入提示词：

创建一个生动活泼的卡通美食展示场景，由迷你工人们为场景注入活力。保持煎饼堆叠的形状一致。从缓慢推进镜头开始，然后加入有趣的动作：一个迷你人物跳跃并落在黄油块上，另一个用"起重机"将草莓片摆放到位，一颗蓝莓以小跳跃的方式滚动到位置上。糖浆持续稳定地流淌，形成光滑的波纹。当他们落地时添加小团"卡通尘埃"，加入微妙的镜头晃动以增添活力，并在糖浆和水果上添加闪亮的高光效果。最后以工人们摆出自豪姿势作为结尾，此时煎饼塔看起来已经完成。

③ 生成视频后，点击“延展下个片段”，输入提示词：“突然从空中掉下更多水果和奶酪”，就能生成另一段视频。

④ 切换“音乐生成”，输入提示词：“给两段视频配上欢快的音乐”。

一段有趣的配乐卡通就做好了。

1,398

Milvus

6天前

当单纯的语义搜索力有不逮时，Milvus 2.6 的「短语匹配」功能登场了。它为何重要？

向量搜索擅长捕捉语义，但某些查询同样需要精确的文本结构匹配。例如，当你希望搜索「机器学习」的所有变体时：

🔸 **松弛度 = 0**：精确短语匹配（例如“机器学习”）。
🔸 **松弛度 = 1**：允许短语中插入 1 个词（例如“机器和学习”）。
🔸 **松弛度 = 2**：允许多个插入词（例如“机器深度神经学习”）。
🔸 **松弛度 = 3**：允许词序重排（例如“从机器模型学习”）。
✅ 原生混合搜索 ✅ 由 Tantivy 位置索引驱动 ✅ 向量与文本搜索不再分离

告别漏检，开启智能匹配新篇章。
立即尝试演示 → milvus.io/blog/phrase-ma…
———
👉 关注 @milvusio，获取一切与非结构化数据相关的内容！

143

Andrew Ng

7天前

如果你从未写过代码，那么这门课正是为你量身打造。我刚发布了一门课程，不到 30 分钟，就能教你如何描述一个应用创意并用 AI 将它实现。

在这门课里，你将亲手构建一个功能完整的网络应用——一个有趣的交互式生日祝福生成器，它能在你的浏览器中运行，并轻松分享给朋友。你可以通过向 AI 描述你的修改想法来定制它，并不断调整直至满意。课程结束时，你将掌握一套可重复的流程，用来构建你能想象出的各种应用。

如果你想体验‘vibe coding’（AI 辅助编程），这里就是你的最佳起点！此外，你可以将这些技巧应用于你最顺手的任何 AI 工具（比如 ChatGPT、Gemini、Claude 等）——我们的教学是供应商中立的。

你将学到的技能：
- 如何用 AI 构建网络应用 —— 零编码技能要求
- 如何通过与 AI 对话来修复和改进你的作品
- 一个可以用来实现其他创意的简单流程

用 AI 来创造，是当今最具乐趣的事情之一。请加入我，迈出你的第一步！我相信你会对自己能构建出的成果感到惊喜。如果你是一名经验丰富的工程师，请将这门课分享给你身边那位一直对 AI 创作充满好奇的朋友。

来和我一起创造吧！ deeplearning.ai/courses/build-…

01:03

131

818

4,989

6,720

43.5万

1,573

Philipp Schmid

5天前

向大家介绍 mcp-cli，这是一款开源、轻量级的 CLI 工具，用于动态发现并与 MCP（模型上下文协议）服务器交互，专为 AI 代理和 Shell 脚本设计。

- 通过动态发现，将 MCP token 使用量减少 99%。
- 通过 Bun 编译成单个独立的二进制文件。
- 同时支持 stdio（本地）和 HTTP（远程）服务器。
- 支持管道操作和 JSON 输出，便于脚本编写。
- 使用 `mcp-cli grep` 命令，可在所有服务器上进行基于 Glob 模式的搜索。
- 包含自动重试机制，并采用指数退避策略处理错误。

772

742

5.1万

291

订阅源

我也是 Codex 长期用户，其实我对 Codex 的吐槽也有点来自一个忠实用户的“怒其不争”。

首先 Codex 模型能力我一直是很认可的，很多编程任务比 Claude 4.5 Opus 还要强。

然后 Codex cli 和 Claude Code 的一个主要理念上的差异在于 Codex 希望模型接管一切，可定制化的相对较少，所以像 skills、plugins 这样的都是 Claude Code 先提出来的，甚至于 subagent 也不支持，而这也局限于 codex 只能用于编程，其他方面并不是很好用。

因为模型接管一切反而不好定制，但是现实中的很多需求是需要自己定制工作流的。

Claude Code 可以在编程之外做很多事情，正在往“通用 Agent”的方向走，比如我现在写作很多辅助工作都是基于 Claude Code + Skill，连配图都是它帮我自动生成的，而 codex 模型的强项在编程，编程之外这些事 Codex 上就比较难做。

你可以看到 Claude Code 在编程之外的很多应用，但是你看到 Codex 有么？！

重构屎山代码别指望 coding agent 一夜之间帮你做了，需要借助传统软件工程。

通常有两种做法：
1. 另起炉灶，从头搭建一套新系统，老系统先保障运行，最后一次性迁移
2. 局部替换，一个模块一个模块替换

各有优缺点

但有个共同点，就是你想做好，第一件事是完善好自动化测试，只有先保证你能自动化验证所有功能，才能保障重构后不会到处崩溃。

用好 Coding Agent 的关键也在于让它可以自动验证结果好坏。

“洗”出最强 AI Agent：如何保持 AI Agent 记忆的纯净与高效

来自 @CamelAIOrg 团队 @Hesamation 的文章，他表示：AI Agent 的智商很大程度上取决于它的“上下文工程”，Agent 变笨通常是因为上下文出现了“腐烂”，冗余信息淹没了关键指令，CAMEL 团队提出的三种核心技术及其背后的实战思考。

1. 上下文总结：对抗“支线任务”的干扰
场景痛点：当你让 Agent 写个代码，它可能会为了修一个数据库的小 Bug 而陷入长达 10 分钟的搜索。这段“支线剧情”会产生海量 Token，让 Agent 忘记最初的任务目标。
技术手段：
· 自动触发：当 Token 使用率达到窗口的 80% 时自动压缩。
· 智能保留：在总结时，CAMEL 会特意保留一小部分原始用户消息。这是为了防止 LLM 在总结时产生幻觉或遗漏细节，确保“最高指示”不走样。
价值：将 Agent 从细节泥潭中拉出来，重新聚焦于全局目标。

2. 工作流记忆：让 Agent 积累“错题本”
场景痛点：Agent 每次处理任务都是“冷启动”。如果它上次费了很大劲才学会如何爬取某个反爬严厉的网站，下次遇到同样任务，它可能还会再踩一遍坑。
技术手段：
· 结构化归档：任务完成后，自动生成一份 Markdown 文档。包含：任务描述、成功的操作步骤、使用的工具、失败记录及修复策略。
· 弃用 RAG：这是一个非常有趣的观点。作者认为对于工作流记忆，不需要复杂的向量检索。通过文件名匹配、标签筛选或让 Agent 在一小份清单中自主选择即可。
价值：将“过程性经验”转化为“确定性指令”，显著提升 Agent 在重复性任务中的成功率。

3. 工具输出缓存：一个谨慎的实验
场景痛点：工具调用（如读取万字文档）产生的输出极其庞大。这些数据可能只在被处理的那一秒有用，之后就成了昂贵的垃圾。
技术手段：
· 引用机制：如果输出超过 2000 字符，就将其存入磁盘，在对话中只留下一个 ID、简短预览和检索指令。
反思与教训：
· CAMEL 团队在实践后一度撤回了此功能。因为他们发现，如果预览信息不足，Agent 可能会因为“没看到全貌”而做出错误判断。
· 这增加了 Agent 的认知负荷：它必须自己判断什么时候该去“提取旧文件”，什么时候只看预览就行。
启示：过度追求 Token 效率可能会损害 Agent 的推理能力，内存清理必须在“节省成本”与“信息完整”之间走钢丝。

核心解读与总结
文章的专业洞察在于：Agent 的性能优化已经从“卷模型规模”转向了“卷数据管理”。
· 脑干与记忆的分离：LLM 是脑干，而开发者需要构建一个高效的记忆过滤器。
· 极简主义原则：最好的上下文工程是“如无必要，勿增实体”。
· 可解释性：相比于全黑盒的记忆检索，CAMEL 倾向于使用 Markdown、标签和结构化 Prompt，让开发者能看懂 Agent 到底记住了什么。

博客地址
camel-ai.org/blogs/brainwas…

brainwash your agents.

context engineering doesn't have to be hard, there are so many low-hanging fruits. just keep the memory a holy place and drop the bs messages

I just wrote a blog post on how we do it at @CamelAIOrg. these are simple to implement, must-have techniques for apps that use agents, which can optimize the accuracy and the cost without crazy code changes.

🎁 BONUS: I created a number of bite-sized issues that you can get on right now and start your open-source arc. just open a PR, or help review one.

read here:shorturl.at/zyCv7F

关于‘AI 垃圾内容’，一个有趣的观点是：它其实聪明绝顶。

这些视频在‘劫持’人类注意力方面，比传统娱乐公司甚至 TikTok 这样的 UGC 平台都要有效得多。

内容创作的门槛接近于零，所以迭代速度快得惊人。

① 打开首页，点击“视频模式”

②默认是视频生成，输入提示词：

创建一个生动活泼的卡通美食展示场景，由迷你工人们为场景注入活力。保持煎饼堆叠的形状一致。从缓慢推进镜头开始，然后加入有趣的动作：一个迷你人物跳跃并落在黄油块上，另一个用"起重机"将草莓片摆放到位，一颗蓝莓以小跳跃的方式滚动到位置上。糖浆持续稳定地流淌，形成光滑的波纹。当他们落地时添加小团"卡通尘埃"，加入微妙的镜头晃动以增添活力，并在糖浆和水果上添加闪亮的高光效果。最后以工人们摆出自豪姿势作为结尾，此时煎饼塔看起来已经完成。

③ 生成视频后，点击“延展下个片段”，输入提示词：“突然从空中掉下更多水果和奶酪”，就能生成另一段视频。

④ 切换“音乐生成”，输入提示词：“给两段视频配上欢快的音乐”。

一段有趣的配乐卡通就做好了。

当单纯的语义搜索力有不逮时，Milvus 2.6 的「短语匹配」功能登场了。它为何重要？

向量搜索擅长捕捉语义，但某些查询同样需要精确的文本结构匹配。例如，当你希望搜索「机器学习」的所有变体时：

🔸 **松弛度 = 0**：精确短语匹配（例如“机器学习”）。
🔸 **松弛度 = 1**：允许短语中插入 1 个词（例如“机器和学习”）。
🔸 **松弛度 = 2**：允许多个插入词（例如“机器深度神经学习”）。
🔸 **松弛度 = 3**：允许词序重排（例如“从机器模型学习”）。
✅ 原生混合搜索 ✅ 由 Tantivy 位置索引驱动 ✅ 向量与文本搜索不再分离

告别漏检，开启智能匹配新篇章。
立即尝试演示 → milvus.io/blog/phrase-ma…
———
👉 关注 @milvusio，获取一切与非结构化数据相关的内容！

如果你从未写过代码，那么这门课正是为你量身打造。我刚发布了一门课程，不到 30 分钟，就能教你如何描述一个应用创意并用 AI 将它实现。

在这门课里，你将亲手构建一个功能完整的网络应用——一个有趣的交互式生日祝福生成器，它能在你的浏览器中运行，并轻松分享给朋友。你可以通过向 AI 描述你的修改想法来定制它，并不断调整直至满意。课程结束时，你将掌握一套可重复的流程，用来构建你能想象出的各种应用。

如果你想体验‘vibe coding’（AI 辅助编程），这里就是你的最佳起点！此外，你可以将这些技巧应用于你最顺手的任何 AI 工具（比如 ChatGPT、Gemini、Claude 等）——我们的教学是供应商中立的。

你将学到的技能：
- 如何用 AI 构建网络应用 —— 零编码技能要求
- 如何通过与 AI 对话来修复和改进你的作品
- 一个可以用来实现其他创意的简单流程

用 AI 来创造，是当今最具乐趣的事情之一。请加入我，迈出你的第一步！我相信你会对自己能构建出的成果感到惊喜。如果你是一名经验丰富的工程师，请将这门课分享给你身边那位一直对 AI 创作充满好奇的朋友。

来和我一起创造吧！ deeplearning.ai/courses/build-…

向大家介绍 mcp-cli，这是一款开源、轻量级的 CLI 工具，用于动态发现并与 MCP（模型上下文协议）服务器交互，专为 AI 代理和 Shell 脚本设计。

- 通过动态发现，将 MCP token 使用量减少 99%。
- 通过 Bun 编译成单个独立的二进制文件。
- 同时支持 stdio（本地）和 HTTP（远程）服务器。
- 支持管道操作和 JSON 输出，便于脚本编写。
- 使用 `mcp-cli grep` 命令，可在所有服务器上进行基于 Glob 模式的搜索。
- 包含自动重试机制，并采用指数退避策略处理错误。