推文

Mike Krieger

12小时前

眼下正是成为构建者的最佳时机——Opus 4.5 和 Claude Code 所能构建出的产品，其质量与完成度屡屡令我惊叹。

因此，我决定付诸行动：重拾产品创始人的身份，加入我们的 Labs 团队，亲临技术前沿，动手构建那些旨在利用 AI 攻克世界最棘手难题的产品。很高兴能将接力棒传递给 Ami Vora，在她领导产品团队推动 Claude 规模化发展之际。

Anthropic

12小时前

We’re expanding Labs—the team behind Claude Code, MCP, and Cowork—and hiring builders who want to tinker at the frontier of Claude’s capabilities.

Read more: anthropic.com/news/introduci…

359

1.3万

585

Justine Moore

7天前

看到 AI 在医疗领域开始真正‘大显身手’，实在令人振奋。

中国的研究人员发现，一款 AI 工具在识别胰腺癌方面的表现已优于放射科医生。

与此同时，斯坦福大学的研究人员也开发出一种新的基础模型，仅凭单晚的睡眠数据便能预测疾病风险 &#129327;

992

Qdrant

1周前

Qdrant 实战案例：实时语音 AI 演示

Henryk Brzozowski 为一家汽车经销商构建了一个语音 AI 演示，该系统在实时电话通话中运行 —— 依托于 Qdrant 的实时检索功能。

工作流程简单而高效：
- 经销商分享一个包含其汽车库存的 Google Sheet
- 数据在 Qdrant 中被索引
- 语音 AI 便能实时地以自然语言在通话中回答客户问题

客户可以询问诸如：
- “你们有价格低于 3 万美元的福特吗？”
- “你们有奔驰吗？”
- “有 2022 年款且里程数低的吗？”

系统按价格、品牌、型号、年份和特性进行搜索 —— 实时从库存数据库中检索匹配的车辆信息，并在不到一秒内给出响应。

这是 RAG 在实时语音场景中运行的绝佳范例，展示了快速、结构化的检索如何实现自然流畅、生产就绪的 AI 体验。

#Qdrant #VectorSearch #RetrievalAugmentedGeneration #RAG #VoiceAI

01:30

940

Milvus

5天前

🧥 一款时尚应用 → 旨在为用户提供个性化体验。@mozatnigeria 运用 AI 技术，规模化地优化了在贝宁城的个性化推荐决策流程。

要持续交付这种体验并非易事。
随着 Stylepedia 的图像库快速增长，团队面临双重挑战：规模与速度。

Stylepedia 需要高效地存储、管理、索引并比较服装图像——这些图像在分辨率、尺寸和视角上差异巨大——同时仍需在几毫秒内返回图像相似性搜索结果。

为了解决这个问题，Mozat 采用了 Milvus 作为 Stylepedia 图像搜索系统核心的向量相似性搜索引擎。
🚀 关键结果
• 凭借快速扩展能力，处理了数百万的向量嵌入
• 实现了高精度的图像相似性搜索性能
• 保障未来可扩展性，以应对图像库的持续增长
• 基于视觉相似性，驱动个性化推荐决策

借助 Milvus，Stylepedia 从一个数字衣橱演变成一个智能时尚伴侣——赋能更智能的时尚体验。

🔗 完整故事：zilliz.com/customers/moza…
———
👉 关注 @milvusio 获取为大规模 AI 提供动力的真实世界向量数据库用例。
#VectorDatabase #BuildwithMilvus

182

Dify

1天前

企业知识从来不止于文本。

通过多模态嵌入与重排序技术，Dify 现支持在统一语义空间中对文本和图像进行联合检索与推理。这意味着图表、截图和产品照片可直接作为可操作上下文，融入 RAG 工作流，赋能视觉 LLM。

该指南详解了其技术设计、多模态 RAG 中嵌入与重排序的协同机制，并提供了一个实际工作流示例。

探索其工作原理： dify.ai/blog/multimoda…

#Dify #KnowledgeBase #RAG #VisionLLM

1,167

Milvus

5天前

AI 智能体不仅会产生幻觉，还会受‘上下文腐化’的影响。&#129504;&#128201;
随着上下文窗口增长，检索准确率可能下降高达 30%。上下文窗口越大，数据量固然增加，但数据相关性未必同步提升。

以下是如何通过上下文工程来解决这个问题：
✅ 先进先出 (FIFO) 检索：不要过度填充提示词。仅在智能体触发特定工具时获取数据。
✅ 双重知识库：使用 Milvus 管理稳定、长期的知识库，并利用智能体工具处理实时日志与 API 数据。
✅ 摘要循环：不要传递原始历史记录。对先前的步骤进行摘要，以保持‘工作记忆’精简高效。

核心原则：小而精的提示词，远胜大而杂的提示词。
阅读完整深度解析：milvus.io/blog/keeping-a…
———
&#128073; 关注 @milvusio，探索非结构化数据的无限可能！

119

Y Combinator

2天前

🌕 @gru_space 正在建造耐用的太空栖息地，以便人类有朝一日能在月球和火星上生活。

其首次任务将开采月球风化层，在月球上建造一个用于商业太空旅游的长期加压栖息地——也就是一个月球酒店。

祝贺启动 @skyler_chan_！

ycombinator.com/launches/P9g-g…

00:39

103

562

102

9.6万

163

Y Combinator

6天前

Stoke Space 正致力于打造世界首型完全可重复使用火箭，其目标是实现发射、安全再入，并几乎能立即再次执行飞行任务。

在本期《Hard Tech》节目中，@aaron_epstein 与 @stoke_space 的联合创始人 @AndyLapsa 和 @Rkt_Da 展开对谈，共同探讨了他们为何选择迎战火箭科学中最艰巨的挑战之一、作为一家规模较小的初创公司如何将之转化为独特优势，以及完全可重复使用技术将如何为太空飞行的未来开启新的可能。

00:00 — 开场介绍
01:16 — Stoke Space 的使命：快速复用能力
02:18 — 第二级舱段再入失败的原因
03:34 — Stoke Space 的第二级解决方案
05:30 — 可重复使用优先设计理念
07:25 — 早期发动机研发与测试策略
10:48 — 垂直整合与制造
11:21 — 迭代速度作为竞争优势
12:29 — 软件作为核心基础设施
14:00 — 入轨路径与发射操作
15:04 — 这将如何改变世界

15:43

792

233

20.1万

147

Greg Brockman

5天前

【OpenAI for Healthcare】

OpenAI

5天前

医师的 AI 使用率在一年内几乎翻倍。

今天我们正式推出 OpenAI for Healthcare，这是一个符合 HIPAA 标准的解决方案，旨在帮助医疗机构为患者提供更一致、更高质量的照护。

该方案现已在 AdventHealth、Baylor Scott & White、UCSF、Cedars-Sinai、HCA、Memorial Sloan Kettering 等众多机构上线。 openai.com/index/openai-f…

306

449

3,455

50.8万

933

107

10.6万

144

Justine Moore

5天前

ElevenLabs 刚刚攻克了语音转录的难题。

他们的新模型 Scribe v2 在词错误率指标上达到了最先进水平，能够轻松处理停顿、笑声和复杂词汇。

其说话人日志功能尤为出色，在区分同卵双胞胎声音的终极测试中实现了零错误。

工作原理如下 👇

00:26

499

358

4万

127

订阅源

眼下正是成为构建者的最佳时机——Opus 4.5 和 Claude Code 所能构建出的产品，其质量与完成度屡屡令我惊叹。

因此，我决定付诸行动：重拾产品创始人的身份，加入我们的 Labs 团队，亲临技术前沿，动手构建那些旨在利用 AI 攻克世界最棘手难题的产品。很高兴能将接力棒传递给 Ami Vora，在她领导产品团队推动 Claude 规模化发展之际。

看到 AI 在医疗领域开始真正‘大显身手’，实在令人振奋。

中国的研究人员发现，一款 AI 工具在识别胰腺癌方面的表现已优于放射科医生。

与此同时，斯坦福大学的研究人员也开发出一种新的基础模型，仅凭单晚的睡眠数据便能预测疾病风险 🤯

Qdrant 实战案例：实时语音 AI 演示

Henryk Brzozowski 为一家汽车经销商构建了一个语音 AI 演示，该系统在实时电话通话中运行 —— 依托于 Qdrant 的实时检索功能。

工作流程简单而高效：
- 经销商分享一个包含其汽车库存的 Google Sheet
- 数据在 Qdrant 中被索引
- 语音 AI 便能实时地以自然语言在通话中回答客户问题

客户可以询问诸如：
- “你们有价格低于 3 万美元的福特吗？”
- “你们有奔驰吗？”
- “有 2022 年款且里程数低的吗？”

系统按价格、品牌、型号、年份和特性进行搜索 —— 实时从库存数据库中检索匹配的车辆信息，并在不到一秒内给出响应。

这是 RAG 在实时语音场景中运行的绝佳范例，展示了快速、结构化的检索如何实现自然流畅、生产就绪的 AI 体验。

#Qdrant #VectorSearch #RetrievalAugmentedGeneration #RAG #VoiceAI

🧥 一款时尚应用 → 旨在为用户提供个性化体验。@mozatnigeria 运用 AI 技术，规模化地优化了在贝宁城的个性化推荐决策流程。

要持续交付这种体验并非易事。
随着 Stylepedia 的图像库快速增长，团队面临双重挑战：规模与速度。

Stylepedia 需要高效地存储、管理、索引并比较服装图像——这些图像在分辨率、尺寸和视角上差异巨大——同时仍需在几毫秒内返回图像相似性搜索结果。

为了解决这个问题，Mozat 采用了 Milvus 作为 Stylepedia 图像搜索系统核心的向量相似性搜索引擎。
🚀 关键结果
• 凭借快速扩展能力，处理了数百万的向量嵌入
• 实现了高精度的图像相似性搜索性能
• 保障未来可扩展性，以应对图像库的持续增长
• 基于视觉相似性，驱动个性化推荐决策

借助 Milvus，Stylepedia 从一个数字衣橱演变成一个智能时尚伴侣——赋能更智能的时尚体验。

🔗 完整故事：zilliz.com/customers/moza…
———
👉 关注 @milvusio 获取为大规模 AI 提供动力的真实世界向量数据库用例。
#VectorDatabase #BuildwithMilvus

企业知识从来不止于文本。

通过多模态嵌入与重排序技术，Dify 现支持在统一语义空间中对文本和图像进行联合检索与推理。这意味着图表、截图和产品照片可直接作为可操作上下文，融入 RAG 工作流，赋能视觉 LLM。

该指南详解了其技术设计、多模态 RAG 中嵌入与重排序的协同机制，并提供了一个实际工作流示例。

探索其工作原理： dify.ai/blog/multimoda…

#Dify #KnowledgeBase #RAG #VisionLLM

AI 智能体不仅会产生幻觉，还会受‘上下文腐化’的影响。🧠📉
随着上下文窗口增长，检索准确率可能下降高达 30%。上下文窗口越大，数据量固然增加，但数据相关性未必同步提升。

以下是如何通过上下文工程来解决这个问题：
✅ 先进先出 (FIFO) 检索：不要过度填充提示词。仅在智能体触发特定工具时获取数据。
✅ 双重知识库：使用 Milvus 管理稳定、长期的知识库，并利用智能体工具处理实时日志与 API 数据。
✅ 摘要循环：不要传递原始历史记录。对先前的步骤进行摘要，以保持‘工作记忆’精简高效。

核心原则：小而精的提示词，远胜大而杂的提示词。
阅读完整深度解析：milvus.io/blog/keeping-a…
———
👉 关注 @milvusio，探索非结构化数据的无限可能！

🌕 @gru_space 正在建造耐用的太空栖息地，以便人类有朝一日能在月球和火星上生活。

其首次任务将开采月球风化层，在月球上建造一个用于商业太空旅游的长期加压栖息地——也就是一个月球酒店。

祝贺启动 @skyler_chan_！

ycombinator.com/launches/P9g-g…

Stoke Space 正致力于打造世界首型完全可重复使用火箭，其目标是实现发射、安全再入，并几乎能立即再次执行飞行任务。

在本期《Hard Tech》节目中，@aaron_epstein 与 @stoke_space 的联合创始人 @AndyLapsa 和 @Rkt_Da 展开对谈，共同探讨了他们为何选择迎战火箭科学中最艰巨的挑战之一、作为一家规模较小的初创公司如何将之转化为独特优势，以及完全可重复使用技术将如何为太空飞行的未来开启新的可能。

00:00 — 开场介绍
01:16 — Stoke Space 的使命：快速复用能力
02:18 — 第二级舱段再入失败的原因
03:34 — Stoke Space 的第二级解决方案
05:30 — 可重复使用优先设计理念
07:25 — 早期发动机研发与测试策略
10:48 — 垂直整合与制造
11:21 — 迭代速度作为竞争优势
12:29 — 软件作为核心基础设施
14:00 — 入轨路径与发射操作
15:04 — 这将如何改变世界

医师的 AI 使用率在一年内几乎翻倍。

今天我们正式推出 OpenAI for Healthcare，这是一个符合 HIPAA 标准的解决方案，旨在帮助医疗机构为患者提供更一致、更高质量的照护。

该方案现已在 AdventHealth、Baylor Scott & White、UCSF、Cedars-Sinai、HCA、Memorial Sloan Kettering 等众多机构上线。 openai.com/index/openai-f…

ElevenLabs 刚刚攻克了语音转录的难题。

他们的新模型 Scribe v2 在词错误率指标上达到了最先进水平，能够轻松处理停顿、笑声和复杂词汇。

其说话人日志功能尤为出色，在区分同卵双胞胎声音的终极测试中实现了零错误。

工作原理如下 👇