Y Combinator
@ycombinator · 1周前光学卫星在70%的时间里无法正常工作。
Axion (@axionorbital) 开发了先进的 SAR-到-光学模型来解决这一问题。“哈勃”提供10米分辨率,而“猎户座”则可以达到0.5米,FID 为30.24。
现在,无论白天黑夜,无论任何天气,你都可以追踪任何资产。
祝贺 @dhenenjay 与 @atharva_peshkar 成功发布!
axionorbital.space
00:42
30
24
286
89
62
光学卫星在70%的时间里无法正常工作。
Axion (@axionorbital) 开发了先进的 SAR-到-光学模型来解决这一问题。“哈勃”提供10米分辨率,而“猎户座”则可以达到0.5米,FID 为30.24。
现在,无论白天黑夜,无论任何天气,你都可以追踪任何资产。
祝贺 @dhenenjay 与 @atharva_peshkar 成功发布!
axionorbital.space
为什么说 Skills 更容易进化呢?
先说传统软件的问题,用户使用时遇到个 bug,都没办法向开发者反馈,这个链条太长了,用户如果运气好有日志,还得把日志记录下来,或者用户专业一点,能知道怎么重现,然后这个 Bug 可能还得层层上报,先给公司,再转给 QA,QA 去验证,最后到开发,这中间稍微一点损耗就没办法重现没办法解决。
但 Agent + Skills 的组合不一样,它相当于“开发者”就在你身边,Agent 既可以帮你执行任务,又可以充当开发者的角色,遇到问题不但可以定位,还可以修复。
举个例子(参考图2)来说,我在使用某个 skill 的时候,发现这个 skill 的结果不符合预期,这时候我可以直接在当前会话告诉 agent,让它检查一下提示词或者脚本,看问题在哪,并且修复。
由于当前会话中提示词它有,输入输出它也知道,工具调用的参数、结果它都知道,本地还有所有文件,那么它可以轻易的定位到问题在哪,直接帮你修复或者优化。
还有一点,由于 skills 相关的内容都是文本文件,就是如果配合 git 做好版本管理,所有的修改操作都会被记录下来,如果有问题可以跟踪整个变更过程,而且一个人机器上的 Skills 改进了,可以共享给所有人。


带动效的 PPT 生成 Agent Skills 的架构图和技术栈
相当复杂了,Claude Code 和 Skills 的潜力非常牛皮
很难想象这一套东西是他全自动搞出来的,我基本没有动代码


卧槽,我终于搞定了!带演示动效的 PPT 生成 Agent !
是我这个 PPT 生成 Skills 的迭代版本。
测试了一下,没想到效果还挺好:支持导出完整的视频,以及在网页上可以随意地控制速度去浏览 。
首页动画为了适应演示的等待时间,做成了无限循环的版本。每一页 PPT 切换的时候都有动效。
哈哈,这个应该是目前所有 PPT 生成独一份的,没有产品有,对演示的支持也非常好
Betterment 的电子邮件通知系统被入侵了,他们发布了一个“比特币 & 以太坊赠品”。
垃圾邮件和钓鱼过滤器需要借助 AI 变得更智能。这封邮件确实来自 Betterment,但它 *明显是伪造的*。
如果我们让 Claude Code 去分析这封邮件的原始源代码,不给任何额外提示…
它完美地诊断出了这封邮件:
> “这是一封诈骗邮件。不要向那些地址发送任何加密货币。”
它甚至对入侵的发生方式做出了一个非常合理的推断:
> 该邮件通过了 e.betterment.com 的 DKIM/SPF/DMARC 认证,使用了 Braze/Sparkpost 基础设施,这表明要么:
- Betterment 的电子邮件营销账户被入侵了
- 一个有权访问其营销工具的第三方发送了此邮件
真是太厉害了。



谷歌 AI 开年王炸,Gemini 开始跟 Gmail 深度集成
Gmail 正在转型为主动的 Gemini 驱动 AI 邮箱,具体包括下面几个功能:
AI 收件箱:最重要的是 AI 收件箱类似一个简报页面,他会按照优先级帮你重新整理所有邮件的信息。你不需要在翻你的收件箱就能快速浏览重要的信息和提醒,所有相关信息都会被汇总到一起,方便多了。这个目前在缓慢放量。
AI 概览:在搜索框用自然语言提出问题之后,会使用 Gemini 生成一个简洁的 AI 概览来从你的邮件中获取信息提供答案,这个能力是免费的。
AI 写邮件:所有人都可以使用“帮助我写”来润色邮件或从头起草邮件。还有新的“建议回复”会利用会话上下文提供相关的一键式回复,匹配你的写作风格。帮写功能免费,校对能力对 Pro 和 Ultra 用户开放。
新版 Gmail 将会从今天开始向美国的英语 Gmail 用户和 Gemini 付费订阅者推出。
祝贺 @ArrayLabs 获得 2000 万美元的 A 轮融资!
他们正在制造能在商业价位大规模生产的雷达卫星,以现有方案约 1% 的成本提供 100 倍的性能。
他们已实现数千万美元的合同收入,赢得了空军、太空军、海军、陆军、SOCOM 和 DARPA 的奖项——并正准备发射世界上第一个编队飞行雷达集群。
arraylabs.io/updates/1
[开源推荐] claude-mem: @Claude_Memory 开源的 Claude Code 插件,为了解决 Claude 等在编码会话中上下文丢失的问题,提供持久化的智能记忆功能。在长周期编码任务中的连续性和效率,尤其适合复杂软件开发、调试和迭代场景。
项目核心功能
· 自动捕捉与压缩:插件会实时监控 Claude 在编码会话中的所有操作(如工具调用、文件读写、输出结果),自动生成简洁的语义摘要,并基于 Claude Agent SDK 进行压缩存储。
· 跨会话上下文注入:在新会话开始时,自动检索并注入相关历史上下文,让 Claude “记住”之前的工作进度、决策和项目细节,避免用户反复解释背景。
· 智能检索:提供 mem-search 技能,支持自然语言查询项目历史;采用混合搜索(语义 + 关键字),并使用渐进式披露(先概述、再细节)来优化 token 消耗。
· 可视化与控制:内置 Web UI,实时查看记忆流、时间线和观察记录;支持隐私标签排除敏感内容。
· 其他特性:引用机制、技能集成、实验性 Endless Mode(仿生记忆架构,延长会话长度),以及细粒度配置。
工作原理简述
插件通过 Claude Code 的生命周期钩子运行后台 worker 服务,使用 SQLite 存储会话数据,Chroma 向量数据库实现高效检索。整个过程无需手动干预,注重 token 效率和隐私安全。
开源地址
github.com/thedotmack/cla…
作者给的2026年的11个预测
每年我都会做一份预测清单,顺便给去年的预测打个分。2025年表现不错,拿了7.85分(满分10分)。
2026年预计会发生什么:
1. 企业为AI Agent付的钱,第一次超过雇人的成本
消费端其实已经这样了。
Waymo的打车费用平均比Uber贵31%,但需求还在涨。
为什么?乘客更看重自动驾驶的安全性和可靠性。
对企业来说也一样。
当你把招聘、入职培训、日常管理这些隐性成本都算进去,AI代理反而更划算。
尤其是那些重复性的工作,企业会愿意为AI多付钱。
2. 2026成为史上最大的流动性释放年
SpaceX、OpenAI、Anthropic、Stripe、Databricks会扎堆IPO。其中SpaceX和OpenAI能挤进史上最大规模IPO的前十名。
憋了4年多的需求终于要爆发了。
更有意思的是,那些老牌公司会疯狂收购,金额超过250亿美元。
他们害怕被AI颠覆,与其自己慢慢研发,不如直接买。
3. 向量数据库重新成为AI基础设施的核心
多模态模型和世界模型需要全新的数据架构。
向量数据库会迎来爆发式增长,它们成了连接大模型和企业数据的关键组织。
4. AI模型能独立完成超过8小时的工作流程
根据METR的数据,AI完成任务的时长每7个月翻一倍。
现在的前沿模型能可靠完成大约1小时的任务。
按这个趋势推算,到2026年底,AI Agent能自主执行8小时以上的工作流程。
这会彻底改变公司的人员配置方式。
5. AI预算第一次被严格审查
采购委员会和董事会开始质疑AI投入。
小型语言模型和开源方案会更受欢迎。
研究实验室发现,把模型针对特定任务做优化,能用十分之一的成本达到最先进的效果。
开发者当然喜欢这种10倍成本削减。
6. 谷歌靠全面布局拉开和竞争对手的距离
没有其他公司能在这么多领域同时取得突破:前沿模型、设备端推理、视频生成、开源权重、搜索集成。
谷歌设定节奏,逼得OpenAI、Anthropic和xAI只能选择专精某个方向。
每个实验室在所有前沿领域竞争的时代结束了。
7. Agent可观测性成为推理栈最激烈的竞争层
工程可观测性、安全可观测性、数据可观测性会融合成一个学科。
Agent 需要统一的视角来监控代码执行、威胁检测和数据血缘。
这是我在2025年预测的融合的开始:三个可观测性领域终于要合并了。
8. 到12月,30%的国际支付通过稳定币完成
跨境结算的效率提升太明显了,没法忽视。
随着主要市场的监管越来越清晰,稳定币会从加密货币的边缘走向全球贸易金融的核心,在B2B交易中取代传统的SWIFT系统。
9. Agent的数据访问模式会让现有数据库崩溃
代理对数据库和数据湖的查询量,至少比人类多一个数量级。
这种并发和吞吐量的激增,会迫使事务型和分析型数据库都要重新设计架构,才能应对AI自主系统的持续需求。
10. 数据中心建设达到美国GDP的3.5%
这个投资规模能和历史上的铁路扩张相提并论。
唯一可能拖慢建设的因素是信贷市场的风险感知,尤其是私人信贷市场。
这个资产类别的大规模增长突然显现出违约率上升的压力,可能成为最资本密集型基础设施项目的瓶颈。
11. 网络设计转向Agent优先
大部分开发者文档和很多网站会变成代理优先,而不是人类优先。
(GEO机会的意思?)
为什么?因为现在很多购买决策都是先通过代理研究来做的。
正门要为机器人设计,侧门才是给人用的。
这些预测里,你觉得哪个最可能实现?哪个最疯狂?
11 Predictions for 2026
Every year I make a list of predictions & score last year’s predictions. 2025 was a good year : I scored 7.85 out of 10.
Here are my predictions for 2026 :
1. Businesses pay more for AI agents than people for the first time.
This has already happened with consumers. Waymo rides cost 31% more than Uber on average, yet demand keeps growing. 1 Riders prefer the safety & reliability of autonomous vehicles. For rote business tasks, agents will command a similar premium as companies factor in onboarding, recruiting, training, & management costs.
2. 2026 becomes a record year for liquidity.
SpaceX, OpenAI, Anthropic, Stripe, & Databricks IPO, with SpaceX & OpenAI ranking among the ten largest offerings ever. The pent-up demand from 4+ years of drought finally breaks. Fear of disruption by fast-growing AI systems drives defensive acquisitions exceeding $25b as incumbents buy rather than build.
3. Vector databases resurge as essential infrastructure in the AI stack.
Multimodal models & world/state-space models demand new data architectures. Vector databases grow revenue explosively as they become the connective tissue between foundation models & enterprise data.
4. AI models execute tasks autonomously for longer than a workday.
According to METR, AI task duration doubles every 7 months. 2 Current frontier models reliably complete tasks taking people about an hour. Extrapolating this trend, by late 2026, AI agents will autonomously execute 8+ hour workstreams, fundamentally changing how companies staff projects.
5. AI budgets receive scrutiny for the first time.
Buying committees & boards push back on AI spend. Small language models & open-source alternatives rise in popularity as research labs determine how to specialize them for particular tasks, achieving state-of-the-art performance at a fraction of the cost. Developers prefer them for 10x cost reductions.
6. Google distances itself from competitors via breadth in AI.
No other company achieves breakthroughs across as many domains : frontier models, on-device inference, video generation, open-source weights, & search integration. Google sets the pace, forcing OpenAI, Anthropic, & xAI to specialize in response. The era of every lab competing on every frontier ends.
7. Agent observability becomes the most competitive layer of the inference stack.
Engineering observability, security observability, & data observability fuse into a single discipline. Agents require unified visibility across code execution, threat detection, & data lineage. This marks the beginning of the confluence I predicted in 2025 : the three observability spaces finally converge.
8. 30% of international payments are issued via stablecoin by December.
The efficiency gains in cross-border settlement are too large to ignore. As regulatory clarity improves in major markets, stablecoins move from the periphery of crypto to the core of global trade finance, displacing traditional SWIFT rails for a significant portion of B2B volume.
9. Agent data access patterns stress & break existing databases.
Agents issue at least an order of magnitude more queries to databases & data lakes than people ever did. This surge in concurrency & throughput requirements forces a redesign of the overall architecture for both transactional & analytical databases to handle the relentless demand of autonomous systems.
10. The data center buildout reaches 3.5% of US GDP in 2026.
The scale of investment mirrors the historical expansion of the railroads. The only factor that slows overall building is perceived risk within the credit market, particularly in the private credit market. The massive growth in that asset class suddenly shows strains of increasing default rates, creating a potential bottleneck for the most capital-intensive infrastructure projects.
11. The web flips to agent-first design.
Most developer documentation & many websites become agent-first rather than people-first. This shift occurs because many purchasing decisions are now informed first through agentic research. Consequently, the front door needs to be designed for robots, while the side door caters to people.
谷歌正在准备把 Gemini 放到 Google TV 上
支持用自然语言找片、回顾剧情、支持模糊描述来找不记得片名的内容
Gemini 回复的时候会动态组合文本、图片、视频,提供丰富的屏幕内容。
帮助学习内容,提供带旁白的交互式概览与“深度解析”
自然语言检索 Google Photos 的照片
支持语音优化电视设置,比如屏幕太暗了,声音有点小之类的
会先在部分 TCL 电视推出,随后扩展到其他 Google TV 设备




[开源推荐] Claude Code Router: 为 Claude Code 提供一个灵活的路由代理层。让用户在保留 Claude Code 原有界面、工具调用能力和官方持续更新的同时,将实际的 AI 请求路由到各种第三方模型提供商,实现模型解锁、成本优化、性能调整和功能扩展。
项目背景与目的
Claude Code 能力很强,但其默认依赖 Anthropic 的官方模型,面临费用较高、使用限额等问题(说白了就是贵!)。
Claude Code Router 通过本地代理服务器的方式拦截 Claude Code 的请求,根据用户配置自动或手动路由到更适合的模型(如更便宜的 DeepSeek、更快的 Groq 或本地 Ollama 等),同时保持 Claude Code 的完整体验。
主要特点
· 多提供商支持:兼容 OpenRouter、DeepSeek、Ollama、Gemini、Groq、Volcengine、SiliconFlow 等多种 API。
· 智能路由:根据任务场景自动选择模型,例如:
· 默认任务 → 廉价高性价比模型(如 DeepSeek Chat)。
· 复杂推理(Think 模式) → 更强推理模型(如 DeepSeek Reasoner)。
· 长上下文 → 大上下文窗口模型(如 Gemini)。
· 后台任务、图像处理或网页搜索等专项路由。
· 请求/响应转换:内置多种 transformer,确保不同提供商的 API 格式兼容(例如工具调用、最大 token 限制等)。
· 动态切换:在 Claude Code 中直接用 /model 命令实时切换模型。
· CLI 与 UI 管理:提供 ccr model 交互式模型管理、ccr ui Web 配置界面,以及预设分享配置。
· 插件与自定义:支持自定义 transformer 和路由脚本,实现高级逻辑。
· CI/CD 集成:无缝支持 GitHub Actions,用于自动化代码审查、PR 处理等。
· 其他:环境变量激活、详细日志、非交互自动化模式。
工作原理
在本地启动一个代理服务器(默认端口 3456)。用户通过 ccr code 启动后,Claude Code 的所有请求都会被重定向到这个代理。代理根据配置文件(~/.claude-code-router/config.json)中的路由规则、transformer 和提供商设置,将请求转发到目标 API,并转换响应返回给 Claude Code,用户无需修改 Claude Code 本身,即可“自由选择”底层模型,同时享受官方功能更新。
开源地址
github.com/musistudio/cla…