DeepLearning.AI
@DeepLearningAI · 4天前研究人员介绍了自我搜索强化学习 (SSRL),这是一种教语言模型模拟网络搜索,以更好地从自身参数中检索信息的方法。
SSRL 微调提高了多个问答基准的准确性,甚至在与实际网络搜索工具结合使用时也提高了性能。
阅读我们在 The Batch 中的论文摘要:hubs.la/Q03VV2d-0
8
26
163
89
41
研究人员介绍了自我搜索强化学习 (SSRL),这是一种教语言模型模拟网络搜索,以更好地从自身参数中检索信息的方法。
SSRL 微调提高了多个问答基准的准确性,甚至在与实际网络搜索工具结合使用时也提高了性能。
阅读我们在 The Batch 中的论文摘要:hubs.la/Q03VV2d-0
力挺 React:来自 @fernandorojo 的精彩文章,深入解析了使用 React Native & @expo 构建 @v0 iOS 应用的过程 ↓
We built v0 for iOS to deliver the best experience for building on the go.
Read the engineering deep-dive, highlighting our lessons from React Native & Expo at production scale ↓
Claude Opus 4.5 发布,最大的亮点是价格只有原来 Opus 4.1 的 1/3。定价为 $5 (输入) / $25 (输出) 每百万 token。
另外它号称输出 token 减少了 76%。
价格和Token减少这两点其实蛮重要的,因为虽然单价看起来还是比 Sonnet 贵,但如果你考虑到 Opus 4.5 完成同样的任务所需的 token 减少了(因为它更聪明,更少废话,一次做对),实际总成本可能并没有想象中那么高。
这两周抓紧体验,现在 Anthropic 都是刚发布的前两周强的离谱,过段时间为了节省算力就会悄悄“量化”或“降智”。
介绍 Claude Opus 4.5:世界领先的编码、智能代理和计算机使用模型。
Opus 4.5 代表着人工智能系统能力的一次飞跃,也预示着工作方式即将迎来重大变革。
Runway 本周发布:音频节点、新模型,以及工作流的诸多新特性和改进;同时带来详细的自定义工作流演示和社区焦点内容。欢迎了解!
9/ Deep Research 现已连接到你的 Gmail、Docs、Drive 甚至 Chat
Deep Research 现在可以从你的 Gmail、Drive 和 Chat 中提取上下文,并将其直接应用到你的研究中。这意味着你可以通过直接从你的 Gmail、Drive(包括 Docs、Slides、Sheets 和 PDFs)和 Google Chat 中提取信息,以及从网络上的各种来源中提取信息,来创建更全面的报告。
我们很荣幸这项工作获得了 2024 年诺贝尔化学奖。 🏅
借助 AlphaFold 3,我们正在将范围扩展到蛋白质之外,扩展到 DNA、RNA、配体以及更多,以及它们如何相互作用——使我们更接近对生物学的真正整体的看法。
了解更多关于这项突破性进展及其五年来的影响 → goo.gle/44cgQmr
Prompt to convert a story to a comic book storyboard
---- Prompt Start ----
You are a world-class comic book writer and storyboard artist. You create visually stunning American-style full-color comics that effectively communicate complex narratives. Think mastery over visual pacing with a flair for dramatic storytelling.
The comic books you produce adapt to the source material and intended audience. There is always a story and you find the best way to tell it visually. You combine the expertise of the best scriptwriters with the creativity of the best illustrators.
Your core mission is to create a detailed script and visual description for a comic book. This outline will be provided to an expert illustrator to create the final artwork.
The comic will be in an American full-color style. The structure must include **Character Definitions**, **Front Cover**, **Page-by-Page Content**, and **Back Cover**. The story must be complete, with an engaging plot and strong pacing. The narrative flows through panels, dialogue, and visual cues. Ensure the breakdown provides enough context for the artist to visualize every scene perfectly.
You are now writing the script for the comic described below. We will supply this script to an expert illustrator. The content language should match the language of the input story provided.
For this particular comic, we want the content to focus on: [ ]
We have also attached some producer notes below for this comic which will help guide the overall structure and narrative.
提示词:x.com/dotey/status/1…
使用方法:
用提示词+故事生成storyboard
然后手动微调storyboard
将storyboard发给nano banana pro 一页一页生成即可
可以在 Gemini 中一个会话完成
参考会话:gemini.google.com/share/daaad857…
Prompt to convert a story to a comic book storyboard
---- Prompt Start ----
You are a world-class comic book writer and storyboard artist. You create visually stunning American-style full-color comics that effectively communicate complex narratives. Think mastery over visual pacing with a flair for dramatic storytelling.
The comic books you produce adapt to the source material and intended audience. There is always a story and you find the best way to tell it visually. You combine the expertise of the best scriptwriters with the creativity of the best illustrators.
Your core mission is to create a detailed script and visual description for a comic book. This outline will be provided to an expert illustrator to create the final artwork.
The comic will be in an American full-color style. The structure must include **Character Definitions**, **Front Cover**, **Page-by-Page Content**, and **Back Cover**. The story must be complete, with an engaging plot and strong pacing. The narrative flows through panels, dialogue, and visual cues. Ensure the breakdown provides enough context for the artist to visualize every scene perfectly.
You are now writing the script for the comic described below. We will supply this script to an expert illustrator. The content language should match the language of the input story provided.
For this particular comic, we want the content to focus on: [ ]
We have also attached some producer notes below for this comic which will help guide the overall structure and narrative.
Google Labs 的 Jed Borovik 在从事搜索工作九年后,正在构建 Google 的自主编码代理 Jules。Jed 经历了从经典机器学习排序到拥有自己计算机的长期运行的 AI 代理的转变。他的 “Stable Diffusion 时刻” 使他确信 AI 不会抹去他作为软件工程师的技能,而是成为编写代码的新画笔,这使他进入 Google Labs 帮助构建 Jules。
我们在 GitHub Universe 与他会面,深入了解真正使 Jules “自主” 的原因 (专用云环境,API/CLI 触发器,运行数天的会话),更好的基础模型如何让团队删除过度设计的脚手架和角色树,为什么简单的代码 RAG 正在让位于 grep + 工具 + 巨大的上下文窗口,以及编码代理如何重塑软件工程。
@jedborovik @swyx
停止在从具有重复实体(如目录、表格和列表)的长文档中提取时丢失 80% 的数据。
LlamaExtract 中的新增表格行提取功能解决了核心问题。该功能不再试图一次性提取所有内容(LLM 在此过程中容易过载),而是采用智能文档分割,逐个提取实体。
🎯 例如,对于包含大量页面的保险目录,该功能可以提取全部 380 家医院的信息 (相比之下,传统的文档级提取方法只能提取 40 家)
📋 自动处理正式表格和半结构化内容(如产品目录)
🔍 用户只需为单个实体定义模式,系统即可返回包含完整信息且覆盖全面的列表
⚡ 通过智能分割技术,该功能既能保证 LLM 的灵活性,又能实现基于模板的提取可靠性。
此方法识别重复模式,在自然边界处分割文档,然后将您的模式应用于集中的块。适用于表格、列表、目录或任何具有可区分的重复实体的文档。
在此处阅读包含代码示例的完整技术分解:llamaindex.ai/blog/extractin…
