BestBlogs.dev 精选文章 第 28 期

👋 亲爱的读者朋友们,欢迎阅读本期AI领域精选文章!

本期,我们精选了AI领域的重要技术突破、产品创新和行业趋势。DeepSeek发布了具有671B参数的新一代MoE模型;OpenAI展示了多项重要技术进展;AI开发工具和智能体技术持续演进。让我们一起了解这些重要发展!

本周亮点

  1. DeepSeek-V3重磅发布,671B参数MoE模型(激活37B),在14.8T token上预训练,性能接近GPT-4和Claude-3.5,训练成本仅557.6万美元,并开源原生FP8权重。

  2. OpenAI十二天连续发布,推出o3模型、Sora视频生成、RFT微调技术等重要更新,展示了AI在数学、代码、视频生成等领域的进展。

  3. Anthropic研究表明,简单可组合的模式优于复杂框架;Hugging Face发布轻量级智能体库smolagents,简化AI智能体创建流程。

  4. RAG技术迎来创新升级,GraphReader、MM-RAG、CRAG等新框架涌现,通过图解、多模态、自我校正等技术显著提升性能。

  5. Bolt.new创造编程产品增长记录,两个月实现2000万美元ARR,通过浏览器端操作系统和AI代码生成技术降低编程门槛。

  6. AI语言学习迎来首个独角兽,Speak实现ARR近5000万美元,用户突破1000万,通过AI技术提供低成本、个性化的语言学习体验。

  7. AI绘图领域新秀Recraft以ELO评分1172登顶文生图竞技场,在图像质量和提示词贴合度方面超越Midjourney和Stable Diffusion。

  8. 行业领袖共话2025:微软CEO纳德拉预见AI基础设施竞争加剧;李飞飞强调数据和算力资源重要性;李想展望AI定义未来汽车产业。

  9. 智能体发展提速,2025年被预测为"智能体之年",多家公司在规划、可复用工作流、探索和评估等方面取得突破。

  10. 模型技术变革持续深化,小型高效模型大量涌现,推理定价持续下降,开源模型与专有模型性能差距显著缩小。

🔍 想深入了解这些精彩内容?欢迎点击对应文章,探索更多AI领域的创新与发展!

1

DeepSeek-V3 正式发布

DeepSeekmp.weixin.qq.com12-261081 字 (约 5 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
DeepSeek-V3 正式发布

DeepSeek-V3 是 DeepSeek 公司最新发布的自研 MoE 模型,拥有 671B 参数,激活 37B,并在 14.8T token 上进行了预训练。该模型在多项评测中表现优异,超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上与 GPT-4o 和 Claude-3.5-Sonnet 等顶尖闭源模型不相上下。DeepSeek-V3 在百科知识、长文本、代码、数学和中文能力等方面均有显著提升。此外,通过算法和工程创新,生成速度从 20 TPS 提升至 60 TPS,为用户带来更流畅的使用体验。API 服务价格也进行了调整,并提供了长达 45 天的优惠价格体验期。DeepSeek-V3 同步开源了原生 FP8 权重,支持多种推理框架,方便社区适配和拓展应用场景。DeepSeek 公司表示,将继续在 DeepSeek-V3 基座模型上打造更多功能,并持续与社区分享最新探索成果。

2

DeepSeek-V3 外网刷屏爆火,训练成本只有 600 万,把 AI 大佬都炸出来了

Founder Parkmp.weixin.qq.com12-273058 字 (约 13 分钟)AI 评分: 94 🌟🌟🌟🌟🌟
DeepSeek-V3 外网刷屏爆火,训练成本只有 600 万,把 AI 大佬都炸出来了

DeepSeek V3 是一款参数量为 671B 的 MoE(Mixture of Experts)模型,激活参数量为 37B,在 14.8T 高质量 token 上进行了预训练。该模型在多项评测中表现优异,超越了 Llama 3.1 405B 等开源模型,并与 GPT-4o、Claude 3.5 Sonnet 等顶尖闭源模型不相上下。DeepSeek V3 的训练成本仅为 557.6 万美元,远低于同类模型,且其 API 价格也极具竞争力。文章详细介绍了 DeepSeek V3 的架构优化、训练策略和性能表现,强调了其在资源受限情况下的高效表现,以及其在分布式推理和负载均衡方面的创新。

3

OpenAI 史无前例的发布会:连续 12 天发布内容全解析

十字路口Crossingmp.weixin.qq.com12-2816973 字 (约 68 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
OpenAI 史无前例的发布会:连续 12 天发布内容全解析

OpenAI 在连续 12 天的发布会中发布了多项重要技术和功能,其中最引人注目的是 o3 模型的发布,尽管成本高昂,但其性能远超现有模型。第九天的开发者更新中,结构化输出能力的提升为未来 AI agent 的发展奠定了基础。此外,OpenAI 还推出了 ChatGPT Pro 会员、Sora 视频生成功能、RFT 微调技术等,展示了 AI 技术在数学、代码、视频生成等领域的快速进步。发布会还探讨了 AGI 的定义演变,强调了学习能力的重要性。OpenAI 通过这次发布会再次引领了 AI 行业的发展方向,提振了整个行业的信心。

4

Anthropic 总结智能体年度经验:最成功的≠最复杂的

机器之心jiqizhixin.com12-313899 字 (约 16 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
Anthropic 总结智能体年度经验:最成功的≠最复杂的

Anthropic 在过去一年中与多个行业团队合作,系统研究了大模型智能体的开发与应用。他们发现,表现最出色的智能体并非建立在庞大复杂的框架或专业库之上,而是采用了简单、可组合的模式。文章详细介绍了智能体的定义、适用场景、构建模块以及多种工作流(如提示链、智能分流、并行处理、领导-执行者、评估-优化等),并强调了在开发过程中保持简单、透明和文档完备的重要性。Anthropic 建议开发者从直接使用大模型的 API 开始,逐步增加复杂性,只有在能够明显改善结果的情况下才考虑使用更复杂的智能体系统。

5

2024 年的智能体技术 [潜在空间现场直播 (Latent Space LIVE!) @ NeurIPS 2024]

Latent Spacelatent.space12-259969 字 (约 40 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
2024 年的智能体技术 [潜在空间现场直播 (Latent Space LIVE!) @ NeurIPS 2024]

本文总结了 2024 年大语言模型 (LLM) 智能体的现状,基于 Graham Neubig 教授在 NeurIPS 2024 期间潜在空间现场直播 (Latent Space LIVE!) 上的演讲。NeurIPS 2024 是神经信息处理系统大会,潜在空间现场直播是其上的一个小型会议。文章涵盖了 OpenHands(原名 OpenDevin)等公司的发展,以及智能体在各个领域中日益重要的作用,并探讨了智能体开发中八个长期存在的挑战。这些挑战包括智能体-计算机接口、人机交互、LLM 选择、规划、可复用的工作流程、探索、搜索和评估。文章还通过现场演示展示了编码智能体的实际应用,强调了它们在数据分析和软件开发等任务中的实用性。Neubig 教授的演讲指出,2025 年可能成为“智能体之年”,OpenAI、DeepMind 和 Anthropic 等主要参与者将取得重大进展。

6

RAG 七十二式:2024 年度 RAG 清单

阿里云开发者mp.weixin.qq.com12-2619751 字 (约 80 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
RAG 七十二式:2024 年度 RAG 清单

本文详细介绍了 2024 年度 RAG 技术的最新进展,包括 GraphReader、MM-RAG、CRAG、RAPTOR、T-RAG 等多个创新系统和框架。这些系统通过图解、多模态、自我校正等技术手段,显著提升了 RAG 的性能和应用范围。文章还提供了丰富的论文和项目链接,方便读者深入学习和研究。此外,本文还探讨了 RAG 技术在医学、金融、开放域问答等领域的应用,展示了其在复杂数据分析、长文本生成、多跳查询等方面的创新应用。

7

2024 年 AI 编程有多强?谷歌工程主管揭秘残酷真相

新智元mp.weixin.qq.com12-312680 字 (约 11 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
2024 年 AI 编程有多强?谷歌工程主管揭秘残酷真相

文章由谷歌工程主管 Addy Osmani 分享,探讨了 2024 年 AI 编程在软件开发中的实际应用和挑战。AI 编程工具主要分为两类:「引导程序(Bootstrappers)」和「迭代器(Iterators)」,前者用于快速生成初始代码,后者则专注于日常开发中的代码补全、重构和测试生成。尽管 AI 工具显著提升了开发速度,但高级工程师与初级工程师在使用这些工具时存在显著差异。高级工程师能够通过重构、优化和质疑 AI 生成的代码,确保其可维护性,而初级工程师则容易陷入「纸牌屋代码」的陷阱,导致代码在现实世界中崩溃。文章还提出了「70% 问题」,即非工程师在使用 AI 工具时,虽然能快速完成 70% 的工作,但剩下的 30% 往往需要深厚的专业知识。此外,AI 工具的使用可能会阻碍非工程师的学习,导致他们无法掌握基本的编程和调试技能。文章最后展望了未来 AI 辅助开发的趋势,特别是智能体(Agent)软件工程的兴起,认为 AI 将成为开发者的强大协作者,而非取代者。

8

smolagents:基于代码操作的简易智能体

Hugging Face Bloghuggingface.co12-311730 字 (约 7 分钟)AI 评分: 91 🌟🌟🌟🌟🌟

Hugging Face 发布了 smolagents,一个轻量级库,旨在赋予大型语言模型 (LLM) 智能体能力,使其能够通过编写代码来执行操作。该库简化了 AI 智能体的创建,这些智能体可以通过搜索 API 和其他工具与现实世界交互。文章阐述了 AI 系统中智能体的概念,说明了 LLM 输出如何控制工作流程,并介绍了从简单处理器到多步骤智能体的不同智能体级别。smolagents 强调简洁性、对代码智能体的一流支持以及与 Hugging Face Hub 的集成。它支持各种 LLM,包括开源模型,并通过 E2B 提供安全的执行环境。文章包含实际示例,例如构建旅行规划智能体,以及基准测试结果,展示了开源模型在智能体工作流程中的有效性。未来计划包括教程、最佳实践以及文本转 SQL 和多智能体协同等高级用例。

9

李继刚:当我们说「提示词」时,到底在说什么?

极客公园mp.weixin.qq.com12-268246 字 (约 33 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
李继刚:当我们说「提示词」时,到底在说什么?

本文由李继刚分享他在使用提示词与大模型交互中的经验,深入探讨了提示词的本质、设计及其对模型输出的影响。文章指出,提示词是人与 AI 沟通的专业语言,不同的提示词会带来不同的效果。李继刚通过两年与大模型的对话实践,将提示词定义为一种特殊的存在,而非简单的工具或生命,并将其比喻为人类认知宇宙与 AI 参数宇宙之间交互的“宇宙语”。他强调提示词不仅是交流工具,更是实现共振和超越的关键,通过构建合适的“场域”,引导大模型突破默认的输出路径,与人类的认知产生“共振”,从而产生惊艳效果。文章还介绍了如何利用“乔哈里视窗”框架优化与 AI 的对话,并探讨了 AI 进化对创业者和个人使用提示词的影响。最后,李继刚讨论了 AI 时代人类认知的变化,提出在与 AI 互动时保持共振态度,避免被 AI 带着走的重要性。

10

AI 掌控编码人类狂按 Tab,软件工程自主时代来临!OpenAI 董事长 Taylor 重磅长文

新智元mp.weixin.qq.com12-282875 字 (约 12 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
AI 掌控编码人类狂按 Tab,软件工程自主时代来临!OpenAI 董事长 Taylor 重磅长文

文章由 OpenAI 董事会主席 Bret Taylor 撰写,深入探讨了 AI 驱动的软件工程自主时代的到来。Taylor 指出,随着 AI 编程工具如 Devin 和 Cursor 的快速发展,软件工程师的角色正在从代码编写者转变为代码生成机器的操作者。他提出,未来的编程系统需要为这种工作流原生设计,并探讨了编程语言设计、形式化验证、测试和开发工作流在其中的作用。Taylor 强调,AI 不仅为人类创造了更多软件的机会,还让软件变得更加强大,呼吁软件工程领域积极探索和设计自主时代的新系统。

11

Recraft——AI 绘图领域的下一颗新星

人人都是产品经理woshipm.com12-303905 字 (约 16 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
Recraft——AI 绘图领域的下一颗新星

文章详细介绍了新兴 AI 绘图工具 Recraft 的崛起及其在 AI 绘图领域的潜力。Recraft 在 2024 年 10 月的文生图竞技场中以 ELO 评分 1172 的成绩登顶,超越了 Midjourney 和 Stable Diffusion 等知名模型,成为新一代“民选冠军”。其 V3 模型在图像生成质量、与提示词的贴合度以及人体解剖学精准度方面表现出色,尤其在生成复杂场景和长文本图像方面具有独特优势。此外,Recraft 凭借其“无 AI 感”美学和极简操作界面,迅速在小红书等平台上走红,总获赞数达到 218 万,远超 Midjourney 和 Stable Diffusion。文章还展望了 Recraft 的未来,认为其丰富的风格库和持续的功能优化将推动 AI 绘图行业的发展。

12

Speak:AI 语言学习的第一个独角兽,ARR 5000 万美元,用户超 1000 万

Founder Parkmp.weixin.qq.com12-2414794 字 (约 60 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
Speak:AI 语言学习的第一个独角兽,ARR 5000 万美元,用户超 1000 万

Speak 是 AI 语言学习领域的首个独角兽,近期完成 7800 万美元 C 轮融资,估值达 10 亿美元。其 ARR 接近 5000 万美元,年增长率 100%,用户超 1000 万,主要市场为韩国和日本,并逐步拓展至中国台湾。Speak 通过 AI 技术提供低成本、个性化的 1 对 1 语言学习导师,颠覆了传统语言学习模式。其语音识别系统能够有效处理口音问题,并提供快速、可靠的反馈,提升用户体验。Speak 的定价策略考虑了两个极端:一是让产品对大众极具吸引力,二是提供高端体验并收取更高费用。模型评估是 AI 开发中的关键环节,Speak 通过内部工具和评估循环来确保新模型的性能。Speak 与 Duolingo 解决的是不同的问题,Speak 专注于帮助非英语母语者提高流利度,而 Duolingo 则提供非正式的学习体验。未来,多模态音频技术是语言学习领域的关键,尽管目前仍处于早期阶段,但其潜力巨大。

13

Bolt.new:2 个月,0 到 2000 万美元 ARR,史上增长最快的编程产品

Founder Parkmp.weixin.qq.com12-2318519 字 (约 75 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
Bolt.new:2 个月,0 到 2000 万美元 ARR,史上增长最快的编程产品

Bolt.new 是一款基于浏览器的操作系统,结合 AI 代码生成技术,大幅降低了编程门槛,帮助用户快速构建和部署 Web 应用。其成功归因于基于浏览器的开发环境、AI 代码生成技术的突破,以及面向非专业开发者的市场定位。Bolt 通过结合 WebContainer 技术和 AI 模型,解决了配置本地开发环境的难题,特别适合新手开发者。其集成部署功能(如 Netlify)提供了极其流畅的用户体验,用户无需复杂操作即可快速上线网站。Bolt 的核心技术是在浏览器中运行的 WebAssembly 操作系统,使得开发环境快速且无需按分钟付费。AI 代码生成技术(如 Sonnet 3.5)已经足够成熟,能够生成高质量的代码,使得非技术用户也能轻松构建复杂的应用程序。Bolt 的开源版本 Bolt Local 成为测试新代码生成模型的主要工具,推动了社区对 AI 模型的评估和优化。Bolt 的错误处理和任务分解技术显著提升了用户体验,使其在复杂应用场景中表现出色。Bolt 通过提供完整的上下文信息,显著提升了 AI 编码工具的效率和实用性。灵活的定价策略(包括固定订阅和按需购买 token)满足了不同用户的需求,推动了收入的快速增长。Bolt 的设计和模型支持使其在寻找最简实现方案方面表现出色,减少了文件数量并提升了性能。团队的核心技术负责人 Dominic Elm 的跨领域经验在提示工程和多代理系统的开发中起到了关键作用。公司从 B2B 转向 B2C 的过程中,调整了运营策略,更加注重数据分析和用户体验。

14

用户增长 6 步法:我的 AI 创业增长实践

人人都是产品经理woshipm.com12-2813374 字 (约 54 分钟)AI 评分: 91 🌟🌟🌟🌟🌟

本文是一位资深产品经理分享其在 AI 创业项目“AI 快研侠”中应用“用户增长 6 步法”的实践经验。文章详细复盘了如何通过该方法实现用户冷启动、提升转化率、明确产品迭代和用户增长工作重心。作者通过拆解月付费用户数公式,明确了获客渠道、目标用户和研究场景的优先级,最终确定了增长的核心杠杆。重点运营小红书、知乎、公众号等平台,核心获取金融投研人群和产品经理这两部分高价值用户。通过 ICE 评分体系筛选出重点运营小红书平台和提升行业研究场景付费转化率作为关键增长策略。通过数据分析确定用户生成研究记录次数与付费转化率的关系,并找到“魔法数字”3,以此为基础设计用户增长策略,优化产品体验路径。通过边生成边输出的方式减少用户等待时间、增加微信订阅通知、自动检索参考资料以及放大用户生成研究报告正文环节的峰值体验。通过上瘾模型逐步优化产品,包括支持用户管理研究资料、设计奖励机制、引导用户行动等,提升用户体验。通过 AB 实验验证增长策略,如优化生成报告流程、调整视觉效果、建立有效触发渠道等,显著提升了转化率和用户留存。未来增长策略包括从 PC 端拓展到移动端、拓展搜索和阅读场景功能、整合内容 KOL 资源等。

15

2025 生成式 AI 平台交互体验观察(大语言模型篇)

人人都是产品经理woshipm.com01-024593 字 (约 19 分钟)AI 评分: 90 🌟🌟🌟🌟
2025 生成式 AI 平台交互体验观察(大语言模型篇)

文章从黑箱理论出发,探讨了大语言模型在输入、分析和输出模块中的交互体验设计。作者指出,尽管大语言模型的技术复杂且难以理解,但通过优化输入提示、减少等待时间、提供打断工具和增强生成内容的客观性,可以显著提升用户体验。文章还讨论了多模态输出和用户反馈在 AI 平台中的重要性,并展望了未来 AI 应用的发展方向。作者强调,尽管 AI 技术发展迅速,但用户体验设计仍然是确保 AI 产品成功的关键因素。

16

新年展望 2025:与 Mustafa Suleyman、Audrey Tang、Albert Gu、Hanno Basse 等 AI 领袖共话未来

deeplearning.aideeplearning.ai01-014021 字 (约 17 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
新年展望 2025:与 Mustafa Suleyman、Audrey Tang、Albert Gu、Hanno Basse 等 AI 领袖共话未来

本文由 Andrew Ng 撰写,汇集多位人工智能领袖的真知灼见,深入探讨了 2025 年人工智能的变革潜力。文章强调 AI 简化了软件原型设计,降低了开发成本,加快了小型应用的创建速度。文章还探讨了生成式 AI 在提升创造力方面的作用,尤其在艺术和视频制作领域。核心主题包括 AI 开发中安全、可访问性和定制化的重要性,以及 AI 革新学习和问题解决的潜力。文章最后呼吁读者积极学习和应用 AI,并强调原型设计的趣味性和教育意义。

17

2024 年人工智能重大进展:自主代理崛起,价格下跌,模型小型化,以及更多...

deeplearning.aideeplearning.ai12-253564 字 (约 15 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
2024 年人工智能重大进展:自主代理崛起,价格下跌,模型小型化,以及更多...

Andrew Ng 在 DeepLearning.ai 上的文章回顾了 2024 年人工智能领域的重大突破。虽然底层 AI 技术取得了进步,但应用的加速发展更为显著。能够进行推理、使用工具并控制桌面应用程序的自主代理系统已成为焦点。激烈的市场竞争大幅降低了模型价格,小型高效模型大量涌现。这一进展导致了技术前沿与尚未应用 AI 技术群体之间差距的扩大。Ng 对 2025 年的 AI 发展持乐观态度,前提是避免出台限制性法规,并鼓励持续学习以适应 AI 变革性影响。

18

潜在空间 2024 年终回顾

Latent Spacelatent.space12-3123747 字 (约 95 分钟)AI 评分: 91 🌟🌟🌟🌟🌟
潜在空间 2024 年终回顾

本文全面回顾了 2024 年人工智能领域的格局,重点关注 AI 工程的演进、主要 AI 参与者之间的竞争态势以及该领域的关键争论。文章强调了 AI 工程的蓬勃发展,例如 AI 工程师峰会和 GitHub 模型等平台的兴起。文章还探讨了 AI/ML 领域从研究导向转向工程导向的转变,大型预训练模型扩展的挑战以及推理时间计算的重要性。在竞争格局方面,OpenAI、Gemini 和 Anthropic 处于领先地位,文章指出了市场份额的显著变化以及价格战的影响。“小型模型”的定义也更加细化,其规模从 0.5B 到 5B 参数不等,私有测试集在评估大型语言模型中的作用也日益重要。

19

2024 年人工智能年终总结报告|Artificial Analysis

新智元mp.weixin.qq.com12-302328 字 (约 10 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
2024 年人工智能年终总结报告|Artificial Analysis

文章回顾了 2024 年人工智能领域的重大进展,重点介绍了大模型、图像生成和语音识别等方面的技术突破。OpenAI、Google、Anthropic 等公司在模型能力、响应速度和价格上展开了激烈竞争,推动了 AI 技术的快速迭代和普及。开源模型与专有模型的性能差距显著缩小,推理定价大幅下降,小模型也能达到大模型的智能水平。图像生成质量和多模态能力得到了显著提升,语音识别技术也达到了新的里程碑。文章最后展望了 2025 年 AI 技术的发展前景,提出了对 AGI(通用人工智能)的期待。

20

微软 CEO 纳德拉年终访谈!赞同黄仁勋,坦露与 OpenAI 分歧,揭秘夺回市场战略

智东西mp.weixin.qq.com12-2319032 字 (约 77 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
微软 CEO 纳德拉年终访谈!赞同黄仁勋,坦露与 OpenAI 分歧,揭秘夺回市场战略

微软 CEO 萨提亚·纳德拉在年终访谈中深入探讨了微软在 AI 和云计算领域的战略调整。纳德拉回顾了微软在搜索引擎、移动互联网和云计算领域的成功与失败,强调了成长型思维对公司重生的关键作用。他指出,微软因“傲慢”而衰败,但通过成长型思维和基于自身优势的战略调整,成功在云计算市场中找到了独特定位。在 AI 领域,纳德拉承认微软早期错失了 AI 投资的机遇,但通过与 OpenAI 的合作,微软找到了正确的方向,特别是在 Transformer 模型和自然语言处理方面。纳德拉还讨论了当前 AI 领域的竞争格局,指出 AI 基础设施和模型层面的竞争将非常激烈,但微软通过 Azure 和 Copilot 等产品重新夺回了市场份额。他预测 AI 应用层面的网络效应将更加明显,不同场景中会形成不同的网络效应。此外,纳德拉探讨了 AI 智能体在不同生态系统中的交互问题,特别是在操作系统层面的安全控制和用户授权。他还讨论了 AI 助手的未来发展,特别是记忆、工具使用和权限管理三个关键要素,并提到微软已经在企业环境中部署了多个 AI 助手,能够执行自主任务。纳德拉还分享了微软在 AI 领域的收入来源,主要来自 API 业务,尤其是 ChatGPT、Copilot 等应用的推理成本。他强调了微软与 OpenAI 的两年先发优势,并认为未来企业可能更倾向于轻资产运营,选择在他人的模型基础上进行开发。最后,纳德拉讨论了微软在资本支出、AI 加速器建设和模型规模化方面的策略,强调了软件密集型和多层次产品结构的重要性,并表达了对 Scaling Law 的支持。他还指出,微软不会重复造轮子,而是与 OpenAI 协同合作,专注于模型训练后的工作。

21

张鹏对谈汪华、袁进辉、胡修涵:2025 年,匍匐也要前进,活下来最重要

Founder Parkmp.weixin.qq.com12-3128946 字 (约 116 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
张鹏对谈汪华、袁进辉、胡修涵:2025 年,匍匐也要前进,活下来最重要

本文回顾了 2024 年 AI 行业的进展,尽管整体未达预期,但语音、视频赛道和 Agent 智能体等领域仍有显著发展。OpenAI 在技术突破和商业化方面取得重要进展,特别是 o1 和 o3 的逻辑推理能力备受关注。文章指出,创业公司需聚焦特定应用场景以应对竞争,国内大模型公司应比 Anthropic 更加聚焦,针对特定小领域进行优化。此外,文章还讨论了国内外 AI 创业环境的差异,指出国内在工具链和基础设施方面的不足,以及海外应用生态的逐步形成。

22

深度|李飞飞:数据和计算资源是 AI 创业的核心;你必须在其他人之前看到北极星,逆境而行,并保持真实

Z Potentialsmp.weixin.qq.com12-2717398 字 (约 70 分钟)AI 评分: 92 🌟🌟🌟🌟🌟
深度|李飞飞:数据和计算资源是 AI 创业的核心;你必须在其他人之前看到北极星,逆境而行,并保持真实

李飞飞在 Radical AI 创始人大师班中深入探讨了 AI 创业的多个关键要素。她首先强调了数据和计算资源在 AI 创业中的核心地位,指出数据来源和数据飞轮的建立是关键。接着,她分享了如何组建和管理创业团队,特别是在技术背景下的思维转变和团队沟通的挑战。李飞飞还强调了企业文化在创业中的核心作用,认为文化是公司长期稳定发展的基石。此外,她探讨了 AI 技术在娱乐、医疗、制造业等领域的广泛应用,并分享了她在产品开发和女性领导力方面的见解。最后,李飞飞将创业与人生旅程相类比,强调了找到并追寻“北极星”目标的重要性,并建议年轻人保持真实,勇敢面对逆境。

23

独家 | 与李想的 3 小时对谈(完整版)

腾讯科技mp.weixin.qq.com12-2732249 字 (约 129 分钟)AI 评分: 93 🌟🌟🌟🌟🌟
独家 | 与李想的 3 小时对谈(完整版)

在这篇与腾讯科技的对话中,理想汽车 CEO 李想详细阐述了他对人工智能和智能驾驶的深刻见解。李想认为,汽车将从工业时代的交通工具进化为人工智能时代的空间机器人,人工智能是未来竞争的关键。理想汽车在人工智能领域的投入巨大,研发投入的一半用于人工智能,并且在基座模型、端到端和 VLM 技术上处于全球领先地位。李想强调,理想汽车的目标是成为一家人工智能企业,而不仅仅是电动车企业,人工智能将定义未来的全部。他还讨论了 OpenAI 在人工智能领域的领先地位,特别是其在聊天机器人、推理者和智能体(Agent)等阶段的进展,并强调了基座模型在人工智能时代的重要性。李想构想的最终产品是“硅基家人”,并希望在有生之年实现这一目标。

24

拾象科技李广密:大模型竞赛格局已定,2025 年的竞争是争夺下一个 Google

Founder Parkmp.weixin.qq.com12-3025219 字 (约 101 分钟)AI 评分: 92 🌟🌟🌟🌟🌟

本文由拾象科技 CEO 李广密与财经作者张小珺的对话展开,深入探讨了 2024 年大模型竞赛的格局和 2025 年 AI 行业的发展趋势。文章指出,当前大模型竞赛已进入算力、模型和应用三方面并行发展的阶段,OpenAI、Anthropic 和 Perplexity 等公司正在争夺“下一个 Google”的地位。李广密预测,2025 年的核心主线将是 coding 和 agent,AI 公司将通过动态编排软件和重组生产力任务来推动创新。此外,文章还分析了 ChatGPT 的商业模式及其面临的挑战,强调了 context 在 AI 发展中的重要性,并展望了未来软件生成的新范式。最终,AI 公司的目标是通过信息、内容和任务的全能分发,超越 Google 成为新一代的超级助理。

25

2025 年 AI 工程师必读论文清单

Latent Spacelatent.space12-271946 字 (约 8 分钟)AI 评分: 93 🌟🌟🌟🌟🌟

本文推荐一份约 50 篇 AI 工程师必读论文清单,内容实用,贴合 2025 年的实际需求。清单分为十个部分,分别涵盖 AI 工程的关键领域:前沿大语言模型、基准测试、提示工程、检索增强生成 (RAG)、智能体、代码生成、视觉、语音、图像/视频扩散模型和微调。我们精选论文时注重实用性,避免了诸如《Attention is All You Need》之类的理论性强或已广为人知的论文。每个部分推荐五篇关键论文,并简要说明其重要性和实际应用。此外,我们还列出了其他值得关注的论文和资源,为 AI 领域的新手和资深从业者提供宝贵的参考。