文章
本文章深度解析了 OpenAI Sora 2 视频生成模型的提示词创作策略,旨在帮助用户高效产出符合预期的视频内容。文章首先阐明了详细提示词与简洁提示词各自的优势,强调了迭代优化的重要性。随后,详细介绍了 API 参数(如模型选择、分辨率、时长)的配置方法,并指出这些参数与文本提示词的内容描述是相互独立的。核心部分提供了行之有效的提示词结构,指导如何描述镜头的取景、景深、动作、灯光和色调,并结合简短与超详细的电影级提示词范例进行了深入讲解。文章还进一步探讨了如何通过视觉线索引导画面风格、精准控制动作时机、保持光线与色彩的一致性,以及如何利用图像作为视觉参考。最后,文章提供了对白与音效的描述方法,并介绍了 Remix 功能在迭代优化中的应用,为用户提供了实用的提示词模板和具体案例。
文章纠正了当前对提示词工程的普遍误解,指出其并非简单套用模板或依赖 AI 生成,而是一个系统化的设计、测试、优化过程。作者通过模仿雷军演讲和生成 YouTube 字幕的实际案例,详细演示了从设定目标、构思想法、编写提示词、测试、评估到迭代的完整流程。文章强调,能否准确评估提示词生成结果与目标之间的差距,并知道如何进行有效调整,是写好提示词的核心能力。同时指出,专业背景对于进行有效评估和优化至关重要,因为这有助于理解和判断结果的质量。文章为读者提供了实用的提示词开发方法论。
作者 Simon Willison 在 2025 年 10 月 7 日提出“凭感觉工程”(vibe engineering),旨在区分随意、不负责任的 AI 辅助编程(vibe coding)与经验丰富的专业工程师利用大语言模型(LLMs)进行高效、负责任的软件开发。文章指出,高效使用 LLMs 开发严肃软件项目是困难的,它实际上放大了自动化测试、事前规划、全面文档、良好版本控制、高效自动化流程、代码审查文化、管理技巧、高质量手动 QA、出色调研能力、快速部署预览环境、明确 AI 任务边界以及重新评估时间预估的直觉等 12 项优秀软件工程实践的重要性。作者认为,AI 工具会放大已有的专业能力,资深工程师能通过这些工具获得更高产出和更优效果,并希望“凭感觉工程”这一新词能明确专业 AI 开发与随意 AI 编程的界限,凸显其严肃性和复杂性。
本文从马克·安德森“软件吞噬世界”的预言出发,阐述了当前由人工智能驱动的软件革命,正以更深刻的方式“吞噬劳动力”。作者回顾了历史上的技术革新如何重新定义劳动,指出早期软件仅将“文件柜”数字化为“数据库”,而 AI 时代的软件则直接扮演“执行者”角色,完成端到端任务。文章强调,当前软件公司的销售主张已从“提供工具”转向“完成任务”,催生了基于“成果交付”的全新商业模式,例如客户服务、销售、法律、医疗等领域。此外,作者提出了“机会密度”框架,解释 AI 如何通过显著降低客户获取成本和商品销售成本,解锁过去因成本过高而不可行的商业模式。文章还探讨了 AI 在解决间歇性需求、士气低落工作、监管确定性和语言障碍等方面的独特优势,指出这场变革不仅提升效率,更将人力市场转化为软件公司巨大的商机,并引发对未来人类劳动价值的深思。
许多人错误地认为提示工程已过时,但作者指出对于复杂任务,系统性的提示工程仍至关重要。文章将提示工程定义为一个迭代过程——系统地设计、测试和优化提示,而非简单地使用静态模板。核心问题在于多数人难以评估 AI 输出与目标间的差距,或不知如何调整。作者提出了一个五步迭代循环:定义目标、构思方法、编写初版提示、测试、评估,并强调若不达标则循环往复。通过一个 YouTube 字幕生成器的实际案例,文章展示了迭代过程和 few-shot 示例的关键作用。最终,作者指出优秀提示工程师的关键在于识别差距并知道如何调整,这高度依赖于领域专业知识,而非简单收集模板。