上下文是下一代数据平台:为何“上下文图谱”是理解企业流程的关键
来自 Glean 创始人兼 CEO Arvind Jain 的文章。作为企业搜索和 AI 领域的领军人物,他认为:智能体若想在企业中真正落地并实现自动化,不能仅靠单纯的“数据”,必须依赖“上下文图谱”来理解业务流程的真实全貌。
核心观点:什么是“上下文图谱”?
Arvind 指出,企业数字化已经进入了一个新阶段。过去,我们关注的是存储在系统中的结构化数据(如 Salesforce 中的客户记录);现在,我们需要关注工作是如何实际发生的。
· 现状:大部分工作流程分散在通讯工具(Slack/Teams)、文档(Docs)、代码库和各种碎片化操作中。这些通常被称为“部落知识”,难以被记录。
· 定义:“上下文图谱”不仅仅是对数据的索引,它是对企业人、事、物之间关系的映射。它能理解谁负责什么账户、谁批准合同、哪个团队在处理突发事件。
· 价值: 它是 AI Agent 的导航地图。只有拥有这种上下文,AI 才能在复杂的企业环境中进行推理和行动。
Glean 的独特哲学:捕捉 “How” 而非 “Why”
Arvind 提出了 Glean 构建上下文图谱的方法论:
“你无法可靠地捕捉‘为什么(Why)’,但你可以捕捉‘如何(How)’。”
· Why(意图)难捕捉:意图往往存在于人的脑海中,或者隐含在零散的对话里,很难直接建模。
· How(过程)有迹可循:每一个操作都会留下数字足迹——文档的编辑、字段的更新、审批的流转。
· 通过 How 推导 Why:通过长期观察大量的“How”(操作模式和流程轨迹),系统可以反向推导出“Why”(业务逻辑和意图)。这就是 AI Agent 学习如何像员工一样处理工作的路径。
技术壁垒:构建上下文图谱为何困难?
Arvind 强调,这不仅仅是一个概念,而是一项高门槛的技术投资。要实现它,必须解决三个层次的难题:
· 全链路的可观测性:不能只看结果(如交易完成),要看过程。需要深度的连接器去捕捉跨应用的操作——比如在 Salesforce 更新交易前,员工在 Google Docs 改了什么,在 Slack 聊了什么。
· 原子级的活动数据:系统必须记录带时间戳的微小动作(编辑、评论、发送消息),并按时间顺序排列,以此作为原始素材。
· 从噪点中提取信号:这是最难的一步。系统需要从海量的碎片操作中,自动识别出“这是一个客户上线项目”或“这是一次产品发布”。
终局思维:下一代数据平台
Arvind 认为,“上下文图谱”只是拼图的一部分。为了支撑 智能体自动化,我们需要一个新的技术栈,这构成了一个全新的数据平台:
· 连接器 (Connectors): 用于观察。
· 索引 (Indexes): 用于快速检索。
· 图谱 (Graphs): 用于理解结构和关系。
· 记忆 (Memory): 用于记录 Agent 的执行轨迹和结果。
这个平台不是为了做报表或分析,而是为了作为智能体的脊梁,支撑它们在企业中可靠地执行任务。