Andrew Ng
@AndrewYNg · 3d ago新课程:《文档 AI:从 OCR 到智能体驱动文档提取》。本课程由我担任执行主席的 @LandingAI 参与构建,并由 David Park 和 Andrea Kropp 讲授。
世界上大部分数据都蕴含在 PDF、JPEG 等文档格式中。这门短期课程将教你如何构建精准的智能体驱动工作流来处理它们:先将文档分解,由智能体仔细审查每个部分,再通过多轮迭代提取信息。
传统的光学字符识别 (OCR) 能捕获文本,但会丢失来自表头、图表标题或列阅读顺序的上下文信息。在了解 OCR 的局限后,你将使用 LandingAI 的智能体驱动文档提取 (ADE) 框架来处理文档。ADE 从视觉层面将页面当作图像来解析信息并提取字段。
你将学到的技能:
- 构建智能体,将非结构化文件转换为结构化的 Markdown/HTML 和 JSON
- 使用 ADE 解析复杂数据,如表单、手写体或方程式
- 依据预定模式,将提取的信息映射到命名字段,并借助边界框完成锚定与验证
- 部署结合事件驱动文档处理的 RAG 应用
快来学习智能处理财务发票、医疗记录或学术论文等文档的最佳工具吧:
deeplearning.ai/short-courses/…
03:31
57
304
2,017
2,116
545


