智慧文件理解
AI ↔ AIOCR 提取、實體識別、關係對應與知識圖譜建構。
5 個節點 · 5 條連接enterprise
agentdbsystem
視覺化
OCR 提取代理人agent
將掃描 PDF 與圖像轉換為保留排版的結構化文字。
↓sequential→ 實體識別代理人
實體識別代理人agent
識別人物、組織、日期、金額與領域特定實體。
↓sequential→ 關係對應代理人
↓fallback→ OCR 提取代理人
關係對應代理人agent
偵測實體間的關係:所有權、僱傭關係、合約義務。
↓sequential→ 知識圖譜代理人
知識圖譜代理人agent
將提取的關係合併至具去重功能的持久化知識圖譜中。
↓sequential→ 結構化輸出
結構化輸出api
匯出 JSON-LD、CSV 或圖形資料庫三元組,供下游系統使用。
uc-document-understanding.osop.yaml
osop_version: "1.0"
id: "document-understanding"
name:"智慧文件理解"
description:"OCR 提取、實體識別、關係對應與知識圖譜建構。"
nodes:
- id: "ocr_extract"
type: "agent"
subtype: "worker"
name: "OCR 提取代理人"
description: "將掃描 PDF 與圖像轉換為保留排版的結構化文字。"
- id: "entity_recognition"
type: "agent"
subtype: "llm"
name: "實體識別代理人"
description: "識別人物、組織、日期、金額與領域特定實體。"
- id: "relationship_map"
type: "agent"
subtype: "llm"
name: "關係對應代理人"
description: "偵測實體間的關係:所有權、僱傭關係、合約義務。"
- id: "knowledge_graph"
type: "agent"
subtype: "llm"
name: "知識圖譜代理人"
description: "將提取的關係合併至具去重功能的持久化知識圖譜中。"
- id: "structured_output"
type: "api"
name: "結構化輸出"
description: "匯出 JSON-LD、CSV 或圖形資料庫三元組,供下游系統使用。"
edges:
- from: "ocr_extract"
to: "entity_recognition"
mode: "sequential"
- from: "entity_recognition"
to: "relationship_map"
mode: "sequential"
- from: "relationship_map"
to: "knowledge_graph"
mode: "sequential"
- from: "knowledge_graph"
to: "structured_output"
mode: "sequential"
- from: "entity_recognition"
to: "ocr_extract"
mode: "fallback"
label: "Low confidence entities, re-OCR with enhanced preprocessing"