ETL 資料流水線

數據

從多個資料來源擷取資料、經過清洗轉換、品質驗證後載入目標資料庫,包含排程執行和錯誤處理機制。

apiclidb
為什麼需要 OSOP

ETL 流水線的穩定性直接影響資料品質。OSOP 定義每個階段的轉換邏輯和品質檢查點,當某個環節失敗時自動重試或通知,確保資料流的可靠性。

Workflow Steps (4)

1
Extract from API
api
2
Transform & Clean
cli
3
Schema Validation
system
4
Load to Database
db

Connections (4)

Extract from APITransform & Cleansequential
Transform & CleanSchema Validationsequential
Schema ValidationLoad to Databaseconditionalvalidation.passed == true
Extract from APITransform & CleanfallbackUse cached data on API failure
4
Steps
4
Connections
4
Node Types