-
ETL
(數據倉庫技術)
鎖定
- 軟件名稱
- Extract, transform, load
- 過 程
- 抽取、清洗、轉換、裝載
- 應 用
- Informatica、OWB、DataStage、Beeload
- 數據集成
- 快速實現ETL
ETL簡介
ETL是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,為企業的決策提供分析依據, ETL是BI(商業智能)項目重要的一個環節。
ETLETL與ELT
ETL所描述的過程,一般常見的作法包含ETL或是ELT(Extract-Load-Transform),並且混合使用。通常越大量的數據、複雜的轉換邏輯、目的端為較強運算能力的數據庫,越偏向使用ELT,以便運用目的端數據庫的平行處理能力。
ETL工具
ETL(orELT)的流程可以用任何的編程語言去開發完成,由於ETL是極為複雜的過程,而手寫程序不易管理,有越來越多的企業採用工具協助ETL的開發,並運用其內置的metadata功能來存儲來源與目的的對應(mapping)以及轉換規則。
工具可以提供較強大的連接功能(connectivity)來連接來源端及目的端,開發人員不用去熟悉各種相異的平台及數據的結構,亦能進行開發。
當然,為了這些好處,付出的代價便是金錢。
ETL參見
- 數據倉庫(DW)
- 在線分析處理(OLAP)
- 數據挖掘(DM)