作者:探碼科技狞衷, 原文鏈接: http://www.tianchiyiriyou.com/blog/580
隨著(zhù)企業(yè)信息化建設的發(fā)展,企業(yè)建立了眾多的信息系統以進(jìn)行內外部業(yè)務(wù)的工作坏挠,但是隨著(zhù)信息系統的增加堂飞,各自孤立工作的信息系統將會(huì )造成大量的冗余數據和業(yè)務(wù)人員的重復勞動(dòng)。企業(yè)該如何完成企業(yè)內部ERP腹鹉、CRM鲸浴、SCM领炫、數據庫搭屿、數據倉庫,以及其它重要的內部系統之間數據無(wú)縫共享和交換瓤计?如何實(shí)現外部數據的采集與鏈接艘款?ETL和數據集成兩種技術(shù)如何選擇芥魂?
ETL原本是作為構建數據倉庫的一個(gè)環(huán)節,負責將分布的、異構數據源中的數據如關(guān)系數據、平面數據文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉換、集成,最后加載到數據倉庫或數據集市中,成為聯(lián)機分析處理、數據挖掘的基礎。現在也越來(lái)越多地將ETL應用于一般信息系統中數據的遷移、交換和同步。
ETL中三個(gè)字母分別代表的是Extract、Transform、Load,即抽取、轉換、加載。(1)數據抽取:從源數據源系統抽取目的數據源系統需要的數據;(2)數據轉換:將從源數據源獲取的數據按照業(yè)務(wù)需求,轉換成目的數據源要求的形式,并對錯誤、不一致的數據進(jìn)行清洗和加工。(3)數據加載:將轉換后的數據裝載到目的數據源。
百度百科釋義:“數據集成是把不同來(lái)源漓蜗、格式、特點(diǎn)性質(zhì)的數據在邏輯上或物理上有機地集中,從而為企業(yè)提供全面的數據共享。”簡(jiǎn)單來(lái)說(shuō), 數據集成是將來(lái)自不同網(wǎng)站的數據聚合和管理到單個(gè)同類(lèi)工作流程的過(guò)程。該過(guò)程包括數據訪(fǎng)問(wèn),轉換,映射,質(zhì)量保證和數據融合。
數據集成是個(gè)統稱(chēng), 可以通過(guò)ETL的方法收集數據。 數據集成包含了:ETL、主數據管理、數據質(zhì)量監控篱镰、元數據管理、數據生命周期管理共五大功能模塊。
數據集成是包含ETL、主數據管理等大數據技術(shù)的融合,為組織提供了存儲在多個(gè)數據源中數據的統一視圖,而提取、轉換和加載(ETL)技術(shù)就是數據集成的早期嘗試。數據集成技術(shù)更加能夠應對企業(yè)持續變化的需求和大數據時(shí)代下不斷涌現的新型挑戰。
數據集成是信息系統集成的基礎和關(guān)鍵,現在,越來(lái)越多的現代企業(yè)已經(jīng)意識到商業(yè)數據集成在企業(yè)日常運作和管理中的重要性,全球著(zhù)名的IT企業(yè)如0racle、IBM, 數據開(kāi)發(fā)環(huán)境單一,工具環(huán)境無(wú)關(guān)性差等缺點(diǎn)。而且隨著(zhù)應用的不斷深入,對Microsoft和Sybase等都針對自己的產(chǎn)品提出了數據倉庫的數據集成解決方案。
探碼科技為各行業(yè)提供數據集成服務(wù)率挣,自主研發(fā)的智能采集系統是集網(wǎng)絡(luò )數據采集变汪,是一款基于ETL技術(shù)的數據集成工具,可通過(guò)Web頁(yè)面進(jìn)行數據ETL任務(wù)的開(kāi)發(fā)、調度、監控,并具有極好的擴展性和可靠性。探碼數據集成平臺適配各類(lèi)數據源令情,提供無(wú)侵入式的增量獲取功能,具有高速的數據集成能力。集分析和可視化為一體,確保您從網(wǎng)絡(luò )數據中獲得最大的洞察力和價(jià)值。
Web數據集成:徹底改變您使用網(wǎng)絡(luò )數據的方式
?