爲什麼用datastage而不直接用sql

原創

2020-02-23 15:06

我在用datastage的時候發現有些stage例如join stage,aggregate stage,sort stage等，
不就實現了order by ,sum ,連接等sql功能嗎，那麼我幹嘛不在數據源的時候就做好這些事情呢，何必用這些stage呢？

例如我搞個odbc stage，自定義 sql select count(1),a from A group by a不就可以了嗎

--

我也感覺得是性能問題。比如用lookup做關聯匹配的速度，比在Oracle裏面用存儲過程處理要快，當然原因有很多方面的，比如DS服務器性能和數據倉庫的服務器性能差異，網絡因素等。

--

數據量不大的話，在數據庫端做確實比較好。
數據量大的話，全丟給數據庫壓力吃不消（況且數據庫和etl平臺不是同一機器），比如100G和100G的表做關聯。。。數據庫會down掉
在ds平臺的話，中間過程全丟到數據庫服務器外，通過etl的並行機制，效率大大提高

--

常見的一個場景是：數據源非關係數據庫，例如文本、EXCEL，這時候你就需要用這些STG實現JOIN、AGGREGATE、SORT。。。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

datastage教程

轉自：http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0602zhoudp/ 傳統的數據整合方式需要大量的手工編碼，而採用 IBM

挂树上programing

2020-07-07 03:33:26

datastage中Orchadmin命令的使用

datastage中Orchadmin命令的使用（轉）轉自：http://www.blogjava.net/xichengmylove/archive/2009/06/11/135256.html Orchadmin is a

2020-07-06 13:05:51

用shell script調用dsjob的實例

轉載自：http://www.blogjava.net/xichengmylove/archive/2007/07/18/130982.html #!/bin/ksh ####### #######################

2020-07-06 13:05:51

DATASTAGE運行作業時用join連接時出現執行讀操作以獲取塊頭分區警告

jonNewRecord,0: APT_IOPort::readBlkVirt：執行讀操作以獲取塊頭，分區 0，[fd 4]，返回了 -1，具有 errno 64（Unknown error）找到目錄，刪掉臨時文件即

2020-06-21 14:29:12

odbcad32.exe怎麼安裝mysql數據源驅動（Datastage 設置mysql數據源連接）

1.首先下載mysql-connector-odbc-8.0.13-win32.msi 網址：https://dev.mysql.com/downloads/connector/odbc/ 2.下載vc_redist.x86.e

2020-06-21 13:48:19

Datastage裏如何設置odbc連接Sybase數據庫

1.首先參照該文章，在datastage服務器上安裝好sybase數據庫。 https://blog.csdn.net/qq_24805831/article/details/85163264 2.找到E:\Sybase\ini

2020-06-21 13:48:08

使用DSXImportService.sh在Datastage服務端導入dsx文件

DSXImportService.sh在engine層ASBNode/bin目錄下，默認安裝路徑爲/opt/IBM/InformationServer/ASBNode/bin/, 此腳本的作用是將.dsx文件導入到指定的存儲庫中語法如

2020-06-21 10:06:23

datastage Transformer中使用IsValidDate函數會引發警告

2020-05-15 08:13:49

使用DSEXPORT.exe導出帶執行碼的dsx文件

2020-04-25 13:36:30

datastage db2 connector無法顯示properties標籤

2020-04-25 13:36:30

自定義datastage階段

2020-02-24 08:13:11

開發datastage parallel routine

2020-02-24 08:13:11

datastage教程

轉自：http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0602zhoudp/ 傳統的數據整合方式需要大量的手工編碼，而採用 IBM

挂树上programing

2020-07-07 03:33:26

datastage中Orchadmin命令的使用

datastage中Orchadmin命令的使用（轉）轉自：http://www.blogjava.net/xichengmylove/archive/2009/06/11/135256.html Orchadmin is a

2020-07-06 13:05:51

用shell script調用dsjob的實例

轉載自：http://www.blogjava.net/xichengmylove/archive/2007/07/18/130982.html #!/bin/ksh ####### #######################

2020-07-06 13:05:51

24小時熱門文章

最新文章

最新評論文章