記一次從oracle到hive的歷史數據遷移(一)

介紹一下具體場景

    需要從現有在用的oracle中將歷史數據遷移出來並導入到hive中,存在幾個問題:1、現有oracle數據庫在使用無法整個庫導出,數據庫服務器沒有權限;2、由於各個數據提供方的各次升級,oracle數據庫採取添加字段而不刪除字段的方式更新,而hive中建立的表數據結構要按新的來,也就是說oracle導出的數據到hive表中需要做字段對應。

    決定先將oracle導入到另一個oracle中,將oracle中表字段和hive中的表字段進行比對得到各個的對應關係,之後寫對應的sqoop語句對應利用ETL流程安裝賬期一天一天導入。 

    從一個oracle到另一個oracle導入的方案,利用大神寫出的sqluldr2 工具用來導出數據,導入利用

sqlldr 命令導入到另一個庫表中。

   導出的具體命令

sqluldr2.bin user=root/pwd@tnsname query="select /*+ parallel(8) */ * from table   " head=no File=/data/oracle/tmp/file 導出到本地目錄

  導入的具體命令

sqlldr root/pwd@@ip:1521/tnsname control=/data/oracle/shell/xxx.ctl 

data=/data/oracle/tmp/file

log=/data/oracle/log/file.log errors=0 rows=100000 bindsize=1024000000 direct=y;

xxx.ctl 是用來指定導入表的字段和分割符如下寫法

load data

truncate into table  tablename

Fields terminated by ',' #文件的列分隔符

TRAILING NULLCOLS

IP char(255), 

APPKEY char(255), 

PLATFORM char(255), 

PORTAL char(255), 

COMPANYID char(255) )


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章