通過Sqoop將Oracle中表導入到HDFS時報錯Error during import: No primary key could be found

我的Sqoop版本是1.4.6，在利用Sqoop將Oracle數據導入到HDFS時候回出現一些異常，因此我們我們要注意以下幾點：

sqoop import --connect jdbc:oracle:thin:@192.168.8.110:1521:orcl --table TRANS_GJJY02 --username sky --password 123456 -m 8 --target-dir /usr/input/

錯誤：ERROR tool.ImportTool: Error during import: No primary key could be found for table TRANS_GJJY02. Please specify one with --split-by or perform a sequential import with '-m 1'.

根據錯誤提示我們可以知道這是因爲Oracle表中的數據沒有設置主鍵。而針對這個問題有兩種傑解決方案：

方案一：老老實實地在Oracle表中設置主鍵，然後再執行這個導入語句，就不會出錯。

方案二：有些數據無法設置主鍵，比如很多的監測記錄數據，找不到唯一值，針對這種數據，我們可以根據上面的錯誤提示通過以下兩個方法來解決：

（1）將你的map個數設置爲1（Sqoop默認是4），命令如下：

sqoop import --connect jdbc:oracle:thin:@192.168.8.110:1521:orcl --username sky --password 123456 --table TRANS_GJJY02

--target-dir /user/sky/data --columns "IC_CARDNO,IC_TIME,IC_AMOUNT,IC_TYPE,ICLINE_NO,ICDEVICE_ID,VEHICLE_ID" -m

(2)使用--split-by，後面跟上表的最後一列名字。從而能夠對數據進行分行，命令如下：

sqoop import --connect jdbc:oracle:thin:@192.168.8.110:1521:orcl --username sky --password 123456 --table TRANS_GJJY02

--target-dir /user/sky/data --columns "IC_CARDNO,IC_TIME,IC_AMOUNT,IC_TYPE,ICLINE_NO,ICDEVICE_ID,VEHICLE_ID" --

split-by VEHICLE_ID

這兩種解決方法，推薦使用方法（2），因爲方法（1）只用一個map，效率太低，相比較而言，方法（2）可以自己設置map個數，效率會高一些。

參考資料：http://stackoverflow.com/questions/29138498/sqoop-import-without-primary-key-in-rdbms

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

通過Sqoop將Oracle中表導入到HDFS時報錯Error during import: No primary key could be found

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（一）部署K8s

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（三）數據卷掛載NFS（網絡文件系統）

logstash常見數據清洗配置

Eclipse錯誤：找不到或無法加載主類解決辦法

啓動ArcGIS Serer 端口衝突問題解決方法

Oracle查詢某一列的重複部分

Oracle去除重複數據的方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結