Sqoop導入數據

原創

二胖与二妹的爱情

2018-08-27 16:26

1）導入 MySQL -> HDFS

(1) 全表導入

bin/sqoop import \

--connect jdbc:mysql://bigdata.ibeifeng.com:3306/testdb \

--username root \

--password root123 \

--table user \

--target-dir /input/import \

--num-mappers 1 \

--fields-terminated-by ","

bin/sqoop import \

--connect jdbc:mysql://bigdata.ibeifeng.com:3306/testdb \

--username root \

-P \ //不使用明文指定數據庫連接密碼

--table user \

--target-dir /input/import \ //指定數據導入到HDFS上的目錄

--delete-target-dir \ //如果目標目錄已存在，則先刪除

-m 1 \ //指定使用導入數據的map個數

--fields-terminated-by "," //目標文件的分隔符

(2) query，where子句必須有$CONDITONS(固定寫法) 查詢導入方式

bin/sqoop import \

--connect jdbc:mysql://bigdata.ibeifeng.com:3306/testdb \

--username root \

-P \

--query 'select id,account from user where account="fff" and $CONDITIONS' \

--target-dir /input/query \

-m 1 \

--delete-target-dir \

--fields-terminated-by "\t”

(3)增量導入

bin/sqoop import \

--connect jdbc:mysql://bigdata.ibeifeng.com:3306/testdb \

--username root \

--password root123 \

--table user \

--target-dir /input/append \

-m 1 \

--fields-terminated-by " " \

--check-column id \

--incremental append \

--last-value 2

**注意:

incremental append和-delete-target-dir不能一起用

2)MySQL -> Hive

bin/sqoop import \

--connect jdbc:mysql://bigdata.ibeifeng.com:3306/testdb \

--username root \

--password root123 \

--table user \

-m 1 \

--delete-target-dir \

--fields-terminated-by "\t" \

--hive-import \ //導入表到hive(使用默認的分隔符如果沒有設置)。

--hive-overwrite \ //如果hive存在表，就裏覆蓋現有的數據表。

--hive-database db01 \

--hive-table user

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

解決安裝sqoop後出現一些警告提示

Apache Sqoop 被設計用於在一個 Hadoop 生態系統與 MySQL、Oracle、MS SQL、Postgre SQL 和 DB2等關係型數據庫管理系統 (RDBMS) 中的結構化數據存儲之間傳輸數據。作爲 Hado

2020-07-08 12:33:16

Hadoop相關幫助文檔地址，留着以後查閱

Sqoop 用戶幫助文檔： http://sqoop.apache.org/docs/1.4.1-incubating/SqoopUserGuide.html

2020-07-08 04:57:44

Sqoop 1.4.7 的安裝部署(包含測試)

Sqoop 下載地址(這裏是1.4.7版本,1.4.7目前是最穩定的版本) (Sqoop2 的最新版本是 1.99.7。請注意，1.99.7 與 1.4.7 不兼容，且沒有特徵不完整) https://mirrors.tuna.

2020-07-08 02:22:11

sqoop 安裝配置（Hadoop2.4 + hive0.13）

1、下載 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar 2、配置環境變量 export SQOOP_HOME=/home/hadoop/sqoop-1.4.6 export PATH=$PATH:$SQ

刀砍磁感线

2020-07-07 11:21:22

sqoop 導出 hive分區表數據到 mysql

命令：./sqoop export --connect jdbc:mysql://localhost:3306/test --username root --password 123456 --table tablename --exp

刀砍磁感线

2020-07-07 11:21:22

sqoop從mysql導入數據到hive時tinyint字段自動變成Boolean解決方案

最近在做sqoop導出數據的時候,mysql中有的字段到hive中自動轉換成boolean類型了.這個需要解決,不然數據對不上. 查了查官方文檔,官方文檔裏有說明,這裏貼一下文檔. 27.2.5. MySQL: Import o

2020-07-07 00:28:03

java調用sqoop api用法

java調用sqoop有兩種用法，一是使用sqoop java api，二是使用runtime調用sqoop命令，但runtime比較難用，不推薦，以下是兩種使用sqoop Java api的方法。方法一、使用String[]傳

lishengping_max

2020-07-06 15:30:54

Hive底層文件存儲類型parquet

Hive作爲數據倉庫常用工具之一，在數據量級越來越大的時候，存儲問題會暴露出來。那麼在之前大部分爲了省事方便都會以TextFile*作爲存儲類型，此類型比較佔存儲，並且查詢效率並不是很高。爲了節省集羣的存儲空間，研究了各種存儲類型

2020-07-06 15:27:29

sqoop的安裝及簡單使用

一、說明 1、sqoop是sql to hadoop的縮寫。 2、連接傳統關係型數據庫和Hadoop的橋樑，把關係型數據庫的數據導入到 Hadoop 系統 ( 如 HDFS、HBase 和 Hive) 中；把數據從 Hadoop 系統裏

时不我待，一日千里

2020-07-06 04:31:20

sqoop使用過程中遇到的坑

一、mysql和hive互相當導入時遇到的注意：爲了避免其他問題最好先將hive配置文件下的hive-site.xml複製到sqoop配置文件夾下並保持一致； 1、錯誤一 19/06/05 10:03:38 ERROR hive.Hi

时不我待，一日千里

2020-07-06 03:53:24

sqoop之hive數據導入mysql

1、查詢hive表中的student數據及信息 hive> select * from student; OK 001 xiaohong 002 002 xiaolan 002 001 xiaohong 003 002 xiaolan

时不我待，一日千里

2020-07-06 03:53:24

sqoop之mysql數據導入hive

1、查看mysql表數據 mysql> select * from stu; +----------+------+----------+ | name | age | address | +----------+-----

时不我待，一日千里

2020-07-06 03:53:24

Sqoop--源數據含有默認換行符導致的數據不正確

問題描述使用sqoop導數導到hdfs中，使用Hive查詢發現數據多了，並且有數據錯位的現象。原因源數據中有’\n’換行符，導致被hive識別爲換行符。所以出現了記錄多並且數據錯位的現象。解決方法使用sqoop命令時加入

lishengping_max

2020-07-05 15:07:56

Sqoop併發控制及相關問題

一、控制參數 Sqoop 可以通過以下參數控制併發讀取的 Mapper 個數加快讀取速度。 sqoop import -m <mapper_num> --split-by pk 或者 sqoop import --num-ma

lishengping_max

2020-07-05 15:07:56

java api併發調用sqoop異常記錄

通過java api併發調用sqoop，發現如下相關異常 2020-07-03 15:10:44 [ pool-1-thread-6:350039 ] - [ ERROR ] Got exception running Sqo

lishengping_max

2020-07-05 15:07:56

24小時熱門文章

最新文章

最新評論文章