1. 介紹：

兩者都允許遠程客戶端使用多種編程語言，通過HiveServer或者HiveServer2，客戶端可以在不啓動CLI的情況下對Hive中的數據進行操作，兩者都允許遠程客戶端使用多種編程語言如java，python等向hive提交請求，取回結果（從hive0.15起就不再支持hiveserver了），但是在這裏我們還是要說一下hiveserver
HiveServer或者HiveServer2都是基於Thrift的，但HiveSever有時被稱爲Thrift server，而HiveServer2卻不會。既然已經存在HiveServer，爲什麼還需要HiveServer2呢？這是因爲HiveServer不能處理多於一個客戶端的併發請求，這是由於HiveServer使用的Thrift接口所導致的限制，不能通過修改HiveServer的代碼修正。因此在Hive-0.11.0版本中重寫了HiveServer代碼得到了HiveServer2，進而解決了該問題。HiveServer2支持多客戶端的併發和認證，爲開放API客戶端如JDBC、ODBC提供更好的支持。

2. 啓動hiveserver2

    1. [hadoop@wjxhadoop001 ~]$ cd /opt/software/hive/bin/
    2. [hadoop@wjxhadoop001 bin]$ hiveserver2 
    3. which: no hbase in (/opt/software/hive/bin:/opt/software/hadoop/sbin:/opt/software/hadoop/bin:/opt/software/apache-maven-3.3.9/bin:/usr/java/jdk1.8.0_45/bin:/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/hadoop/bin)

3. 連接JDBC

    1. [hadoop@wjxhadoop001 bin]$ ./beeline -u jdbc:hive2://localhost:10000/default -n hadoop

    2. which: no hbase in (/opt/software/hive/bin:/opt/software/hadoop/sbin:/opt/software/hadoop/bin:/opt/software/apache-maven-3.3.9/bin:/usr/java/jdk1.8.0_45/bin:/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/hadoop/bin)
    3. scan complete in 4ms
    4. Connecting to jdbc:hive2://localhost:10000/default
    5. Connected to: Apache Hive (version 1.1.0-cdh5.7.0)
    6. Driver: Hive JDBC (version 1.1.0-cdh5.7.0)
    7. Transaction isolation: TRANSACTION_REPEATABLE_READ
    8. Beeline version 1.1.0-cdh5.7.0 by Apache Hive
    9. 0: jdbc:hive2://localhost:10000/default>

使用SQL

1. 0: jdbc:hive2://localhost:10000/default> show databases;
2. INFO  : Compiling command(queryId=hadoop_20180114082525_e8541a4a-e849-4017-9dab-ad5162fa74c1): show databases
3. INFO  : Semantic Analysis Completed
4. INFO  : Returning Hive schema: Schema(fieldSchemas:[FieldSchema(name:database_name, type:string, comment:from deserializer)], properties:null)
5. INFO  : Completed compiling command(queryId=hadoop_20180114082525_e8541a4a-e849-4017-9dab-ad5162fa74c1); Time taken: 0.478 seconds
6. INFO  : Concurrency mode is disabled, not creating a lock manager
7. INFO  : Executing command(queryId=hadoop_20180114082525_e8541a4a-e849-4017-9dab-ad5162fa74c1): show databases
8. INFO  : Starting task [Stage-0:DDL] in serial mode
9. INFO  : Completed executing command(queryId=hadoop_20180114082525_e8541a4a-e849-4017-9dab-ad5162fa74c1); Time taken: 0.135 seconds
10. INFO  : OK
11. +----------------+--+
12. | database_name  |
13. +----------------+--+
14. | default        |
15. +----------------+--+
16.1 row selected

編寫java代碼

1. import java.sql.Connection;
2. import java.sql.DriverManager;
3. import java.sql.ResultSet;
4. import java.sql.Statement;

5. public class JdbcApp {
6.     private static String driverName = "org.apache.hive.jdbc.HiveDriver";

7.     public static void main(String[] args) throws Exception {
8.         try {
9.             Class.forName(driverName);
10.         } catch (ClassNotFoundException e) {
11.             // TODO Auto-generated catch block
12.             e.printStackTrace();
13.             System.exit(1);
14.         }
15.         Connection con = DriverManager.getConnection("jdbc:hive2://192.168.137.200:10000/default", "", "");
16.         Statement stmt = con.createStatement();

17.        //select table:ename
18.         String tableName = "emp";
19.         String sql = "select ename from " + tableName;
20.         System.out.println("Running: " + sql);
21.         ResultSet res = stmt.executeQuery(sql);
22.          while(res.next()) {
23.             System.out.println(res.getString(1));
24.         }
25.         // describe table
26.         sql = "describe " + tableName;
27.         System.out.println("Running: " + sql);
28.         res = stmt.executeQuery(sql);
29.         while (res.next()) {
30.             System.out.println(res.getString(1) + "\t" + res.getString(2));
31.         }
32.     }
33. }

4. 默認參數

Hiveserver2允許在配置文件hive-site.xml中進行配置管理，具體的參數爲：

1. hive.server2.thrift.min.worker.threads– 最小工作線程數，默認爲5。  
2. hive.server2.thrift.max.worker.threads – 最小工作線程數，默認爲500。  
3. hive.server2.thrift.port– TCP 的監聽端口，默認爲10000。  
4. hive.server2.thrift.bind.host– TCP綁定的主機，默認爲localhost

配置監聽端口和路徑

1.  sudo vi hive-site.xml
2. <property>
3.   <name>hive.server2.thrift.port</name>
4.   <value>10000</value>
5. </property>
6. <property>
7.   <name>hive.server2.thrift.bind.host</name>
8.   <value>192.168.48.130</value>
9. </property>

來自@若澤大數據

banana`

發佈了44 篇原創文章 · 獲贊 30 · 訪問量 5萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HiveServer2 JDBC客戶端連接Hive數據庫

1. 介紹：

2. 啓動hiveserver2

3. 連接JDBC

4. 默認參數

C#開源的兩款功能強大的錄屏神器

認知提升的方法

螞蟻面試：Springcloud核心組件的底層原理，你知道多少？

IDEA和Maven打jar包方式

hive的Reduce join與Map join

阿里雲服務器安裝Azkaban郵件配置遇的坑

HiveQL基礎語法（聚合，分組函數）

Sqoop增量導入導出總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結