Spark2.0操作ES

原創

2018-12-10 21:09

ES提供了支持包來方便的操作ES。首先添加ES的依賴maven：
<dependency>
           <groupId>org.elasticsearch</groupId>
           <artifactId>elasticsearch-spark-20_2.11</artifactId>
           <version>6.2.0</version>
           <exclusions>
               <exclusion>
                   <artifactId>log4j-over-slf4j</artifactId>
                   <groupId>org.slf4j</groupId>
               </exclusion>
           </exclusions>
        </dependency>

然後在Spark程序中設置SparkConf，將ES的屬性設置好：

val sparkconf = new SparkConf().setAppName("sevs_spark3")
.set("spark.driver.userClassPathFirst", "true")
.set("spark.executor.userClassPathFirst", "true")
.set("HADOOP_USER_NAME", getProp("hbase.hadoop.username"))
.set("HADOOP_GROUP_NAME", getProp("hbase.hadoop.groupname"))
.set("es.index.auto.create", "true")
.set("es.nodes", "127.0.0.1")
.set("es.port", "9200")
.setMaster("local")

最後通過esRDD來讀寫ES，非常方便

def read_es(sc:SparkContext){
val rdd = sc.esRDD("test/login")
rdd.foreach(x=>{
println("######",x._1,x._2 )
})
}

def save_es(sc:SparkContext){
sc.parallelize(Seq("abc","def")).map(x=>{
val map = Map("hostIp" -> x, "remoteIp" -> x.concat("#"))
map
}).saveToEs("snprime_login/login")
}

Spark操作ES就是這麼簡單，趕快來試試吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Spark2.0操作ES

Spark sql操作Hive

Spark2.0操作ES

Timsort工作原理

simhash短文本去重

Spark保持HDFS示例

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結