原创 SparkSQL中DataFrame的常用操作

SparkSQL中DataFrame的常用操作前言基礎操作類方法 Action基本函數(Basic Dataset functions)流式函數(streaming)強類型轉換(Typed transformations)弱類型轉

原创 Win10下安裝大數據開發環境 spark+hadoop+hive(實測可用)

Win10下安裝大數據開發環境 spark+hadoop+hive(實測可用)基礎環境安裝spark安裝Hadoop安裝hive安裝總結參考博客 基礎環境安裝 首先,我們需要搭建軟件的運行環境,本文中所使用的軟件均需要運行在Jav

原创 hive 創建和刪除庫、表

hive 創建和刪除庫、表前言hive 庫操作hive表操作參考博客 前言 本文主要介紹hive 中操作庫和表的語句。 hive 庫操作 查看數據庫:show databases 創建數據庫:create database if

原创 Scala創建新的空DataFrame

Scala創建新的空DataFrame前言實現參考博客 前言 本文主要是對Scala中創建空DataFrame的方式進行介紹,以下將會列舉不同的代碼示例 實現 方式一: /** * 創建一個空的DataFrame,代表

原创 hive 創建臨時表和往表插入數據

hive 創建臨時表和往表插入數據前言實現 前言 本文講述瞭如何將生成的DataFrame數據批量插入hive表。 實現 往hive表中插入數據有兩種方式,一種是向指定數據庫、數據表中寫入數據, hiveContext.sql("