原创 HIVE知識梳理(轉載)

作爲個人筆記增加了一些寫過的例子,歡迎補充。1、 order by, sort by, distribute by, cluster by 背景表結構 在講解中我們需要貫串一個 例子,所以需要設計一個情景,對應 還要有一個表結構和填充數據

原创 【hive】——Hive sql語法詳解

Hive 是基於Hadoop 構建的一套數據倉庫分析系統,它提供了豐富的SQL查詢方式來分析存儲在Hadoop 分佈式文件系統中的數據,可以將結構 化的數據文件映射爲一張數據庫表,並提供完整的SQL查詢功能,可以將SQL語句轉換爲MapR

原创 MapReduce的原理及執行過程

MapReduce簡介 MapReduce是一種分佈式計算模型,是Google提出的,主要用於搜索領域,解決海量數據的計算問題。 MR有兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,即可實現分佈式計

原创 Hive 中parse_url的使用

1、Hive的parse_url函數 parse_url(url, partToExtract[, key]) - extracts a part from a URL 解析URL字符串,partToExtract的選項包含[HOST,P

原创 五年計劃

2018.8-2022.7五年計劃 1. 成爲一個人工智能領域的專家. 2. 說一口流利的英語. 3. 堅持健身,每個月徒步一次或旅行一次. 4. 找個有共同價值觀的人結婚.

原创 tableau 連接python

最簡單的方式就是裝一個現成的環境,anaconda,在裏面安裝兩個包 在C盤中搜索startup.bat,放在桌面比較方便,運行彈出此界面即可。   Done!!! 參考資料1:https://onlinehelp.tableau