原创 Java8 JDK8

1、爲什麼要學Java8? 1.1  簡介 速度更快(底層的數據結構做了一些更新和改動,垃圾回收機制內存結構做了一些改動) 代碼更少(增加了新的語法Lambda表達式) 強大的StreamAPI 便於並行 最大化減少空指針異常(Optio

原创 Hive drop table時沒有反應

Hive drop table時沒有反應 Hive drop table時沒有反應,於是強制中斷。 網上找了很久的方法,終於在一個大神那裏找到了解決之法。但寫的略簡單,下面對其進行補充。 mysql> show variables l

原创 Source、Channel、Sink有哪些數據類型

                                                              Source、Channel、Sink有哪些類型       Flume Source     Source類型 

原创 Python3 Flask框架

                                              Flask框架 內容原創,侵權必究。學習分享請註明地址:https://blog.csdn.net/Jackie_ZHF/article/deta

原创 Hadoop之block副本放置策略 Rack機架感知源碼

注意:block副本放置策略相關描述在Hadoop官網和源碼實現與描述不一致。官網是第一個和第二個副本在同一機架上,第三個在不同機架上 更多隨意。但是具體實現如下:•Block的副本放置策略    –第一個副本:放置在上傳文件的DN;如果

原创 誤刪HBase數據如何搶救?

數據保護當誤刪數據發生時候,不管三七二十一,第一要務是進入hbase shell,執行如下命令:如果誤刪一張表的有多個family裏的數據,需要都執行一下:alter 'tt', { NAME => 'f1', KEEP_DELETED_

原创 CDH5.4離線安裝

Cloudera Manager離線部署CDH文檔 目錄:Cloudera Manager離線部署CDH文檔... 1目錄:... 1一、說明... 2二、系統環境搭建... 31、網絡配置(所有節點)32、SSH免密碼登錄... 33、

原创 Python Hadoop使用時注意的坑-- MRJob框架及python環境運行

時間有限複雜的問題簡單說,什麼都不如來乾貨~使用MRJob框架 時用網上說的提交任務到集羣的命令,程序會跑着掛掉。。。報143 127 的錯誤!!後來才發現正確的是:本地運行命令 python my

原创 HBASE 的二級索引之— —Global Indexing

 二級索引之— —Global Indexing轉載自朋友的博客 技術分享,https://my.oschina.net/u/3511143/blog/1808831  侵權必究,轉載請說明1.1  說明在HBase中,只有一個單一的按照

原创 Linux磁盤掛載--解決Linux擴容和磁盤IO負載問題

Linux磁盤掛載解決擴容問題        增量數據的情況下,使得硬盤容量滿載 解決磁盤IO的負載問題        現有的硬盤IO負載滿載下,爲了增加多個磁盤來分攤壓力,如寫入一個磁盤的目錄下根據業務劃分,寫入掛載到不同磁盤的多個路徑

原创 Maven

注:本文章來自轉載 http://www.cnblogs.com/hzg110/p/6936101.html 前言:目前所有的項目都在使用maven,可是一直沒有時間去整理學習,這兩天正好有時間,好好的整理一下。一、爲什麼使用Maven這

原创 Python Hadoop的Wordcount入門示例

        Hadoop 框架是使用Java編寫的但是我們仍然需要使用像C++、Python等語言來實現 Hadoop程序。儘管Hadoop官方網站給的示例程序是使用Jython編寫並打包成Jar文件,這樣顯然造成了不便,其實,不一定

原创 Hive優化

轉載請註明出處:https://blog.csdn.net/jackie_zhf/article/details/79999613 Hive 優化核心思想:把Hive SQL 當做Mapreduce程序去優化以下SQL不會轉爲Mapred

原创 HDFS完全分佈式搭建

HDFS完全分佈式搭建[Hadoop1.X]一、環境準備【如果沒有準備好 請查閱然後準備以下環境】1、 JDK (前面已經安裝好了)2、 Linux(前面已經安裝好了)3、 準備至少3臺機器,我們用的是4臺(通過克隆虛擬機;配置好網絡JD

原创 Linux Python3安裝部署和pip安裝

Linux3.5安裝【爲什麼在Python3.X中選擇這個版本,因爲本人要使用TensorFlow深度學習框架,而TensorFlow只支持python3.5版本】       如果本機安裝了python2,儘量不要管他,使用python