原创 linux 安裝lrzsz

總是忘記命令,做個筆記 centos  安裝rzsz yum -y install lrzsz  

原创 phoenix 修改表字段

主要記錄下apache phoenix 修改表字段的一種變通方式,僅供參考   CREATE TABLE IF NOT EXISTS t_appversion ( f_region_id VARCHAR, f_province

原创 hive derby.log 位置

使用spark-sql連接hive 數據源 總會出現derby.log 文件,挺礙眼的。查了下資料 在$SPARK_HOME/conf/spark-defaults.conf 添加一下配置即可   spark.driver.extraJ

原创 pip install 指定國內鏡像

今天使用pip下載scrapy  巨慢,查了下資料,可以指定源加速下載 pip install  -i 第三方源 軟件包名 下載scrapy pip install -i https://pypi.tuna.tsinghua.e

原创 CentOs6 配置網易源

Linux 中安裝軟件方式有多種,比如rpm,安裝卸載軟件很方便,但有個小缺點,安裝軟件時可能會有依賴.參考了網上部分資料,選擇yum方式管理軟件。 閒話少說,以下爲具體過程 1、下載repo文件  cd /etc/yum.repos.d

原创 Spark Streaming場景應用-Kafka數據讀取方式

原文鏈接:https://my.oschina.net/u/1250040/blog/908571 概述 Spark Streaming 支持多種實時輸入源數據的讀取,其中包括Kafka、flu

原创 updates is listed more than once in the configuration 解決方法

刪除所有/etc/yum.repo.d/目錄下所有repo文件,重新更換一遍源解決 更換其他源參考 https://mp.csdn.net/postedit/44259343

原创 hive 動態分區無法刪除

 最近生產環境出現了一個錯誤,spark無法寫入數據的到hive報以下錯誤 Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: Invalid partition f

原创 Hadoop及HBase使用過程中的一些問題集

  本文是我在使用Hbase的過程碰到的一些問題和相應的解決方法,現將這些經過總結分析,以免日後忘記。hadoop新增節點 hadoop集羣要增加3個節點。在3臺主機分別配置了host、與集羣內所有機器的ssh登錄互信、jdk1.7 等。

原创 網絡基本功(二):細說交換機

網絡基本功(二):細說交換機   轉載請在文首保留原文出處:EMC中文支持論壇https://community.emc.com/go/chinese      介紹   本節介紹交換機的幀轉發技術,MAC地址表的維護方式,三種幀

原创 網絡基本功(一):細說網絡傳輸

網絡基本功(一):細說網絡傳輸   轉載請在文首保留原文出處:EMC中文支持論壇https://community.emc.com/go/chinese    介紹   常言道:欲練神功,必先練好基本功。之前做了一個關

原创 HDFS 原理、架構與特性

1:當前HDFS架構詳盡分析 HDFS架構 •NameNode •DataNode •Sencondary NameNode 數據存儲細節 NameNode 目錄結構 Namenode 的目錄結構: ${ dfs.name.dir

原创 spark1.6.0分佈式安裝

1. 概述 本文是對spark1.6.0分佈式集羣的安裝的一個詳細說明,旨在幫助相關人員按照本說明能夠快速搭建並使用spark集羣。   2. 安裝環境 本安裝說明的示例環境部署如下: IP 外網IP hostname

原创 HDFS文件讀寫過程

HDFS讀文件過程: 客戶端通過調用FileSystem對象的open()來讀取希望打開的文件。對於HDFS來說,這個對象是分佈式文件系統的一個實例。DistributedFileSystem通過RPC來調用namenode,以確定

原创 VMware克隆linux注意事項

VMware克隆linux基本上配置都不會有問題,唯一要改的就是網卡信息,防止和原網卡衝突。 1、修改網卡的MAC,一般可以到/etc/sysconfig/network-scripts/裏找到相應的網卡