原创 Linux-SSH報錯:Could not resolve hostname node1: Name or service not know

Could not resolve hostname node1: Name or service not know 搭建集羣的時候,使用ssh + 主機名 報錯。 這個時候我已經修改了 錯誤前配置: /etc/hostname

原创 【Superset】00 寫在之前

寫在之前 各位小夥伴大家好,我是一個正在學習superset的萌新。 Supertset是在我尋找企業數據分析解決方案時候,在github上找到的一個開源項目。他也是github上BI相關獲得Star最多的項目。 他是由Airbn

原创 文本文件數據編碼

文本文件數據編碼 hive書用幾個很少出現在字段值中的控制字符,使用術語field來表示替換默認分隔符的字符 常使用分隔符 分隔符 名稱 說明 \n 換行符 對於文本文件而言,每一行是一條記錄,因此換行符可以分割數據。

原创 【Superset】01 安裝與配置

安裝與配置 開始之前 爲了減少維護的負擔,並且使用到Python較新的特性,Superset 已經拒絕在Python **2.***版本中的支持 ,僅在 ~=3.6版本上進行支持(現在Python 3.7 也可以很好的支持了)

原创 Linux-虛擬機使用:真機與虛擬機ping通

目的:使用SecureCRT連接虛擬機 我的目的是爲了使用SecureCRT來連接虛擬機。直接使用虛擬機的朋友們都知道,直接操作虛擬機有很多的不方便。比如回滾之前的信息等。 那麼使用SecureCRT連接虛擬機有一個前提,那就是:

原创 Python-strip(),lstrip(),rstrip()

去掉字符串中滿足要求的部分 function 含義 strip([chars]) 首尾去掉,滿足chars的部分 lstrip([chars]) 從左邊開始,去掉滿足chars的部分 rstrip([chars

原创 shell的變量功能(1)

Shell的變量功能 變量是bash環境中非常重要的一個玩意兒 什麼是變量 某一個特定的字符串代表不固定的內容。 用一個簡單的 "字眼" 來取代另一個比較複雜或者是容易變動的數據 變量的可變性與方便性 變量會根

原创 Hive筆記-數據類型

數據類型 Hive的數據類型,可以說有兩個大類:基本數據類型以及集合數據類型。 基本數據類型 名稱 說明 TINYINT 1個字節的整數 SMALLINT 2個字節的整數 INT 4個字節的整數 BIGI

原创 【MapReduce】Streaming Job Failed!

報錯發生情況: 用Python寫好了一個MR程序,使用Linux環境本地測試正常。 在Hadoop環境上測試就報錯。 我的環境: $hadoop version Hadoop 2.5.2 ... 執行指令: hadoop jar $HA

原创 Python練習題

#此練習題主要針對數字運算與轉換 #導入需要用到的方法們:求平方根sqrt(),floor()向下取數,trunc()截斷 from math import sqrt from math import floor from mat

原创 Python小程序練習---敏感詞測試

小程序需求說明 敏感詞文本文件 filtered_words.txt,裏面的內容爲以下內容: 北京 程序員 公務員 領導 牛比 牛逼 你娘 你媽 love sex jiangge 當用戶輸入敏感詞語時,則打印出 Freedom,否則打印出

原创 【Bug記錄】hadoop啓動失敗:hadoop-config.sh: Syntax error: word unexpected (expecting ")")

Bug背景 未修改任何配置的情況下,重啓hadoop biglucky@localhost>sh start-all.sh This script is Deprecated. Instead use start-dfs.sh and

原创 Python-Dictionary-創建字典的方式

字典 我們創建字典的方式有很多,根據需求不同,採用合適的方式才能夠事半功倍。 我使用的Python3.0 版本,所以較之2.X的版本,新增瞭解析式創建法。 1.{} 我稱這個方法爲一個花括號搞定法,此方法適合你知道字典中的內容已經是什麼

原创 【Bug記錄】Hadoop的WordCount結果不合並,不累加

Bug的背景 初學MR程序,一定是從WordCount開始的,跟着敲一遍,發現hadoop執行WordCount後,不對結果進行累加,這是怎麼一回事呢? Bug源碼 package mr; import java.io.IOExcept

原创 Python-struct.error: argument for 's' must be a bytes object

問題說明: 我使用的Python3.0版本,運行以下的代碼的時候出現了報錯。 #Python 3.0 F=open('data.bin','wb') import struct data=struct.pack('>i4sh',7,'s