原创 python五 函數
函數 在數學中函數就是完成了數字的某項變換,輸入參數,它就可以輸出一個結果。 在編程中,函數同樣也有類似的作用。它的作用也是爲了完成某個功能,當有大量重複代碼時,就可以使用函數來解決, 當需要精簡代碼邏輯時也可以使用函數。 定義函數
原创 LZO的安裝
hadoop-lzo的安裝: ---------------------- 1.本地庫的安裝 獲取到安裝包lzo-2.10.tar.gz 後 執行下列命令: tar -zxvf
原创 python -- jupyter Notebook 的使用
在安裝好anaconda後,也附帶的安裝好了Jupyter Notebook,可以在開始欄裏看到. 通過點擊啓動欄裏的Jupyter Notebook或在命令行裏輸入 jupyter notebook就可以啓動 Jupyter Noteb
原创 Hadoop(四) MapReduce 原理
目錄 MapReduce的核心思想 Hadoop MapReduce InputFormat TextInputFormat KeyValueTextInputFormat NLineInputFormat 自定義InputFormat
原创 python四 list tuple set dict(列表,元組,集合,字典)
目錄 list tuple set dict(列表,元組,集合,字典) 列表(List) 列表的創建 列表索引,切片 列表操作 Python 元組 字典:dict 字典定義 字典操作 list tuple set dict(列表,元組,集
原创 python 基礎一 python的安裝與基礎語法
Python是一種解釋型、面向對象、動態數據類型的高級程序設計語言。 Python由Guido van Rossum於1989年底發明,第一個公開發行版發行於1991年。 像Perl語言一樣, Python 源代碼同樣遵循 GPL(GNU
原创 Intellij IDEA tomcat 啓動時 中文日誌內容亂碼
結合網上現有的資料,只需要修改配置文件中的下面幾處(見下圖) 不需要修改 apache-tomcat-8.5.50\conf\logging.properties中的內容 修改好後重啓就可以了
原创 Hadoop(三) HDFS 使用
目錄 準備工作 HDFS API的使用 org.apache.hadoop.fs.FileSystem org.apache.hadoop.fs.Path org.apache.hadoop.fs.FsStatus org.apache.
原创 Hadoop(五) HDFS 序列化 壓縮 存儲文件類型
目錄 Hadoop 序列化 Hadoop序列化定義步驟 示例 Hadoop 壓縮 爲什麼要在Hadoop中引入壓縮 Hadoop 支持的壓縮類別 各種壓縮方式詳解 Gzip壓縮 lzo壓縮 snappy壓縮 bzip2壓縮 壓縮參數配置
原创 java 簡介,環境配置,基礎數據類型
1.java開發環境配置 jdk安裝,在官網上找到對應系統的jdk版本並下載,然後按照提示安裝好即可。在jdk安裝好後需要進行環境變量的配置 一般配置這幾個就可以了 JAVA_HOME: java的安裝目錄
原创 python 基礎二 基本的數據類型,字符串,字符編碼
Python有五個標準的數據類型: Numbers(數字) int(整型) 在混合計算時,Python會把整型轉換成爲浮點數。 float(浮點型) co
原创 Hadoop(一) 簡介 集羣搭建
目錄 Hadoop簡介 1.1Hadoop產生的背景 1.2 Hadoop的優勢 1.3 Hadoop組成 1.4 大數據技術生態體系圖 Hadoop集羣安裝 linux的集羣配置: 參照linux集羣的配置 安裝相應的軟件 hado
原创 python五 文件操作
#文件的操作流程爲 打開-->操作--->關閉 #file = open(filename, mode, encoding) # filename:file_name變量是一個包含了你要訪問的文件路徑的字符串值。 # mode:
原创 Hadoop(二) HDFS 底層原理解析
目錄 HDFS概念 HDFS優缺點 優點 缺點 HDFS 架構/角色 Client:客戶端 NameNode:master,它是一個主管、管理者 DataNode Secondary NameNode hdfs啓動過程 啓動腳本分析 H