原创 數據分析過程01

數據分析過程:轉換處理原始數據,可視化呈現 過程鏈: 問題定義 數據抽取 數據清洗 數據轉換 數據探索 預測模型 模型評估/測試 結果可視化和闡述 解決方案部署    

原创 關於Hadoop的核心組件

三大核心組件:HDFS+YARN+MR HDFS:分佈式文件系統 1、文件被切成多塊,分別存儲在多個服務器的本地文件系統中 2、對用戶屏蔽了一些底層的信息(文件被切成了幾塊?存放在那些服務器上)提供了一個抽象的統一接口 3、文件可以保存多

原创 Linux下安裝MySQL

1.首先先去MySQL官網去下載合適的tar包,之後用Xftp工具上傳,上傳後解壓上傳的tar包 2.將解壓後的文件複製到 /usr/local/mysql路徑下(自己查看了很多網上的教程,說複製文件的之後,文件名後面一定不要加/,結果

原创 04-運算符

Python語言支持以下類型的運算符: 算術運算符 比較(關係)運算符 賦值運算符 邏輯運算符 位運算符 成員運算符 身份運算符 運算符優先級 注意:Python2.x 裏,整數除整數,只能得出整數。如果要得到小數部分,把其中一個數

原创 Python爬取網頁信息並且存儲到MySQL數據庫

今天在執行一小Python爬取某網頁的信息的時候,結果,報錯了,根據錯誤,應該是數據庫連接失敗,密碼有錯誤 檢查程序密碼應該沒錯呀,然後直接訪問數據庫,我的天,試了好多次,都快放棄自己了,昨晚明明成功的呀 然後打開Navicat,查看

原创 DOM解析XML

使用xml.dom解析xml 文件對象模型(Document Object Model,簡稱DOM),是W3C組織推薦的處理可擴展置標語言的標準編程接口。 一個 DOM 的解析器在解析一個 XML 文檔時,一次性讀取整個文檔,把文檔中所

原创 03-變量類型

變量賦值 Python 中的變量賦值不需要類型聲明。 每個變量在內存中創建,都包括變量的標識,名稱和數據這些信息。 每個變量在使用前都必須賦值,變量賦值以後該變量纔會被創建 #!/usr/bin/python # -*- cod

原创 Shell Printf命令~07

Shell Printf命令~07 printf 命令模仿 C 程序庫(library)裏的 printf() 程序。 標準所定義,因此使用printf的腳本比使用echo移植性好。 printf 使用引用文本或空格分隔的

原创 02-基本語法

    Python 標識符 在 Python 裏,標識符有字母、數字、下劃線組成。             在 Python 中,所有標識符可以包括英文、數字以及下劃線(_),但不能以數字開頭。               

原创 08-for循環

Python for循環可以遍歷任何序列的項目,如一個列表或者一個字符串。 for iterating_var in sequence:    statements(s)#!/usr/bin/python # coding=utf-8

原创 Shell 流程控制~09

Shell 流程控制~09 和Java、PHP等語言不一樣,sh的流程控制不可爲空 if else if else 語法格式: if condition then     command1     command2  

原创 05-條件語句

if 判斷條件:     執行語句…… else:     執行語句…… 其中"判斷條件"成立時(非零),則執行後面的語句,而執行內容可以多行,以縮進來區分表示同一範圍。 else 爲可選語句,當需要在條件不成立時執行內容則可以執行

原创 01-中文編碼

對於安裝好的centos中有自帶的Python,如果版本還可以的話,就不需要在linux上重新安裝別的版本的Python了 首先我們可以先查看自帶的Python的版本 python --version 然後可以查看它所在的位置 wh

原创 06-循環語句

原创 07-while循環

while 判斷條件:     執行語句…… #!/usr/bin/python # _*_  coding: utf-8 _*_ #循環while的練習 count = 0 while (count < 5 ):