原创 數據分析過程01
數據分析過程:轉換處理原始數據,可視化呈現 過程鏈: 問題定義 數據抽取 數據清洗 數據轉換 數據探索 預測模型 模型評估/測試 結果可視化和闡述 解決方案部署
原创 關於Hadoop的核心組件
三大核心組件:HDFS+YARN+MR HDFS:分佈式文件系統 1、文件被切成多塊,分別存儲在多個服務器的本地文件系統中 2、對用戶屏蔽了一些底層的信息(文件被切成了幾塊?存放在那些服務器上)提供了一個抽象的統一接口 3、文件可以保存多
原创 Linux下安裝MySQL
1.首先先去MySQL官網去下載合適的tar包,之後用Xftp工具上傳,上傳後解壓上傳的tar包 2.將解壓後的文件複製到 /usr/local/mysql路徑下(自己查看了很多網上的教程,說複製文件的之後,文件名後面一定不要加/,結果
原创 04-運算符
Python語言支持以下類型的運算符: 算術運算符 比較(關係)運算符 賦值運算符 邏輯運算符 位運算符 成員運算符 身份運算符 運算符優先級 注意:Python2.x 裏,整數除整數,只能得出整數。如果要得到小數部分,把其中一個數
原创 Python爬取網頁信息並且存儲到MySQL數據庫
今天在執行一小Python爬取某網頁的信息的時候,結果,報錯了,根據錯誤,應該是數據庫連接失敗,密碼有錯誤 檢查程序密碼應該沒錯呀,然後直接訪問數據庫,我的天,試了好多次,都快放棄自己了,昨晚明明成功的呀 然後打開Navicat,查看
原创 DOM解析XML
使用xml.dom解析xml 文件對象模型(Document Object Model,簡稱DOM),是W3C組織推薦的處理可擴展置標語言的標準編程接口。 一個 DOM 的解析器在解析一個 XML 文檔時,一次性讀取整個文檔,把文檔中所
原创 03-變量類型
變量賦值 Python 中的變量賦值不需要類型聲明。 每個變量在內存中創建,都包括變量的標識,名稱和數據這些信息。 每個變量在使用前都必須賦值,變量賦值以後該變量纔會被創建 #!/usr/bin/python # -*- cod
原创 Shell Printf命令~07
Shell Printf命令~07 printf 命令模仿 C 程序庫(library)裏的 printf() 程序。 標準所定義,因此使用printf的腳本比使用echo移植性好。 printf 使用引用文本或空格分隔的
原创 02-基本語法
Python 標識符 在 Python 裏,標識符有字母、數字、下劃線組成。 在 Python 中,所有標識符可以包括英文、數字以及下劃線(_),但不能以數字開頭。
原创 08-for循環
Python for循環可以遍歷任何序列的項目,如一個列表或者一個字符串。 for iterating_var in sequence: statements(s)#!/usr/bin/python # coding=utf-8
原创 Shell 流程控制~09
Shell 流程控制~09 和Java、PHP等語言不一樣,sh的流程控制不可爲空 if else if else 語法格式: if condition then command1 command2
原创 05-條件語句
if 判斷條件: 執行語句…… else: 執行語句…… 其中"判斷條件"成立時(非零),則執行後面的語句,而執行內容可以多行,以縮進來區分表示同一範圍。 else 爲可選語句,當需要在條件不成立時執行內容則可以執行
原创 01-中文編碼
對於安裝好的centos中有自帶的Python,如果版本還可以的話,就不需要在linux上重新安裝別的版本的Python了 首先我們可以先查看自帶的Python的版本 python --version 然後可以查看它所在的位置 wh
原创 07-while循環
while 判斷條件: 執行語句…… #!/usr/bin/python # _*_ coding: utf-8 _*_ #循環while的練習 count = 0 while (count < 5 ):