原创 Python之標準異常及常用異常實例

      在Python開發過程中,經常會遇到各種各樣的報錯情況,所以瞭解Python中的各種報錯就很有必要。小白最近整理了一下Python中經常遇到的報錯情況,並列舉了案例,如下表格,還有一些報錯情況,待嘗試~ AssertionEr

原创 Git學習之刪除GitHub上的倉庫repository

       小白之前的博客中已經介紹了Git的基本使用,掌握之前的內容,就可以開始用起來啦!不過,在使用過程中,大家可能會在GitHub中創建很多測試respository,那麼如何刪除這些測試庫,小白這篇文章就介紹一下~ 1.打開需要

原创 服務器本地上傳,下載文件到hdfs裏面,並用shell腳本調用python

     如果將文件放到服務器中,那麼當遇到服務器下線的時候,之前所有做過的JOB都會面臨修改的問題,如何避免這種情況呢? 小白最近遇到這樣的問題,以下是解決方案。     將服務器上的文件上傳的HDFS上,在shell腳本調用時,再ge

原创 將CSV和TXT文件導入hive表中

        對於csv和txt文件導入hive表,區別在於二者的分隔符不同,這一點在建表語句中體現出來。下面是兩種方式的導入方式步驟: 1.將csv文件導入到hive表 (1)建表語句: USE database; CREATE T

原创 Python之DataFrame按照規則批量修改某列的數據

     在使用Python進行數據分析時,我們經常會看一個數據的分佈,然後對數據進行處理。比如說有一個場景: 以下數據是某個產品的提前預定期: import pandas as pd import seaborn as sns imp

原创 Python之字典遍歷

       字典也是我們在做數據分析時經常用到的類型,之前小白有總結過DataFrame的遍歷,這篇博文,小白整理了自己遍歷字典時的幾種方法。       衆所周知,字典是鍵值對的組合,那麼對字典的遍歷就自然而然的包含了對鍵和值的遍歷,

原创 Python之set遍歷

     set是一組數,無序,內容不能重複,通過調用set()方法創建,那麼如何對set集合進行遍歷呢? 1.簡單的set: s1 = set(['111', '222', '333']) 對於s1,是一組數,有幾種方法可以遍歷: f

原创 Python之Tuple遍歷

        小白之前博文已經寫了Dtaframe、set等的遍歷,這篇博文來總結下遍歷Tuple,Tuple一旦創建後,元素不可變,遍歷和List其實是一樣的,下面來看下吧~         首先,創建一個tuple: #creat

原创 Python之DataFrame遍歷

      在數據分析的過程中,往往需要用到DataFrame的類型,因爲這個類型就像EXCEL表格一樣,便於我們箇中連接、計算、統計等操作。在數據分析的過程中,避免不了的要對數據進行遍歷,那麼,DataFrame如何遍歷呢?之前,小白每

原创 Python之List遍歷

      List也是Python數據分析時經常用到的一種存儲類型,這篇博文小白主要分享List的遍歷。 首先,生成一個List: list = [111,222,333,444] 下面,用幾種方法來遍歷該List: (1)小白首先使

原创 Python之List的extend和append詳解

      在數據分析時,小白經常用到extend和append函數,但是經常兩種搞不清楚,每次都需要試一下,可能大家也有類似的疑問,總結一下,加深對兩個函數的理解。       extend和append函數是List列表的兩種對列表的

原创 Python之DataFrame輸出爲csv\txt\xlsx文件

      相信大家在用Python做完數據處理以及分析之後,大多數情況下需要導出到csv等文件中,方便再做其他展示操作。小白也是一步步經歷需要轉到csv、txt等文件中,以導入到HIVE表中,做後續的操作。這裏就來總結一下,Pyhton

原创 Python之class中init函數、self參數詳解

      小白在剛開始用class來創建對象的時候,不理解爲啥class中的方法都要先聲明一個__init__方法,而且方法裏都有self這個參數,後來,小白做了一個試驗,發現這兩個小的知識點有大的用處。      首先,init方法前

原创 Python內置函數之exec的內置語句用法(exec高階用法)

      小白在之前文章中有分享過exec的使用方式,這篇文章中,小白總結一下exec的高階用法。 先看一個遍歷: for i in range(10): print ("the result of i is: %d" % (

原创 Python中for循環--內置函數range和enumerate的用法

       在使用Python進行數據分析時,不可避免的要進行for loop,小白之前到這種時候一直都是用range(len())的組合進行遍歷,後來發現,Python內置函數enumerate也非常方便,下面就總結一下兩種方法的用法