【python數據分析】獲取or可視化

目錄

1,準備

2,數據獲取

1,例子(正常)

2,例子2(出來異常)

3,數據存取與洗滌

open . close

json 文件存取

openpyxl  (讀取xlsx)

數據清洗(pandas庫爲主)

4,數據的分析和可視化


1,準備

  • 安裝:Python,MySQL,pytcharm
  • 基礎介紹:
    • 1,if__name__=='__name__'
    •  
      def A():
          print(“你好”)
      
      if__name__=='__name__'
          A()
       
      >>你好
      
      其他文件調用A()
      
      >>你好
      • 2,列表解析,

      • 3,裝飾器

      • 4,遞歸函數

      • 5,面向對象

2,數據獲取

  • 1,例子(正常)

    import requests
    import pandas as pd
    import bs4 import BrautifulSoup
    
    #1.請求數據
    
    def get():
        url =
        headers=
        data=
        data =requets.get(url,headers,data)
        return data
    
    
    #2.解析數據
    
    def jiexi(data):
        soup = BrautifulSoup(data,'lxml')
        
        #2.1數據爬取
        A1 =soup.xpath('//li')
        A2 =soup.xpath('//li')
        return A1,A2
    
    #3.存儲數據
    def save_data(A1,A2):
    
        with open('boowk.json','w') as fp:     >>打開創建寫入名稱
        json.dump(books,fp)                >>引入寫入字典
    
    
    #end開始爬取
    
    def run():
        data=get()
        A1,A2 = jiexi(data)
        save_data(A1,A2)
    
    if__name__=='__name__'
        run()
    
    
    

    2,例子2(出來異常)

  • try:
        代碼塊,所有邏輯
        pass
    
    excepy Exception:
        上面代碼出錯,知道執行當前內容
    
    
    while True:
        try:
            inp=input("輸入整數")                          #代碼塊,所有邏輯
            i=int(inp)
    
        excepy Exception as e:                 #錯誤返回 ==e
             pringt(e)                         #上面代碼出錯,知道執行當前內容

     

3,數據存取與洗滌

  • open . close

    f =  open('hello.txt','w')

    w  ---寫入

    a  ---文件最後寫入

    r   ---只讀

    r+  --讀+寫

    wb  ----二進制寫入

    打開文件
    f . write('寫入內容') 寫入內容
    f .close() 關閉文件

     

  • json 文件存取

  • json.dumps 和json.loads
1.漢子存取

data ={'lang','漢字'}

json_str =json.dumps(data,ensure_ascii =False)

data >>
{'lang','漢字'}
  • sort_key排序
json_str =json.dumps(data,surt_keys=FTrue)
  • indent 美化輸出
    json_str =json.dumps(data,indent = 4)

     

  • openpyxl  (讀取xlsx)

    from openpyxl import load_workbook
    
    f =load_workbook('abc.xlsx')  --打開文件
    
    print("表名:",wb.get_sheet_names())  ----查看所有表名
    
    

     

  • 數據清洗(pandas庫爲主)

  • 具體看  Python數據分析-02

4,數據的分析和可視化

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章