原创 python基礎 class7(自動軌跡繪製、政府工作報告詞雲)

# coding=utf-8 # 自動軌跡繪製 # (行進距離,轉向判斷[0左:1右️],轉向角度,[r,g,b]rgb三色道,畫筆粗細) import turtle as tur fp = open('軌跡.txt', '

原创 python爬蟲基礎class 2(中國大學排名)

    import requests import bs4 def getdata(url): try: r = requests.get(url, timeout=30) r.

原创 python基礎 class9

   

原创 python基礎 class6(基本統計值計算、文本詞頻統計)

  # 不定長度輸入 def getNum(): nums = [] iNumStr = input('輸入數字:') while iNumStr != '': # 空字符結束

原创 樣本方差、母體方差、樣本標準差、母體標準差

方差和標準差是概率與統計學裏經常用到的知識 在網上看到不少關於方差的研究和討論,所以這裏整合一下   方差和標準差的區別 一般來說方差的公式是(σ^2)S^2=…… 而標準差則是將方差開根號S(σ)=……   由於方差和標準差差一個根號,

原创 python基礎 class5(七段數碼管、科赫雪花)

# 七段數碼管 import turtle import time def drawline(draw): if draw: turtle.pendown() else: tu

原创 python基礎 class2 (繪畫蟒蛇)

                  代碼 # 繪製蟒蛇 from turtle import * setup(650, 350, 200, 200) # speed(1) penup() fd(-250) pend

原创 python基礎 class8(體育競技分析)

      # 體育競技分析問題 import random def printIntro(): print('''這個程序模擬兩個選手A和B的某種競技比賽 程序運行需要A和B的能力值(以0-1之間的小數表示)''

原创 requests爬取股票信息

這裏討論的股票信息沒有隱藏在js當中的方法   主要利用requests來get每個股票的text 再交替利用re和bs4來解析text裏的信息 最後再按照當前的時間來保存股票的信息   由於requests的爬取速度慢,可以選擇關閉每個

原创 python進階爬蟲class 2(緩存)

下載緩存 通過緩存已經下載好了的url網頁,來檢查是否有重複下載的情況 將網頁信息保存在本地磁盤上時,要注意不同操作系統的文件系統的合法字符和最大長度,以確保做到兼容,同時要注意替換後是否會產生同名現象。默認保存的網頁名稱爲路徑後的文件名

原创 python進階爬蟲class 2(Lxml)

lxml lxml.html.fromstring(str) 將str轉爲lxml.html.HtmlElement類型的對象   lxml.html.tostring(lxml.html.HtmlElement, pretty_prin

原创 python數據分析基礎class 3

       

原创 python數據分析基礎class 2(引力波的繪製)

      引力波數據https://www.python123.io/dv/grawave.html   # 引力波 import numpy as np import matplotlib.pyplot a

原创 python數據分析基礎class 4(IPython的使用(2))

Ipython是一個加強版的python解釋器 Ipython中大多數Python對象被格式化爲更可讀、更美觀的形式   Ipython的補全功能 使用<tab>鍵可以產生補全的效果,默認下不產生以下劃線爲開頭的補全   Ipython的

原创 python進階爬蟲class 1(對基礎爬蟲的補充)

識別網站所用的技術 builtwith庫,不一定完美支持python3,且有時會獲取不到信息 使用builtwith.parse(url)來獲取 尋找網站的所有者 whois庫,全名是python-whois 使用whois.whois