原创 使用scrapy框架爬取噹噹網圖書並存入mysql

這些數據並不需要模擬登陸,模擬登陸會在下一偏博客寫。 主要步驟: 創建項目scrapy startproject dangdang 使用默認模版創建爬蟲scrapy genspider -t basic dd dangdan

原创 python爬蟲異常處理

URLError造成原因 1 本地網絡未連接 2 服務器不存在 3 連接不到特點的服務器 4 httperror,httperror是urlerror子類 使用try,except來捕獲異常 import urllib.r

原创 python多線程基礎

1 簡介 多線程類似於同時執行多個不同程序,多線程運行有如下優點: 使用線程可以把佔據長時間的程序中的任務放到後臺去處理。用戶界面可以更加吸引人,這樣比如用戶點擊了一個按鈕去觸發某些事件的處理,可以彈出一個進度條來顯示處理的進度

原创 python使用代理服務器獲取網頁數據

免費代理ip網址:http://www.xicidaili.com/ 多次重複獲取網頁時,很容易被網站的反扒封掉ip,這時可以使用代理,python使用代理非常簡單,三行代碼即可實現。 #使用urllib庫的ProxyHandl

原创 python多線程獲取內涵段子

1 主要幾個難點 1。每頁會有20個段子,會出現加載更多,點擊加載更多,url並沒有改變,打開顯示網頁源代碼,並沒有獲得段子。所以需要用到抓包獲取實際段子地址,使用Chrome自帶的檢查找到真實的地址。 觸發一次加載操作,我

原创 SAP TM路徑確定及定義重量組

1、定義重量組 如果要按重量組來確認路線, 那需要先定義好重量組; 可以按重量組確定運 輸路線,但是該確定規則只能在交貨中執行,在訂單中無法執行。 Total Weight 總重量,銷售訂單中的所有行項目進行毛重累計,系統把物料主數

原创 SAP TM定義路線和階段

1、定義運輸點 定義路線Routes首先需要定義運輸連接點Transportation connection point。 定義路線:spro(T-code)——Logistics Execution後勤執行——Transportat

原创 計算機二級python指導用書編程題答案

個人手寫,歡迎指正 更新中。。。 #!/user/bin/env python #-*- coding:utf-8 -*- #author:M10 import random #3-1輸入整數,輸出百分位及以上的數字 ''' s =

原创 基於sklearn的決策樹算法

1、決策樹介紹 決策樹簡單的理解爲if-then的集合,其優點主要有分類速度快、可讀性等。決策樹的生成主要可分爲三個步驟:特徵的選擇、決策樹的生成、決策樹的剪枝。 1.1特徵選擇 對於結點的選擇,總得需要一個計算方法來實現,這個方法的目標

原创 Cannot attach additional subparts to non-multipart/*

在使用python添加附件發送時報錯:Cannot attach additional subparts to non-multipart/* 查詢得知,錯誤的原因在於: msg=MIMEText(‘hello,send by pyt

原创 使用python執行mysql編碼存入Excel時報錯

存入Excel時出現錯誤: TypeError: cannot use a string pattern on a bytes-like object sql執行部分語句如下: CONCAT(SUM(CASE WHEN 節點名 = '基

原创 python可視化交互庫dash

R有shiny,應該是非常好用的,python像shiny的交互可視化的庫不多,dash其中之一,簡單實用,但整體似乎還不如shiny。 1安裝 pip install dash pip install dash-renderer p

原创 python3列表推導式

1列表推導效率比傳統的for 循環+append要快 code測試如下: #傳統的循環 import datetime time1 = datetime.datetime.now() list1 = [] for i in range(1

原创 python兩個一維列表合併成一個二維列表

>>> list1 = [1,2,3,4,4] >>> list2 = [2,3,4,5,2] >>> z = list(zip(list1,list2)) >>> z [(1, 2), (2, 3), (3, 4), (4, 5), (

原创 python自然語言處理(一)

1標識化處理 何爲標識化處理?實際上就是一個將原生字符串分割成一系列有意義的分詞,其複雜性根據不同NLP應用而異,目標語言的複雜性也佔了很大部分,例如中文的標識化是要比英文要複雜。 word_tokenize()是一種通用的,面向所有語