原创 DataFrame.to_excel多次寫入不同Sheet

主要需要pd.ExcelWriter([文件路徑])方法 參考官方文檔: >>> writer = pd.ExcelWriter('output.xlsx') >>> df1.to_excel(writer,'Sheet1')

原创 樸素貝葉斯分類及python實現

1。基礎理論 樸素貝葉斯屬於分類算法中的一種,是數據挖掘常用的算法之一,簡單的理解,有(c1,c2,c3,,,c(n))n個分類,對於某一類c(i),有若干特徵屬性(a1,a2,a3,,,a(m))m個屬性,而現在出現c(j),我

原创 numpy.mean()的幾種用法

import numpy as np x = np.array([1,2,3,4,5]) y = np.array([0,2,3,4,6]) z = np.array([[1,2],[3,4]])#二維數組 np.mean(x==

原创 python zip方法用法

參考:https://blog.csdn.net/xlinsist/article/details/51346523 http://www.runoob.com/python/python-func-zip.html 1.zip

原创 SAP定義單一角色分配用戶及傳輸請求

定義角色 角色是權限和用戶的中間層,例如運輸調度角色,角色下可能有多個用戶,這個角色對應的擁有NWBC的部分權限,同時某位用戶還可能有創建銷售訂單的角色。 創建角色 使用事務碼 PFCG或點擊sap主頁創建角色按鈕進行創建角色。

原创 SAP TM給運輸點分配國家和運輸區域及定義運輸組

1、運輸點分配國家和區域 2、定義運輸組 定義運輸組後根據需要,將運輸組維護到物料主數據上,如下圖所示 運輸組的定義則在Define Transportation group裏 如下

原创 基於python的kNN分類算法

kNN(鄰近)算法簡介 kNN算法的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定

原创 python3 scrapy框架crawl模版爬取京東產品並寫入mysql

crawl將自動對所有鏈接進行分析,將符合的鏈接數據爬取。官方文檔 ,其中價格,好評率需要用瀏覽器抓包分析真實地址,本文所用的基礎技術包括:sql語句,re表達式,xpath表達式,基本的網絡知識和python基礎 jd.p

原创 python3 unicode列表轉換爲中文

查了很多很多的資料無果,果然知乎牛逼,鏈接,完美解決。 爬取網站時,最終得到list內容,編碼爲unicode,想讓其轉換爲漢字並輸出。 需要提取的爲下圖中unicode部分: 保存爲列表,然後使用for循環: tex

原创 python數據清洗(缺失值與異常值處理)

1。 將本地sql文件寫入mysql數據庫 本文寫入的是python數據庫的taob表 source [本地文件] 其中總數據爲9616行,列分別爲title,link,price,comment 2。使用python鏈接並讀

原创 python3 scrapy模擬登陸豆瓣

首先感謝知乎,在我遇到問題時提問有人及時幫助解決。問題在下面說。 1。遇到的問題 由於程序沒有做後續的數據處理,所以沒有用到pipelines,只在爬蟲文件裏編輯,在模擬瀏覽器時也將也將瀏覽器header寫在db.py文件中,在知

原创 python數據分析數據標準化及離散化

標準化 1。離差標準化 是對原始數據的線性變換,使結果映射到[0,1]區間。方便數據的處理。消除單位影響及變異大小因素影響。 基本公式爲: x’=(x-min)/(max-min) 代碼: #!/user/bin/env py

原创 使用jieba模塊進行自然語言處理並製作詞雲

需要使用python的jieba模塊,安裝可以使用pip install jieba 關於jieba,支持三種分詞模式: 精確模式,試圖將句子最精確地切開,適合文本分析; 全模式,把句子中所有的可以成詞的詞語都掃描出來, 速

原创 python urllib庫獲取淘寶主圖

1 分析 首先對網頁url進行分析。我們將第二頁、第三頁最後s=44改爲s=0時,我們剛好獲取的爲第一頁數據,所以我們總結出商品的頁數爲鏈接最後的s=44*ii爲頁數爲[0,1,2,3…] #第一頁鏈接 #https://s.ta

原创 python數據分析-文本相似度分析

由於本文設計較多知識點,在編寫代碼之前需要搞清楚這些知識點的含義。 1。知識點解釋 Gensim是一款開源的第三方Python工具包,用於從原始的非結構化的文本中,無監督地學習到文本隱層的主題向量表達。它支持包括TF-IDF,L