原创 PyCharm import自定義包問題

PyCharm中,自己寫了兩個py文件,import後出現紅線,Ctrl+B無法跳轉,主要是路徑問題。 PyCharm->Settings->Project->Project Structure 選要調用的py文件目錄,右鍵添加so

原创 python字符串相似度比較

利用difflib模塊—實現兩個字符串或文本相似度比較 首先導入difflib模塊 import difflib 示例: Str = '上海中心大廈' s1 = '大廈' s2 = '上海中心' s3 = '上海中心大樓'

原创 python去重複數據之drop_duplicates詳解

pandas.DataFrame.drop_duplicates DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) 參數 subset: 列標籤

原创 DataFrame設置index

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 其中: keys是列標籤或數組列表,drop:刪除

原创 python處理數據篇之數據變形

DataFrame 1. 創建 DataFrame # 創建一個空的 DataFrame #df = pd.DataFrame(columns=['車牌號', '車型', '標籤']) df = pd.DataFrame([['滬C

原创 SVM原理推導

最近看了下SVM的原理推導,寫些我自己的理解。 SVM(Support Vector Machine)指的是支持向量機,是常見的一種判別方法。在機器學習領域,是一個有監督的學習模型,通常用來進行模式識別、分類以及迴歸分析。 先看一張

原创 LogisticRegression參數

sklearn.linear_model 文檔 http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.htm