原创 windows 安裝pytorch 權限問題

環境說明:windows10  python3.6  anaconda3 1.按照進入pytorch官網https://pytorch.org/選擇正確的命令 它會自動爲你選擇一些配置,複製命令 我選擇的是:conda install

原创 python 哈工大NTP分詞 安裝pyltp 及配置模型(python3.5 3.6)

哈工大語言云 NTP python使用 系統配置(方法windows通用): windows10 python3.5 使用文檔地址:https://pyltp.readthedocs.io/zh_CN/latest/api.h

原创 Python小點dian兒: 按列條件篩選、刪除DataFrame的整行

pandas刪除指定行 遇到清洗數據的問題,需要把某一列數據中,那些爲指定元素的數據,整行去除 嘗試了drop卻不能到達理想的效果,drop僅僅刪除了第一個。 isin效果理想。 import pandas as pd df = pd.

原创 Python小點dian兒: ValueError: invalid literal for int() with base 10

對於一種的字符串(整數字符,加了引號),這種可以int(“num”)即可達到效果, 同理int類型的數據,str(num),就可以實現 "num"的類型轉換: >>> int("3") 3 >>> str(3) '3' >>> in

原创 Python小點dian兒: Python-Pandas-DataFrame 如何把df變爲以數據中的某一列爲index

    目錄  我們在讀入數據的時候,數據本來有它自身的user_id,這行數據又是不進入模型訓練的。我們怎麼處理呢?   法一:文件讀入階段 小點dian兒:,讀入文件的幾行,參數:nrows=行數 法二:在DateFrame階段設

原创 小點dian兒:pandas數據存入文件,行索引處理

小點dian兒:存入數據的時候,我們希望對數據在系統的行名 保存或者不保存 參數:index=None:(類似,header=False不保存列名) 在我們不進行如上的設計的時候,系統或分配默認的行index:0,1,2..在我們將運行結

原创 python小點dian兒:DataFrame 取一列,類型是series 還是 DataFrame?

發現一個小點dian兒 一個 DataFrame 取一列,不同的表示方法,名字是不是列表,會影響得到的結果的類型series 或者 DataFrame.  python果真是好入手,不好學精呀,之前一直知道取一列後類型會改變問seriou

原创 Python小點dian兒:sort疑問大全

遇到了就刨根問題,補補python基礎吧。 數據會清理,特徵會派生,模型會跑,參數能調,但始終還是有漏洞,或者術語不可名狀。 python 去重,並保持列表原來順序list_a = ['cc', 'bbb', 'dda','bbbb',

原创 python訓練work2vec詞向量(python gensim)

目錄 看了很多文章,對與word2vec語料的處理沒有那麼清晰,現在寫下自己處理流程,方便入手的小夥伴,望大家使用的過程中,少走彎路。 訓練語料格式 模型訓練 1.安裝gensim 2.模型訓練 3.模型保存 3.1模型訓練保存與加載1(

原创 python 刪除文件首行或指定行(修改文件)

網上的大多數答案也是,讀入,寫入的過程,總結如下 python修改文件(fileinput) 鏈接 https://blog.csdn.net/u013398398/article/details/53583596 上網查了好多方法都是

原创 邏輯迴歸算法梳理

【任務2 - 邏輯迴歸算法梳理】時長:2天 1、邏輯迴歸與線性迴歸的聯繫與區別 2、 邏輯迴歸的原理 3、邏輯迴歸損失函數推導及優化 4、 正則化與模型評估指標 5、邏輯迴歸的優缺點 6、樣本不均衡問題解決辦法 7. sklearn參

原创 線性迴歸知識總覽

博文內容爲 機器學習的一些概念 有監督、無監督、泛化能力、過擬合欠擬合(方差和偏差以及各自解決辦法)、交叉驗證 線性迴歸的原理 線性迴歸損失函數、代價函數、目標函數 優化方法(梯度下降法、牛頓法、擬牛頓法等) 線性迴歸的評估指標 s

原创 CSDN Markdown編輯下插入公式

關於如何編輯公式內容,屬於LATEX公式編輯內容不是本博客討論內容,本博文說明的是如何將公式放入CSDN Markdown中。 非常簡單(新手的我探索好久,不開心),使用$將公式左右包括起來,鍵入的式子將以公式格式顯示 $公式$ 句中

原创 Python小點dian兒: 讀取一個目錄下目錄和文件

目錄   代碼一: 輸出文件目錄相關內容 代碼二:輸出一個目錄下所有文件名字(第一層) 代碼三:返回當前路徑下所有層的文件路徑列表 代碼四:依次從內層到外層獲取當前路徑下文件(改造自代碼三),也可直接代碼一獲取 代碼五:獲取當前路徑下一層

原创 小點dian兒:Python大文件讀取、文件拆分,讀取部分數據

目錄 pandas參數說明 文件部分讀取參數 文件成塊讀取參數 成塊讀入,並寫入其他文件。 官方文檔 pandas參數說明 pandas在read_csv或 read_table有幾個個參數 文件部分讀取參數 nrows : int, d