原创 自然語言處理-錯字識別(基於Python)kenlm、pycorrector

轉載請註明出處:https://blog.csdn.net/HHTNAN n元分詞法參見:https://blog.csdn.net/HHTNAN/article/details/62046652 關於kenlm統計語言模型:http

原创 關於kenlm工具訓練統計語言模型

概述 統計語言模型工具有比較多的選擇,目前使用比較好的有srilm及kenlm,其中kenlm比srilm晚出來,訓練速度也更快,而且支持單機大數據的訓練。現在介紹一下kenlm的使用方法。 特徵 “語言行業最大的改進是增加了新的語言

原创 django使用過程中獲取數據庫數據(models的注意事項)

首先說下一個表結構。 django 中用於匹配的結構。 表名 有以下幾點說明: 1.在匹配選擇過程中models中不必全部都進行獲取,通常獲取部分即可。 2.查詢過程中如果指定了默認參數那麼查詢時數據庫藥匹配。否則會報錯如下兩個

原创 windows下pytorch安裝過程(顯卡與系統)

文章目錄pytorch簡介安裝ANACONDA看看自己適合安裝個啥1.支持什麼操作系統?2. 顯卡NV or HD3、安裝 Pytorch & torchvision3.1 conda install pytorch-cpu -c p

原创 Python-自定義裝飾器,使用裝飾器記錄函數執行次數,一種埋點的實現形式

什麼是裝飾器? 裝飾器本質是一個函數,它可以在不改變原來的函數的基礎上額外的增加一些功能。如常見的@classmethod,@staticmethod等都是裝飾器,接下來記錄下如何自定義個裝飾器: 剛剛說過了,裝飾器的本質就是一個函數

原创 python中的dataframe 剔除部分數據後,索引消失,重新建立索引

今天在處理一個數據的過程中出現問題,python中的dataframe 剔除部分數據後,索引消失,遍歷就出錯, 報錯形式如下 Traceback (most recent call last): File "D:/pycreate

原创 多維度預測,基於keras預測房價操作

數據來源kaggle,官網都有介紹。https://www.kaggle.com/c/boston-housing from keras.datasets import boston_housing (train_data,trai

原创 基於keras的波士頓房價預測

數據來源kaggle,官網都有介紹。https://www.kaggle.com/c/boston-housing from keras.datasets import boston_housing (train_data,tra

原创 Neo4j導入CSV文件使用import

準備數據 首先我們準備好數據(CSV) 數據連接:https://pan.baidu.com/s/1hwMy91DjohZ9yJXcA6GKMQ 放入import目錄路徑 一、Neo4j默認導入目錄路徑 neo4j安裝根路徑下找到i

原创 apoc下載,並完成neo4j配置配置與啓動

APOC是Neo4j 3.3版本推出時正式推薦的一個Java存儲過程包,裏面包含豐富的函數和過程,作爲對Cypher所不能提供的複雜圖算法和數據操作功能的補充,APOC還具有使用靈活、高性能等優勢。在接下來的幾周,我會逐漸深入地介紹主

原创 pyCharm最新2018註冊碼

pycharm 2018有效註冊碼,親測有效! **pycharm 2018註冊碼,比較長請複製全了,否則無效!**教育專用,禁止用做其他用途,見下方代碼塊。 G91XMO9AVI-eyJsaWNlbnNlSWQiOiJHOTF

原创 圖數據庫的內部結構 (NEO4j)

What “Graph First” Means for Native Graph Technology Neo4j是一個具有原生處理(native processing)功能和原生圖存儲(native graph storage)

原创 使用Git Bash上傳文件及更新代碼到GitHub教程

使用Git Bash上傳文件及更新代碼到GitHub教程,其實對於一個github來說已經給出了比較好的說明了。 基本步驟 下面來實際操作下: 以D:\github文件夾爲例。 首先啓動 git bash $ cd D:\

原创 Git如何切換賬戶

入職新的公司,用了新的電腦需要切換git到自己的賬戶, 切換帳號其實很簡單, 如果你不知道現在本地Git用的帳號是什麼,你可以輸入 git config user.name 查看用戶名 git config user.email

原创 python 正則之提取字符串中的漢字,數字,字母

#\d 匹配一個數字字符。等價於 [0-9] #\D 匹配一個非數字字符。等價於 [^0-9] #過濾字符串中的英文與符號,保留漢字 import re st = "hello,world!!%[545]你好234世界。。。" st