原创 Linux 後臺運行python .sh等程序,以及查看和關閉後臺運行程序操作

1、運行.sh文件 直接用./sh 文件就可以運行,但是如果想後臺運行,即使關閉當前的終端也可以運行的話,需要nohup命令和&命令。 (1)&命令 功能:加在一個命令的最後,可以把這個命令放在後臺執行 (2)nohup

原创 python過濾敏感詞記錄

簡述: 關於敏感詞過濾可以看成是一種文本反垃圾算法,例如 題目:敏感詞文本文件 filtered_words.txt,當用戶輸入敏感詞語,則用 星號 * 替換,例如當用戶輸入「北京是個好城市」,則變成「**是個好城市」 代碼: #co

原创 文本去重的技術方案討論(一)

各位好,我正在參加博客之星,2018評選,幫忙投我一票把:投票地址:網址連接 ,點擊進入投票! 請注意編碼:編號:009 IT界的小小小學生 對於文本去重來說,我個人處理上會從數據量、文本特徵、文本長度(短文本、長文本)幾個方向考慮。

原创 GBDT與xgb區別,以及梯度下降法和牛頓法的數學推導

爲什麼要介紹梯度下降法和牛頓法那? 這裏提及兩個算法模型GBDT和XGBoost,兩個都是boosting模型。 GBDT和xgb的目標函數是不同的,同時針對其目標函數中的誤差函數 L(θ) 的擬合方式也有差異: GBDT利用一階泰

原创 linux 下的 CentOS 6.8 安裝mongodb

文章目錄1. 獲取mongodb-3.4.62. 解壓壓縮包至安裝目錄(/usr/local/mongodb)3. 建立log和data目錄4. 配置環境變量5. 配置mongodb.conf6. 啓動mongodb服務器7. 檢查m

原创 感謝您訪問我的博客,點擊這裏不止有的是驚喜!!!

作爲一個程序🐕,每天都在碼代碼,無盡的代碼讓我發現需要記筆記,於是乎與CSDN結緣,2018年CSDN博客博客之星評選。 重點來了 幫忙投我一票把:投票地址:網址連接 ,點擊進入投票! 請注意編碼:編號:009 IT界的小小小學

原创 小白量化投資入門課(python)

推薦一門課程:課程連接 課程名稱:死工資一黨課程:小白量化投資入門課(python) 課程定位:本課程爲視頻課程,全面覆蓋Python核心編程知識與量化交易知識點,並結合機器學習於深度學習對數據進行解讀,做數據的主人。 參考課程章節如

原创 自然語言處理之命名實體識別-tanfordcorenlp-NER(一)

轉載請註明出處:https://blog.csdn.net/HHTNAN 簡介 CoreNLP 項目是Stanford開發的一套開源的NLP系統。包括tokenize, pos , parse 等功能,與SpaCy類似。SpaCy號稱

原创 自然語言處理之分詞、命名主體識別、詞性、語法分析-stanfordcorenlp-NER(二)

轉載請註明出處:https://blog.csdn.net/HHTNAN 在前面我們介紹了Stanford CoreNLP, 自然語言處理之命名實體識別-tanfordcorenlp-NER(一) 功能列表 工具以及對各種語言的支持

原创 Pycharm快捷鍵 自定義功能形式

以PyCharm設置改變字體大小的快捷鍵爲例,其他同理。 進入File->Settings,之後搜索keymap 執行如下 下面事具體的操作:

原创 詳盡解讀正則表達式:python下的re方法

版權聲明:本文爲博主原創文章,歡迎交流分享,未經博主允許不得轉載。 https://blog.csdn.net/HHTNAN/article/details/84651583 文章目錄關於正則表達式Python下的正則(regex)正

原创 Pycharm激活碼 最新的(20181126)

首先要聲明以下,如果你是學生還是使用學生版的,這個是破解激活。 另外插播一個小廣告:PythonQ羣–867300100 破解激活法 關於破解激活,很多時候輸入註冊碼就顯示過期了,很多原因是沒有修改host,很簡單並且只需要幾分鐘。

原创 python下的日期與時間(時間格式轉換、時間戳處理,時間差處理)

python下的日期與時間 一、在Python中,時間主要有三種表示形式, 1.時間戳(TimeStamp):1970年1月1日之後的秒 2.時間元組格式化形式 包含了:年、日、星期 得到time.struct_time(tm