台部落我满眼的欢喜都是你

通過pip安裝報錯 pip install gensim 鏡像節點太慢了，換個鏡像節點就好了 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gensim 安裝

2020-07-01 21:40:46

功能輸出影評主題；輸出每份評論在各個主題上的權重分佈。工具 python2 spark2.0.2 引言在機器學習中，LDA是兩個常用模型的簡稱：線性判別分析(Linear Discriminant Analysi

2020-06-22 16:53:10

python用happybase連hbase取數時，需要開啓thrift，開啓方法：在xshell登錄到hbase的主節點；用jps命令查看是否開啓；如果沒有，則開啓thrift:`hbase thrift start 關

2020-06-07 17:44:57

把自己看過的資料鏈接記在這裏，方便以後自己查閱： CRF Layer on the Top of BiLSTM BiLSTM-CRF模型做基於字的中文命名實體識別

2020-06-07 17:44:57

最近在做文本的關係抽取，看了一篇論文（NRE論文總結：Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classificatio

2020-06-07 17:44:57

功能輸出文本關鍵詞以及熱度值工具 python2 spark2.0.2 數據集兩個字段（評論人，評論內容），480條短評；結果引言 textrank是一個基於詞共現的算法，目前最新的spark2.2.1的

2020-06-07 17:44:57

功能：文本實體標註，用於做ner nre等的訓練測試集；工具：python2 輸入：輸出：腳本： #!/usr/bin/python # -*- coding: utf-8 -*- """ @author: @contac

2020-06-07 17:44:57

功能：1.輸出影評主題 2.輸出每份評論在各個主題上的權重分佈工具：python2 spark2.0.2 etl #!/usr/bin/python # -*- coding: utf-8 -*- """ @author:

2020-05-26 05:49:56

功能：輸出兩段文本的語義相似度工具：python2 gensim:version = '3.4.0’ 清洗、分詞詞典構造、去數字、去停用詞清洗，輸入.txt，一條文本佔一行，分詞、加載分詞詞典去數字、停用詞 #

2020-05-26 05:49:56

資料訓練 crf_learn template_file train_file model_file 測試 crf_test -m model_file test_file 參數說明輸入參數（可選）： -f, –freq=IN

2020-05-19 22:47:54

整體縮進：鼠標選中代碼塊，按tab鍵。反向縮進：鼠標選中代碼塊，按shift+tab.

2020-05-19 14:56:26

file—>setting,選擇Editor—>python 設置方式： tab size:4 indent：4 continuation indent:8

2020-05-19 14:56:26

要換電腦了，之前用到的鏈接一段時間沒用，又忘了，先存放這裏，方便下次使用查找 TOPSIS評價方法 sklearn 翻譯筆記：KNeighborsClassifier python中matplotlib的顏色及線條控制如果用R進

2019-08-28 21:02:43

這篇最初也是發在公衆號上的，所以圖片水印部分會由於馬賽克看不清。名詞解釋支持向量機中的機：在機器學習領域，常把一些算法看做一個機器，如分類機（也叫作分類器）問題描述空間中有很多已知類別的點，現在想用一個面分開他們，並能對未知

2019-03-21 03:04:31

鼠標在桌面右擊，小烏龜，進到SVN,提交的時候先update 再commit

2019-03-20 20:12:20