原创 英語單詞詞幹化表

博客:https://blog.csdn.net/potato012345/article/details/78091939 下載地址:https://github.com/Zhangtd/MorTransformation

原创 SSDB 配置文件詳解

SSDB 的配置非常簡單, 附帶的 ssdb.conf 你不用修改便可以使用. 如果你要高度定製, 還是需要修改一些配置的. 下面做介紹. SSDB 的配置文件是一種層級 key-value 的靜態配置文件, 通過一個 TAB 縮進來表示

原创 java.lang.IllegalArgumentException: URLDecoder異常解決

異常: Exception in thread "main" java.lang.IllegalArgumentException: URLDecoder: Illegal hex characters in escape (%) pat

原创 基於ansj_seg和nlp-lang的簡單nlp工具類

1、首先在pom中引入ansj_seg和nlp-lang的依賴包,   ansj_seg包的作用:     這是一個基於n-Gram+CRF+HMM的中文分詞的java實現;     分詞速度達到每秒鐘大約200萬字左右(mac air下

原创 Maven報錯Missing artifact jdk.tools:jdk.tools:jar:1.7

而tools.jar包是JDK自帶的,於是懷疑pom.xml中以來的包隱式依賴tools.jar包,而tools.jar並未在庫中, 好比:當前工程依賴A包,而A包在開發打包過程依賴tools.jar包,現在A發佈了,我們的工程依賴A包,

原创 System.getProperty("user.dir")獲取當前項目所在路徑

System.getProperty("user.dir")記錄下

原创 ArrayList的四種初始化方法

轉載:https://beginnersbook.com/2013/12/how-to-initialize-an-arraylist/ Method 1: Initialization using Arrays.asList Synta

原创 【保存】maven的pom.xml標籤的xsi:schemaLocation處報錯

maven裝X的原因是 maven對下載不下來的jar文件會生成一個 *.lastUpdated  文件 ,不將*.lastUpdated文件幹掉,它是不會給你重新下載jar,  so   將   *.lastUpdated  這個傢伙幹

原创 【轉載保存】java四種線程池的使用

https://blog.csdn.net/qq_31441667/article/details/78830395

原创 java contains方法作用

1 String類型有一個方法:contains(),該方法是判斷字符串中是否有子字符串。如果有則返回true,如果沒有則返回false。 if(map_string.contains("name")){ System.out.

原创 java 操作redis

//連接redis ,redis的默認端口是6379 Jedis jedis = new Jedis ("localhost",6379); //驗證密碼,如果沒有設置密碼這段代碼省略 jedis.auth("passw

原创 git使用

git上傳總結: 沒有分支操作: 第一步:建立git倉庫:cd到你的本地項目根目錄下,執行git命令,此命令會在當前目錄下創建一個.git文件夾。 git init 第二步:將項目的所有文件添加到倉庫中 git ad

原创 java求差集、並集和交集

package algorithm; import java.util.ArrayList; import java.util.List; public class SetOperation { public static vo

原创 去掉標點符號

//去掉標點符號、空格 title = title.replaceAll("[\\pP\\p{Punct}| +]", "");

原创 Word2vec加TextRank算法生成文章摘要

依賴包:https://download.csdn.net/download/dreamzuora/10853874 代碼: String document = "算法可大致分爲基本算法、數據結構的算法、數論算法、計算幾何的算法、圖