原创 NLP 文本分詞 java類方法,及opennlp 示例
文章中需要的Apache openNlp jar包:openNlp下載:https://opennlp.apache.org/cgi-bin/download.cgi 其他涉及的jar都是java基礎類包 package com.npl
原创 英文免費書庫 ebooks
http://www.gutenberg.org/ebooks/ 看書的時候介紹的,不過好像都是英文書,比較難啃對我來說,但是還是mark一下
原创 正則庫
http://regexlib.com/Default.aspx
原创 linux 安裝 mysql8.0 兩臺
安裝第一臺,一般用到一個機器安裝第二臺的時候,一般機器上已經有一臺mysql了,所以,如果你沒有可以參考下面鏈接安裝,鏈接沒有指定mysql配置文件地址,因爲一般大家都是這樣子裝的,所以,爲了能同樣流程在正式機器安裝成功,所以我沒有指定配
原创 stanford nlp chinese jar 工具包處理中文
先下載一下核心包和中文工具包,https://stanfordnlp.github.io/CoreNLP/ 下載Stanford CoreNLP ,和中文支持包 另外,在這個https://nlp.stanford.edu/soft
原创 Nlp SBD 文本斷句 包含中文 和英文斷句
根據目前學習,中文斷句 standford nlp可以實現中文分詞和斷句,下面有不同api的例子,大家可以試試 package com.example.utils; import java.io.BufferedOutputStre
原创 Cannot read property 'compilation' of undefined vue --- npm dev build 報錯
Cannot read property 'compilation' of undefined at OptimizeCssAssetsWebpackPlugin.apply (D:\workspace-vue\edc-pf\n
原创 springboot AOP 記錄業務系統的操作日誌
看到這裏,給自己mark一下。 AOP是面向切面變成,能在程序運行時,不修改源碼的情況下,爲目標對象增加額外功能。 使用AOP來記錄業務系統的操作日誌,在執行具體的業務方法治好,AOP會自動在系統記錄對應的操作日誌,不需要修改原來的業務代
原创 NLP 文本分詞標準化處理 -1.字母準變小寫;2.縮寫詞展開;3.去除停用詞;4.詞幹化和詞性還原
分詞的話,java類的split方法和StringTokenizer類可以進行簡單的分詞,如果不用NLP的API類時。下文的例子都屬於apache的openNLP的方法,案例來源於java自然語言處理這本書 import opennlp
原创 java 服務器文件上傳和下載以及刪除
我是使用的比較簡單的上傳方法 file.transferTo(new File(savePath));直接將文件轉存到想要的路徑 String uploadPath = "D:/datacleanTaskData/";//windo
原创 mybatis generator 生成中文字段註釋
首先,試了好幾次,重寫 DefaultCommentGenerator ,創建MyCommentGenerator類實現CommentGenerator接口,都是按照網上的方案來的,執行也沒問題,但是就是沒有實體生成,然後又看到說可以直接
原创 linux 安裝 mysql8.0
安裝之前如果本機的mysql3306端口已經佔用,請參考我安裝第二臺mysql的文章 正在寫,寫完貼一下鏈接,沒貼的話,看下一篇就好了 一定要先先看一下當前系統版本再下載對應的包,我開始沒看,然後就一堆麻煩: cat /proc/vers
原创 linux java 環境
1.先看一下當前系統版本: cat /proc/version Linux version 3.10.0-862.14.4.el7.x86_64 ([email protected]) (gcc ver
原创 springboot 獲取resource 下文件
如上圖,: ClassPathResource classPathResource = new ClassPathResource("/dictionary/custom/CustomDictionary.txt");//詞典 Fil
原创 resultMap 可以接收全字段,resultType 接收部分字段爲null
1.首先說一下原因: 因爲resultMap 是在當前xml聲明配置的,如下,對於每個字段的列和接收的屬性都匹配過,所以可以一一對應拿到數據 <resultMap id="BaseResultMap" type="com.gdlt.c