原创 NLP 文本分詞 java類方法,及opennlp 示例

文章中需要的Apache openNlp jar包:openNlp下載:https://opennlp.apache.org/cgi-bin/download.cgi 其他涉及的jar都是java基礎類包 package com.npl

原创 英文免費書庫 ebooks

http://www.gutenberg.org/ebooks/ 看書的時候介紹的,不過好像都是英文書,比較難啃對我來說,但是還是mark一下

原创 正則庫

   http://regexlib.com/Default.aspx

原创 linux 安裝 mysql8.0 兩臺

安裝第一臺,一般用到一個機器安裝第二臺的時候,一般機器上已經有一臺mysql了,所以,如果你沒有可以參考下面鏈接安裝,鏈接沒有指定mysql配置文件地址,因爲一般大家都是這樣子裝的,所以,爲了能同樣流程在正式機器安裝成功,所以我沒有指定配

原创 stanford nlp chinese jar 工具包處理中文

先下載一下核心包和中文工具包,https://stanfordnlp.github.io/CoreNLP/ 下載Stanford CoreNLP ,和中文支持包  另外,在這個https://nlp.stanford.edu/soft

原创 Nlp SBD 文本斷句 包含中文 和英文斷句

根據目前學習,中文斷句  standford nlp可以實現中文分詞和斷句,下面有不同api的例子,大家可以試試 package com.example.utils; import java.io.BufferedOutputStre

原创 Cannot read property 'compilation' of undefined vue --- npm dev build 報錯

 Cannot read property 'compilation' of undefined     at OptimizeCssAssetsWebpackPlugin.apply (D:\workspace-vue\edc-pf\n

原创 springboot AOP 記錄業務系統的操作日誌

看到這裏,給自己mark一下。 AOP是面向切面變成,能在程序運行時,不修改源碼的情況下,爲目標對象增加額外功能。 使用AOP來記錄業務系統的操作日誌,在執行具體的業務方法治好,AOP會自動在系統記錄對應的操作日誌,不需要修改原來的業務代

原创 NLP 文本分詞標準化處理 -1.字母準變小寫;2.縮寫詞展開;3.去除停用詞;4.詞幹化和詞性還原

分詞的話,java類的split方法和StringTokenizer類可以進行簡單的分詞,如果不用NLP的API類時。下文的例子都屬於apache的openNLP的方法,案例來源於java自然語言處理這本書 import opennlp

原创 java 服務器文件上傳和下載以及刪除

我是使用的比較簡單的上傳方法 file.transferTo(new File(savePath));直接將文件轉存到想要的路徑 String uploadPath = "D:/datacleanTaskData/";//windo

原创 mybatis generator 生成中文字段註釋

首先,試了好幾次,重寫 DefaultCommentGenerator ,創建MyCommentGenerator類實現CommentGenerator接口,都是按照網上的方案來的,執行也沒問題,但是就是沒有實體生成,然後又看到說可以直接

原创 linux 安裝 mysql8.0

安裝之前如果本機的mysql3306端口已經佔用,請參考我安裝第二臺mysql的文章 正在寫,寫完貼一下鏈接,沒貼的話,看下一篇就好了 一定要先先看一下當前系統版本再下載對應的包,我開始沒看,然後就一堆麻煩: cat /proc/vers

原创 linux java 環境

1.先看一下當前系統版本: cat /proc/version Linux version 3.10.0-862.14.4.el7.x86_64 ([email protected]) (gcc ver

原创 springboot 獲取resource 下文件

如上圖,: ClassPathResource classPathResource = new ClassPathResource("/dictionary/custom/CustomDictionary.txt");//詞典 Fil

原创 resultMap 可以接收全字段,resultType 接收部分字段爲null

1.首先說一下原因: 因爲resultMap  是在當前xml聲明配置的,如下,對於每個字段的列和接收的屬性都匹配過,所以可以一一對應拿到數據 <resultMap id="BaseResultMap" type="com.gdlt.c