Java 实现OCR 识别图像文字(手写中文)----tess4j

原創

2018-10-27 00:12

最近有个需要,小程序端手写中文之后生成图像,后端需识别图片上中文..;刚开始想到第三方收费api试试,先用了百度AI开放平台的通用字体识别的API,但对于手写字的识别不太高,通用字体还挺好的;于是找到了Tessearct-OCR,参考了几篇文摘整合了一下

准备:

1.下载Tessearct-COR 3.0以上版本:https://download.csdn.net/download/qq_26161693/10646074

2. 在安装时选择chi_sim.traineddata 语言库;之后在程序中需加载安装目录tessdata下的中文包(chi_sim.traineddata );

maven依赖:

<dependency>
       <groupId>net.sourceforge.tess4j</groupId>
       <artifactId>tess4j</artifactId>
       <version>3.2.1</version>
       </dependency>

Demo:

   /**
   *
   * @param srImage 图片路径
   * @param ZH_CN 是否使用中文训练库,true-是
   * @return 识别结果
   */
   public static String discernWord(String imagePath) {
       try {
           File image = new File(imagePath);
           BufferedImage textImage = ImageIO.read(image);
           Tesseract instance = Tesseract.getInstance();
           instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");// 设置语言库
instance.setLanguage("chi_sim");// 中文识别
           String words = null;
           words = instance.doOCR(textImage);
           return words;
       }
       catch (Exception e) {
           e.printStackTrace();
       }
   }

Test:

public static void main(String[] args) throws Exception {
       String words = discernWord("F:/test_used_url/ocr/originalPic/hotkidclub.jpg", true);//需识别的图文件路径
       System.out.println(words);
   }

ps:

在window开发环境下先安装了tesseract亲测可行,不过没试过不安装exe只加载语言包的情况;

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Java 实现OCR 识别图像文字(手写中文)----tess4j

准备:

maven依赖:

Demo:

Test:

ps:

在window开发环境下先安装了tesseract亲测可行,不过没试过不安装exe只加载语言包的情况;

985 硕士程序员，空窗 4 个月没有 Offer！

【入门教程】5分钟教你快速学会集成Java springboot ~

营销系统黑名单优化：位图的应用解析

一文搞懂 Spring 循环依赖

我真的从测试转成了开发......

盛大发布 | Zabbix 7.0 LTS--性能与扩展的卓越融合

nginx添加相应配置，通过浏览器访问或curl时返回客户端对应公网IP

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

python内置函数——sorted

[oeasy]python020在游戏中体验数值自由_勇闯地下城_终端文字游戏

SSM整合quartz框架-動態設置定時任務的實現

Mysql 查詢優化,排序,特殊使用等-年度總結

SSM整合 redis 實現緩存管理

springMVC ：HandlerMethodArgumentResolver+ 自定義註解,自定義解析器實現請求數據綁定方法入參

mysql支持emoji字符

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結