PPadleOCR 自己的數據訓練

          在github裏面下載PaddleOCR源碼後,接下來開始一一安裝:
          1、安裝Python,此處必須安裝3.8--3.10的版本,3.11版本目前是不支持的,容易報錯。

          2、依次安裝

                 python -m pip install paddlepaddle  -i https://pypi.tuna.tsinghua.edu.cn/simple        

                 python -m pip install PPOCRLabel    -i https://pypi.tuna.tsinghua.edu.cn/simple         -- 標註工具

                 PPOCRLabel --lang ch       

                在此安裝過程中有兩個依賴,得注意安裝:
               ModuleNotFoundError: No module named 'Polygon'
               這個安裝時,必須使用  python -m pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple

               ModuleNotFoundError: No module named 'lanms'

               這個安裝時,必須使用  python -m pip install lanms-nova  -i https://pypi.tuna.tsinghua.edu.cn/simple

 

          3、在標註工具裏面識別後,及時保存相關數據。

             4、下載訓練模型

                    根據自己的需要下載 https://github.com/PaddlePaddle/PaddleOCR :

 

             5、修改訓練的配置文件:

          6、標記train 下的文件

                修改之前識別有問題的label文件,標記爲正確的。

 

          7、執行命令(建議路徑用完全路徑)

               python tools/train.py -c configs/det/det_mv3_db.yml

      

          部分參數一定設置小,否則個人電腦容易硬件性能不足的報錯。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章