如何提取pdf文字

http://jingyan.baidu.com/article/363872ecf068656e4ba16f0e.html

現在爲了便於傳輸和閱讀,很多資料都做成了pdf格式的,但隨之帶來的問題就是有些文檔資料不便於複製資料中的某些部分。方法總比困難多,下面就告訴大家如何提取pdf中的文字。

如何提取pdf文字

工具/原料

  • 一臺可正常工作的電腦

  • 安裝有Adobe Acrobat X Pro軟件 (我用的11)  激活 : http://jingyan.baidu.com/article/d8072ac457646aec95cefd83.html

方法/步驟

  1. 首先運行Adobe Acrobat X Pro軟件,打開你要提取文字的pdf文檔,如下圖所示:

    如何提取pdf文字
  2. 定位到你想要提取文字的頁面,選中,點擊右鍵可以看到,當前頁面是一張圖片,如下圖所示:

    如何提取pdf文字
  3. 在Adobe Acrobat X Pro軟件工具欄右側,依次找到工具——識別文本,如下圖所示:

    如何提取pdf文字
  4. 點擊“在本文件中”,彈出識別文本的窗口,爲了方便,我選擇了當前頁面,設置中內容一般不用設置,如有需要可以點擊編輯,更改設置項目,如下圖所示:

    如何提取pdf文字
  5. 點擊“確定”後,軟件會自動分析當前頁面,然後自動識別其中的文本,如下圖所示:

    如何提取pdf文字
  6. 識別完成後,仍然停留在當前頁面,不同的是,當再次選擇其中的文本點擊右鍵後,就能看到熟悉的複製,也可以選擇“將選定項目導出爲…”,如下圖所示:

    如何提取pdf文字
  7. 複製完成後,將其粘貼到文本文檔中或者你需要的地方就可以了,如下圖所示,pdf中的文字就這樣提取出來了。

    如何提取pdf文字
    END

注意事項



  • 文中提到的軟件可自行下載,按照上述步驟操作即可。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章