如何提取pdf文字

原創

2020-06-24 14:59

http://jingyan.baidu.com/article/363872ecf068656e4ba16f0e.html

現在爲了便於傳輸和閱讀，很多資料都做成了pdf格式的，但隨之帶來的問題就是有些文檔資料不便於複製資料中的某些部分。方法總比困難多，下面就告訴大家如何提取pdf中的文字。

工具/原料

一臺可正常工作的電腦
安裝有Adobe Acrobat X Pro軟件 (我用的11) 激活 : http://jingyan.baidu.com/article/d8072ac457646aec95cefd83.html

方法/步驟

首先運行Adobe Acrobat X Pro軟件，打開你要提取文字的pdf文檔，如下圖所示：
定位到你想要提取文字的頁面，選中，點擊右鍵可以看到，當前頁面是一張圖片，如下圖所示：
在Adobe Acrobat X Pro軟件工具欄右側，依次找到工具——識別文本，如下圖所示：
點擊“在本文件中”，彈出識別文本的窗口，爲了方便，我選擇了當前頁面，設置中內容一般不用設置，如有需要可以點擊編輯，更改設置項目，如下圖所示：
點擊“確定”後，軟件會自動分析當前頁面，然後自動識別其中的文本，如下圖所示：
識別完成後，仍然停留在當前頁面，不同的是，當再次選擇其中的文本點擊右鍵後，就能看到熟悉的複製，也可以選擇“將選定項目導出爲…”，如下圖所示：
複製完成後，將其粘貼到文本文檔中或者你需要的地方就可以了，如下圖所示，pdf中的文字就這樣提取出來了。

END

注意事項

文中提到的軟件可自行下載，按照上述步驟操作即可。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

把筆記本電腦的無線網絡通過網線共享給臺式機

1.首先用網線把臺式機和筆記本連接起來； 2.對筆記本設置：把無線網絡右鍵屬性->共享勾選，此時會彈出LAN適配器IP地址爲192.168.137.1，確定即可。然後查看本地連接，IP地址果然被修改，這就對了； 3.對臺式機設置，把臺式機

2020-07-05 17:01:45

Win10/Win8.1磁盤佔用100%的解決方法

Win10之家報道，在幾年前的Win7時代，用戶已經不需要頻繁的進行碎片整理操作，Win8/Win8.1/Win10亦如此，但是卻有新的問題出現了，硬盤佔用率成爲了一個十分嚴肅的問題。在搭載了Windows8/Windows 8.1/

2020-07-04 21:08:43

忘記電腦密碼，修改開機密碼

在生活中偶爾會碰到忘記了自己的電腦開機密碼，那麼試試下面的方法。使用U盤進行修改密碼準備：1個4G或以上的U盤，另一個可以打開的電腦(沒有的去網吧) 1.前往http://www.uqidong.asia/uqdpe/下載製

2020-07-04 02:27:53

VMware Workstation 無法恢復錯誤: (vmx) Exception 0xc0000006 (disk error while paging) has...

我在運行vmware workstation時，報如下錯誤： Warning: the system was unable to load a page of memory; this can be caused by net

2020-07-02 10:37:28

Android開發工具篇：華爲手機root

參考鏈接：http://tieba.baidu.com/p/3303530058?see_lz=1

2020-07-01 15:03:56

Linux高性能計算集羣 - 概述

1 集羣 1.1 什麼是集羣簡單的說，集羣（cluster）就是一組計算機，它們作爲一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集羣的節點（node）。一個理想的集羣是，用戶從來不會意識到集羣系統底層的節點，在他/她們看來

2020-06-30 15:50:46

推薦相關Linux cluster 信息的常用的網站

http://www.lcic.org/ 這個網站對於Linux cluster 初學者是有很好的幫助的，網站的分類清晰，內容齊全。不過，最近好像更新的內容不多了，當然這絲毫不影響初學者的學習。 *****************

2020-06-30 15:50:46

Norton Ghost批處理命令用法詳細介紹

.Ghost批處理文件的基本格式　　Ghost-clone,mode={copy│load│dump},src={drive│file│drive

2020-06-30 15:50:46

UnblockNeteaseMusic解鎖網易雲灰色歌曲（更新：用咪咕音樂可以免費聽）

UnblockNeteaseMusic解鎖網易雲灰色歌曲說明：UnblockNeteaseMusic是一款可以給你解除網易雲音樂變灰(無版權)歌曲的工具，讓你可以聽取客戶端任何的歌曲，而不受到限制原理：地址解析，採用QQ，咪咕，酷

2020-06-30 12:38:22

手機拍照需謹慎！教你查看手機圖片的拍攝地點！

如果你在用手機或平板拍照時開了GPS定位服務功能，其他用戶就可以通過你的照片查看出你的拍攝地點了。 1、上傳照片到PC端，打開照片屬性，查看詳細信息。你會發現這裏的信息真的很詳細，可以看到圖片拍攝時間，GPS等信息！ 2 通過經緯度轉

2020-06-28 08:58:08

聯想電腦G40讀取U盤沒有顯示的解決方法

今天，不知道是不是修改了磁盤的驅動器的名稱，導致自己的USB插入電腦後，沒有讀取。解決大的方法：右鍵“我的電腦”》“管理》”然後代開計算機管理》查看“設備管理”》通用串行總線控制線上面畫紅線那裏，只要點擊啓用就ok了，

2020-06-27 23:06:54

Windows下的仿linux環境msys2介紹

msys2是一種在Windows平臺上模擬Linux運行環境的技術，它的一個優點就在於利用pacman包管理器，我們可以比較輕鬆的使用Linux包管理器的方式來安裝一整套可以在Windows上運行的Linux工具。如果你只是想要在

过了即是客

2020-06-24 13:46:08

使用antigen輕鬆打造賞心悅目的shell環境

一提到Shell環境，很多人可能想到的就是那種神祕的黑框界面，但是其實Shell環境也可以設置成非常酷的樣子，並帶有自動完成、自動補全、人性化提示等各種功能。可能也有同學還聽說過ohmyzsh這類集成了各種Zsh插件的方便項目，今

过了即是客

2020-06-24 13:46:08

幾步命令輕鬆搭建Windows SSH服務端

這裏說的SSH，全名叫做Security Shell，相信經常用Linux的同學不會陌生。SSH最常見的作用就是用來遠程登錄其他系統的命令行界面，當然主要還是給Linux用戶使用的。但是其實現在Windows 10已經自帶了Ope

过了即是客

2020-06-24 13:46:08

Gentoo虛擬機安裝教程

Gentoo是一個非常著名的發行版，在Linux高手中非常流行。之前我也是被Gentoo的威名震懾了，所以一直沒有嘗試安裝，最近感覺可以嘗試一下了。所以今天來看看如何在虛擬機中安裝Gentoo吧。本文參考了Gentoo 安裝手冊，

过了即是客

2020-06-24 13:46:08

24小時熱門文章

最新文章

最新評論文章