IT科技

當前位置 /首頁/IT科技 > /列表

如何提取PDF文字

現在的一些文檔資料會用PDF格式存儲,如果需要提取裏面的一些文檔內容直接複製則比較麻煩,如果要把裏的文字內容都導出來成為txt文本文檔的話,有哪些方法可以實現呢?接下來,就為大家介紹一下提取pdf文字的方法。

如何提取PDF文字

方法

平常我們打開查看都是用閲讀器打開PDF文件的,像常用的Adobe Reader就可以將PDF中的文本內容導出來,保存在txt文檔中。

如何提取PDF文字 第2張

首先我們用Adobe Reader打開PDF文檔,然後選擇“文件-另存為其他”,然後選擇“文本”,在彈出的另存為話框中設置文本保存位置和文件名點擊“保存”,這時候就會將當前文檔中的文本內容保存為txt文本文檔。我們可以打開查看保存的txt文件,文本內容都被導出來了,只是在排版上與原來的有些不同。

如何提取PDF文字 第3張

另外我們還可以運用文檔轉換工具來將pdf轉換為txt文檔,比如迅捷PDF轉換器。這種方法可以將pdf中的文本內容保存到txt中。

如何提取PDF文字 第4張

先打開轉換工具,選擇裏面的文件轉TXT選項,此選項可以將包括PDF在內的其他文檔格式轉換為txt文檔。然後把PDF文檔添加到工具中,一次可以添加多個進行轉換。在文件後面的頁碼選擇中我們可以輸入頁碼範圍,以此來設置對文檔指定頁面內容的轉換,然後為文檔設置輸出位置,最後點擊開始轉換,等待文件轉換完成就可以了。轉換好之後我們可以直接打開txt文件,PDF中的文本內容也都被保存到txt中了,而且在排版上與原文件基本差不多,這點要比用閲讀器另存為txt要好。

如何提取PDF文字 第5張
TAG標籤:提取 pdf #