所需庫:
PyPDF2

文章插圖
os
pdf作為常見的文檔格式,在很多的應(yīng)用處合下,都需要提取其中的文字,然落后行編輯 。下面的腳本提供的就是提取文字 , 并寫入到文本文檔中 。
第5-6行創(chuàng)建了一個名為“temp”的文件夾;
13-22行程序則是讓用戶輸入pdf文檔和文本文檔的路徑 。當(dāng)用戶沒有輸入文本文檔的保存路徑時,則將文本文檔保存到“temp”文件夾內(nèi);
23-25行代碼 , 將讀取的pdf文檔轉(zhuǎn)換為PdfFileReader對象;
30-33行通過for循環(huán),提取每頁的pdf文檔中的文字 , 并保存到txt文件當(dāng)中 。
對于提取結(jié)果以下圖所示 。
【pdf轉(zhuǎn)txt文檔的 Python 趣味腳本】關(guān)于本次pdf轉(zhuǎn)txt文檔的問題分享到這里就結(jié)束了,如果解決了您的問題,我們非常高興 。
- 3DFY.ai
- Pictory:可將文字內(nèi)容轉(zhuǎn)變成短視頻
- PDF Expert:Mac 平臺最好的 PDF 編輯軟件
- 富士康的轉(zhuǎn)型發(fā)展
- 迅捷圖片轉(zhuǎn)換器
- 萬能圖片轉(zhuǎn)換器-APP
- 為何地球自轉(zhuǎn)速度變快?
- 視頻號怎么轉(zhuǎn)化流量為商品
- 愛吃泡菜的要注意,我也是現(xiàn)在才知道,看完記得轉(zhuǎn)告家里人
- 火車客服怎么轉(zhuǎn)人工?
