所需庫:
PyPDF2

文章插圖
os
pdf作為常見的文檔格式,在很多的應用處合下,都需要提取其中的文字,然落后行編輯 。下面的腳本提供的就是提取文字 , 并寫入到文本文檔中 。
第5-6行創建了一個名為“temp”的文件夾;
13-22行程序則是讓用戶輸入pdf文檔和文本文檔的路徑 。當用戶沒有輸入文本文檔的保存路徑時,則將文本文檔保存到“temp”文件夾內;
23-25行代碼 , 將讀取的pdf文檔轉換為PdfFileReader對象;
30-33行通過for循環,提取每頁的pdf文檔中的文字 , 并保存到txt文件當中 。
對于提取結果以下圖所示 。
【pdf轉txt文檔的 Python 趣味腳本】關于本次pdf轉txt文檔的問題分享到這里就結束了,如果解決了您的問題,我們非常高興 。
- 3DFY.ai
- Pictory:可將文字內容轉變成短視頻
- PDF Expert:Mac 平臺最好的 PDF 編輯軟件
- 富士康的轉型發展
- 迅捷圖片轉換器
- 萬能圖片轉換器-APP
- 為何地球自轉速度變快?
- 視頻號怎么轉化流量為商品
- 愛吃泡菜的要注意,我也是現在才知道,看完記得轉告家里人
- 火車客服怎么轉人工?
