pdfminer3k ay isang port ng pdfminer nakasulat sa Python 3.
PDFMiner ay isang kasangkapan para sa pag-extract ng impormasyon mula sa mga dokumento na PDF. Hindi tulad ng iba pang mga tool na may kaugnayan PDF, ito ay nakatuon ganap sa pagkuha at pag-aaral ng data ng teksto.
Binibigyang-daan ka PDFMiner upang makuha ang eksaktong lokasyon ng mga teksto sa isang pahina, pati na rin ang iba pang impormasyon tulad ng mga font o linya. Ito ay nagsasama ng isang PDF converter na maaaring ibahin ang anyo ng mga PDF file sa iba pang mga format ng teksto (tulad ng HTML). Mayroon itong extensible PDF pang-parse na maaaring magamit para sa ibang layunin sa halip ng pag-aaral ng teksto
Ano ang bagong sa paglabas:.
- < li> Idinagdag pdfexplore, isang tool upang i-debug ang mga PDF sa pamamagitan ng paggalugad ng kanilang data.
- Huwag subukang i-textboxes pangkat kapag may masyadong maraming (ito ay tumatagal ng masyadong mahaba).
- Suporta sa bagay na sanggunian ng mga filter sa stream.
- I-parse ang bawat object sa lalong madaling isang objectid ay hindi mahanap.
- Pinahusay na mga MAHIGPIT-based na pangangasiwa ng error salitain.
Ano ang bagong sa bersyon 1.2.4:
- Kapag xref mga talahanayan ay sira,-parse at cache ng lahat mga bagay bilang isang fallback.
- Mga Fixed isang bogus badya sa mga layout.
Ano ang bagong sa bersyon 1.2.3:.
- Fixed isang pag-crash sa hindi pantay cmap code
- Mga Fixed isang meta-crash na sanhi ng masamang PSParser repr.
Mga Kinakailangan :
- Python
Mga Komento hindi natagpuan