PDFTextStream

Screenshot Software:
PDFTextStream
Mga detalye ng Software:
Bersyon: 2.6.0
I-upload ang petsa: 20 Feb 15
Lisensya: Shareware
Presyo: 1900.00 $
Katanyagan: 2

Rating: nan/5 (Total Votes: 0)

proyekto PDFTextStream ay isang PDF teksto at metadata pagkuha ng library magagamit para sa Java, Python, at .NET.
Sinusuportahan nito ang lahat ng mga bersyon ng detalye ng PDF na dokumento, (kabilang ang v1.6, na ginagamit ng Acrobat 7), pagkuha ng teksto na naka-encode gamit ang mga hanay ng mga double-byte na character (kabilang ang mga Chinese, Japanese, at Korean), decryption ng 40-bit at 128- bit na naka-encrypt na dokumento, at pagkuha ng lahat ng metadata ng dokumento na ibinigay ng mga dokumento na PDF (kabilang ang data ng form, mga bookmark at mga anotasyon).
Madaling pagsasama sa Jakarta Lucene Kasama

Ano ang bagong sa paglabas:.

  • Ang bersyon na ito ay may kasamang iba't-ibang mga pag-aayos na ginawa upang matiyak PDFTextStream ay may kakayahang pag-extract ang teksto mula sa PDF file na nonconforming sa pagtutukoy na PDF.
  • May kasama rin itong iba't ibang mga pagpapahusay sa pagganap.

Ano ang bagong sa bersyon 2.3.0:

  • Nagdagdag ng .isStruckThrough () na pamamaraan sa com. snowtide.pdf.TextUnit, na nagpapahiwatig kung ang isang karakter ay may strikethrough iginuhit sa pamamagitan nito.
  • Pinahusay na suporta PDFTextStream para sa naka-embed na mga pagmamapa ng character.
  • Ang kalkulasyon ng whitespace sa pagitan ng mga salita ay naayos upang maayos na account para sa whitespace na tahasan naka-encode sa mga dokumento pinagmulan PDF.
  • Pinahusay na pangangasiwa ng pinaghalong mga pag-encode ng nilalaman, na dati ay maaaring mabigo na nagreresulta sa ilang mga saklaw ng nilalaman PDF ina 'binabalewala' habang pagkuha ng PDFTextStream.
  • Ang Nakatakdang ng isang bug sa VisualOutputTarget kung saan ang teksto mula sa isang solong linya ay nahati sa paglipas ng maramihang mga linya
  • Pinahusay na vertical na pagkakahanay ng teksto Kinuha gamit VisualOutputTarget
  • Pinahusay na VisualOutputTarget-produce extracts upang maalis ang hindi totoo karagdagang whitespace sa pagitan ng malapit na-katabing mga salita

Ano ang bagong sa bersyon 2.2.5:

  • Ang release na ito ay nagdadagdag ng suporta para sa pag-extract ng data XFA mga form bilang XML.
  • Ito ay makabuluhang nagpapabuti sa pagganap ng pagkuha ng teksto gamit ang VisualOutputTarget. Suporta para sa mga dokumento na PDF mas malaki sa 2GB.
  • Ang isang pag-aayos para sa isang bug kung saan ang pag-encode mula sa naka-embed na font Type1 nauna nang hindi nailapat nang maayos sa ilang mga pagkakataon.
  • Ang isang pag-aayos para sa isang problema kung saan mas bagong nilalaman sa na-update na mga dokumentong PDF ay minsan hindi pinapansin.
  • Ang isang pag-aayos para sa isang problema kung saan PDFDocEncoding-encode ng mga bookmark at metadata ay hindi decoded maayos.
  • May .getDestinationName () na pamamaraan sa com.snowtide.pdf.Bookmark.

Mga Kinakailangan :

  • Apache Lucene

Mga komento sa PDFTextStream

Mga Komento hindi natagpuan
Magdagdag ng komento
I-sa mga imahe!