Maraming mga application na haharapin ang mga unstructured data nangangailangan ng access sa teksto ng nilalaman ng format o minarkahan-up na mga dokumento. Organisasyon na-archive na dokumento ay madalas na nangangailangan ng access sa mga tekstuwal nilalaman upang gumawa ng mga dokumento nahahanap at paganahin ang nilalaman ng pagsasama-sama, pag-uulat at pagmimina ng mga archive dokumento. Maghanap at kailangan ding application na pagbawi ng i-extract at tokenize teksto mula sa iba't ibang mga format ng file.
Isang karaniwang mekanismo upang i-access at i-extract ang teksto mula sa mga dokumento ay ibinigay ng IFilter plug-in interface na ginagamit sa Microsoft search engine. Mayroong ilang mga pagpapatupad IFilter binuo ng Microsoft at iba pang vendor na sumasaklaw ng iba't-ibang mga format ng file. Nag-iiba ang standard o pagiging maaasahan at teksto ng pagkuha ng kalidad sa maraming mga IFilter mga developer.
Opait Mga Filter ng Teksto ay isang maliit na utility na programa na may isang simpleng interface upang IFilters na naka-install sa computer na host pati na rin ang ilang mga custom na teksto filter bunutan na makipagtulungan nang direkta sa mga format ng file at mapabuti sa mga pagpapatupad default IFilter.
. Ang interface i-extract ang teksto ay ibinigay ng isang maliit na klase library na tinatawag na Opait.Filters na kung saan ay isinama at maaaring magamit upang isama ang mga filter ng teksto sa .NET application
Mga Kinakailangan :
.NET Framework 4.5
Mga Komento hindi natagpuan