WordTabulator ay inilaan para sa pag-aaral ng teksto. Sa tulong ng wordTabulator maaari kang bumuo ng index ng mga elemento salita kinuha mula sa tinukoy na teksto set. Mga elemento ng Salita ay maaaring salita, N-gramo (ng tinukoy na laki) o parirala (syntagmes). Maaaring iproseso ang programa ang mga teksto tulad ng sa ordinaryong 2-byte encoding (ANSI), tulad ng sa multibyte UTF-8 na pag-encode. Pinagmulan ng mga teksto ay tinukoy bilang isang hanay ng mga flat na mga tekstong file na HTML o XML dokumento / / SGML. Sa huling kaso ay maaaring i-filter ang program na nilalaman mula sa markup. Bukod pa rito, maaari kang maproseso lamang tinukoy nilalaman sa loob ng napiling mga nakapares na mga tag. O maaari mong laktawan na nilalaman mula sa pagsasaproseso. Kasama dito ang morpolohiya module para sa Russian, tatlong magkakaibang mga format ng output index, tatlong iba't ibang uri ng elemento ng salita (salita, N-gramo at parirala), browser ng konteksto, at totoo alpabetikong pagkakasunud-sunod.
Mga detalye ng Software:
Bersyon: 3.5
I-upload ang petsa: 15 Apr 15
Lisensya: Libre
Katanyagan: 370
Laki: 2708 Kb
Mga Komento hindi natagpuan