LanguageTool ay isang open source pagwawasto programa na dinisenyo upang mahanap ang mga error na regular na kasangkapan spell checker ay hindi maaaring matagpuan. Ito ay isang tuntunin-based na estilo at grammar checker na makahanap ng mga error para sa kung saan ang isang patakaran ay tinukoy sa kanyang mga file configuration XML, tulad ng paghahalo up & ldquo; kanilang & rdquo; sa & ldquo;. doon & rdquo;
Nakikilala ang iba't-ibang mga problema sa grammar
Maaari din na tuklasin ang programa ng iba't-ibang mga problema sa grammar at lumapit sa suporta para sa higit sa 20 mga wika, kabilang ang Ingles, Aleman, Polish, Pranses, Espanyol, Swedish, Greek, Chinese, Danish, Japanese, Icelandic, Portuguese at Brazilian Portuguese.
Bukod dito, ipinagmamalaki ito ng isang madaling-gamitin na, simple at tapat graphical user interface na nagbibigay-daan sa kahit sino upang i-paste ang teksto na kailangang spell check. Maaari itong i-check ang teksto sa clipboard, tag ng teksto, cut / copy / paste ng teksto, at naninirahan sa system tray area.
Nakikilala ng isang malawak na hanay ng mga problema
Mula sa dialog na Mga Pagpipilian, maaari mong paganahin kung anong uri ng mga problema ay maaaring tuklasin ang mga application, kabilang ang mga masamang style, mga pagkakamali sa grammar, slang, bantas error, posibleng typo, kalabisan parirala, karaniwang nalilito salita, collocations, capitalization, semantics, pati na rin bilang non-standard na mga parirala.
LanguageTool para LibreOffice at OpenOffice
Bukod sa pagiging isang standalone na aplikasyon, LanguageTool ay magagamit bilang isang extension para sa dalawang sa mga pinaka-popular at malakas na suite ng opisina open-source, LibreOffice at Apache OpenOffice.org din, na nagpapahintulot sa mga user upang proofread ang kanilang mga teksto sa pamamagitan ng pag-right click sa mga piniling parirala o talata.
LanguageTool para sa Mozilla Firefox
Sa karagdagan, ang application ay makukuha para sa pag-download bilang isang add-on para sa mundo & rsquo din; pinaka-popular na open-source na web browser s sa mundo, Mozilla Firefox. Ito ay hindi nangangailangan restart at lugar ng isang maliit na pindutan sa pangunahing toolbar, na nagpapahintulot sa iyo upang proofread highlight ng teksto mula sa mga website o mga form.
Sa ilalim ng hood at availability
Ang application ay lubos na nakasulat sa Java programming language, na nangangahulugan na ito & rsquo; ay isang cross-platform software, na dinisenyo upang gumana sa anumang pamamahagi GNU / Linux, pati na rin ang BSD, Solaris, Microsoft Windows at Mac OS X operating system, kung saan ang Java Runtime Environment ay naka-install.
Ano ang bago sa release na ito:
- Catalan:
- update Pos dictionary tag na
- nagdagdag ng bagong mga patakaran
- fixed maling alarma
- English:
- Idinagdag ang ilang mga alituntunin at naayos ng ilang mga maling alarma
- Added maraming mga patakaran bagong estilo na iniambag sa pamamagitan Heikki Lehvaslaiho. Tulad ng mga maaaring maging sanhi ng mga maling alarma, sila ay hindi aktibo sa pamamagitan ng default. Maaari mong i-activate ang mga ito sa pamamagitan ng pag-on ng lahat ng mga patakaran sa bagong kategorya 'Plain Ingles'.
- Esperanto:
- nagdagdag ng ilang mga bagong alituntunin
- French
- update Pos dictionary tag at dictionary Hunspell sa Dicollecte-5.3
- Aleman:
- nagdagdag ng ilang mga bagong alituntunin at fixed maling alarma
- Nagdagdag ng bagong patakaran na tseke para sa kasunduan subject verb. Para sa ngayon, lamang ng kaso sa 'ist', 'sind', 'war', at 'Waren' ay suportado. Halimbawa para sa mga error na natagpuan: '. Der Hund sind scha & para; n', 'Mamatay ist Schnell Autos.' Upang gumawa ng mga ito ng trabaho patakaran, parirala ay pinag-isa ngayon sa disambiguation.xml: halimbawa, 'Mann' sa phrase 'EIN Mann' ay mananatili lamang palagyo pagbabasa nito (sub: NOM: KASALANAN: MAS), habang ginagamit ito upang magkaroon din ng accusative at datibo pagbasa (sub: AKK: KASALANAN: MAS, sub: DAT: KASALANAN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
- Italyano:
- pinahusay ng ilang mga alituntunin
- Polish:
- nagdagdag ng ilang mga bagong alituntunin
- Portuguese:
- idinagdag / pinabuting ilang mga patakaran
- 3695 tambalang salita (pre-reporma) - ang pinakamalaking libreng database
- Russian:
- naidagdag at pinagbuting mga patakaran
- Ukrainian:
- malaking update dictionary
- bagong patakaran grammar
- bagong simpleng palitan tuntunin para sa soft suhestiyon
- pagpapabuti disambiguator
- compound tagging at pagbaybay ng mga pagpapabuti
- initials
- pangungusap at salita pagpapabuti tokenizing
- pinabuting paghawak ng mga simbolo stres at malambot na gitling
- Bitext alituntunin:
- nagdagdag ng isang simpleng patakaran para sa paglalagay ng tsek kung ang mga pagsasalin dulo na may parehong punctuation mark bilang ang orihinal na (kasama na ito lamang.?! Character).
- ito ay posible na ngayon upang magdagdag ng mga panlabas na file bitext tuntunin sa command line, sa pamamagitan ng paggamit
- -bitextrule option. Ang file path ay upang maging ganap. Note:. Ito ay nagpapahintulot sa paggamit ng bitext patakaran din para sa wika na may walang mga patakaran bitext kasama sa pamamagitan ng default
- Spelling:
- Ang bagong file sa /hunspell/spelling.txt ay maaaring gamitin upang magdagdag ng mga tinanggap na mga salita sa spell checker na ay itinuturing din na kapag lumilikha ng mga mungkahi para sa misspelled salita. Ito ay katulad sa mga /hunspell/ignore.txt file, na listahan tinanggap salita na hindi * ay ginagamit * kapag lumilikha ng mga mungkahi para sa misspelled words.
- API:
- JLanguageTool.activateDefaultPatternRules () at JLanguageTool.activateDefaultFalseFriendRules () ay inalis - lahat ng patakaran pattern at mga patakaran false kaibigan (kung ang isang pangalawang wika ay tinukoy) ay ngayon awtomatikong aktibo kapag ang tagapagbuo ng JLanguageTool ay tinatawag na. Dapat kailangan mo ng isang checker na walang mga patakaran pattern XML-based, palawigin ang iyong mga klase ng wika (eg 'English') na may isa na overwrites ang getPatternRules () method at nagbabalik ng isang walang laman na listahan doon.
- ManualTagger.lookup () ay papalitan ng ManualTagger.tag () matapos na pinapagamit dahil sa ang pinakabagong release
- Lahat ng static na pamamaraan at patlang mula sa klase 'Language' ay inilipat na sa bagong class 'Wika'. Sa ngayon, ang mga paraan / umiiral na patlang sa klase Language pa rin ngunit ito ay pinapagamit.
- LanguageIdentifierTools ay tinanggal. Gamitin LanguageIdentifier halip.
- Inalis (Default) ResourceDataBroker.setResourceDir () at setRulesDir () bilang mga ito ay maaaring itakda sa mga tagapagbuo
- Nalinis up up klase Contributor, hal pag-alis getRemark ()
- Category.setDefaultOff () ay tinanggal, ito ay maaaring itakda sa pamamagitan ng constructor ngayon
- Pinalitan ng pangalan klase: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
- Iba pang mga maliliit cleanups API na hindi dapat makaapekto sa mga karaniwang mga kaso gamitin, hal IncorrectExample.getCorrections () nagbabalik at unmodifiable list ngayon, pag-aalis ng pinapagamit na pamamaraan.
- Naka-embed na server:
- XML escaping ay maayos, ito ay maaaring maging sanhi ng hindi wastong mga dokumentong XML na ibabalik
- bagong opsyon config file 'maxWorkQueueSize' na nagbibigay-daan sa iyo na itakda ang maximum na laki ng pila kahilingan - kung ito ay makakakuha ng mas malaki kaysa ito, kahilingan ay tinanggihan (hindi magagamit 503 Service)
- Ang server ay tumutugon ngayon sa mas tiyak na code ng katayuan ng HTTP sa mga kondisyon ng error: 413 Request Entity Too Large - kung text lumampas Hindi magagamit maximum na laki ng teksto 503 Service - kung ito ay lumampas check maximum na oras ng check
- GUI:
- Ang stand-alone GUI ay maaari na ngayong kumuha ng isang plain text file bilang isang argument, ang file na ito ay pagkatapos ay nai-load sa startup (Github isyu # 232).
- Command-line:
- Ito ay posible na ngayon upang idagdag ang isang panlabas na file rule kapag tumatawag LanguageTool mula sa linya ng command. Gamitin --rulefile upang magdagdag ng isang file. Kung ang file name ay isang format na naglalaman ng isang pangalan ng wika, ito ay ginagamit sa tabi ng iba pang mga alituntunin; sa kabilang banda, ito ay palitan ang mga patakaran. Maaari mo ring i-load ang isang panlabas na file na may maling mga kaibigan sa pamamagitan ng paggamit ng mga --falsefriends option. Dapat maging isang absolute path ng file Ang pangalan ng file, at mga bulaang kaibigan file ay palaging idinagdag sa mga na-load para sa wika. (Github isyu # 192)
- syntax Rule:
- Ang patakaran ay maaaring magkaroon ngayon ng isang solong halimbawa ng pangungusap hangga't ito ay isang 'pagwawasto' attribute - ito ay maaaring i-save ang ilang mga kalabisan kung ang tanging wastong pangungusap ay ang parehong bilang ng mga hindi tamang pangungusap sa pagwawasto inilapat. Bago, kailangan ng hindi bababa sa dalawang mga halimbawa ng mga pangungusap ng isang patakaran.
- 'halimbawa' elemento: type = "hindi tamang" ngayon ay opsyonal kung may isang 'pagwawasto' attribute. Nagpapahiwatig ang 'pagtutuwid' attribute na ang pangungusap ay hindi tama.
- 'halimbawa' elemento: type = "tamang" ay opsyonal na ngayon. Hindi 'type' na katangian at hindi 'pagwawasto' attribute ay nagpapahiwatig na ang mga pangungusap ay tama.
- Internal:
- Kami ay lilipat mula sa Apache Tika sa language-detector (https://github.com/optimaize/language-detector) para sa awtomatikong pagkilala ng wika ng teksto. Ito ay mas mabilis dapat at dapat na maging mas maaasahang mga resulta. Pagtuklas ng Asturian at Galician nagkaroon na pinagana dahil sa kalidad ng pagtuklas ay masyadong mababa at apektado rin sa pagtuklas ng mga Espanyol.
- Mga Fixed isang pagbabalik na ginawa ito imposible upang i-load panlabas na mga file tuntunin sa GUI.
Pagpapabuti tagging
Ano ang bago sa bersyon 2.8:
- Asturian:
- dahil dependency sa Hunspell, ngayon ay gumagamit ng Morfologik para sa spell checking
- Breton:
- idinagdag at pinahusay ng ilang mga alituntunin
- Catalan:
- update dictionary
- naidagdag at pinagbuting mga patakaran
- fixed maling alarma
- Dutch:
- naidagdag at pinagbuting maraming mga patakaran
- English:
- ilang mga bagong patakaran (salamat sa Nick Hough)
- update ang tagapaglagay ng mga tag at mga synthesizer diksyunaryo, pag-aayos ng isyu # 202
- bagong filter na gagamitin para sa pagtutugma ng mga partofspeech ng mga bahagi ng mga salita, hal.: Sa * Ito ay panatilihin lamang ang mga tugma para sa mga salita na nagsisimula sa 'in' at kung saan ang bahagi matapos ang 'in' ay isang pang-uri (Pos tag 'JJ'). Ang 'no: 1' ang token na posisyon, ibig sabihin dito ang unang (at lamang) matching ay tatawagin .
- Pranses:
- idinagdag at pinahusay ng ilang mga alituntunin
- Aleman:
- idinagdag at pinahusay ng ilang mga alituntunin
- Polish:
- naidagdag at pinagbuting ilang mga patakaran
- naidagdag at pinagbuting maling kaibigan sa Ingles
- Portuguese:
- idinagdag / pinabuting ilang mga patakaran
- Spanish:
- dahil dependency sa Hunspell, ngayon ay gumagamit ng Morfologik para sa spell checking
- reformatted patakaran file
- Idinagdag pa alituntunin
- Tagalog:
- dahil dependency sa Hunspell, ngayon ay gumagamit ng Morfologik para sa spell checking
- pagsugod character ("") ay isang delimiter ngayon kapag tokenizing ang teksto
- Russian:
- naidagdag at pinagbuting mga patakaran
- nagdagdag ng ilang mga alituntunin false kaibigan (Russian / English)
- Ukrainian:
- maraming bagong patakaran (kabilang ang mga kasunduan sa mga pangngalan, time expression atbp)
- coverage patakaran pagpapabuti
- update dictionary (malaking pagpapabuti para sa pangngalang pantangi at vocative kaso)
- bagong tag at patakaran upang balaan tungkol sa alternatibong spelling
- idinagdag na impormasyon salita dalas upang mapabuti ang mga mungkahi sa pagbaybay
- ilang mga bagong patakaran disambiguator
- Rule Syntax:
- ... maaari na ngayong idinagdag sa isang rulegroup na makakaapekto sa lahat ng mga patakaran ng grupo na
- Kung ikaw ay bumuo ng iyong sariling mga patakaran na hindi bahagi ng lt maaari mo na ngayong magdagdag ng mga panlabas = "oo" sa iyong mga kategorya upang maiwasan ang link tuntunin sa community.languagetool.org mula sa paglitaw sa aming standalone GUI (ang link ay hindi gumagana para sa mga patakaran na ito ay hindi bahagi ng pangunahing pamamahagi ng LT). (Github isyu # 223)
- Kung ang tumutukoy sa isang grupo tuntunin default = "off", ang mga patakaran sa loob ng pangkat na tuntunin ay hindi maaaring ring tukuyin default = "on" / "off".
- API:
- Inalis klase at mga pamamaraan na ay pinapagamit dahil 2.7 o mas matagal pa
- Naka-embed na server:
- Ang mga opsyon config file 'requestLimit' at 'requestLimitPeriodInSeconds' ay maaari na ngayong ring gamitin para sa mga HTTP server (hindi lamang para sa mga server HTTPS)
- Bagong option config file 'trustXForwardForHeader': itakda ito sa 'true' kung nagpapatakbo ka ng mga server sa likod ng isang reverse proxy at gusto ng mga limitasyon ng kahilingan sa trabaho sa mga orihinal na mga IP address na ibinigay sa pamamagitan ng 'Xforwardedfor' HTTP header, karaniwan na itinakda ng proxy. Kung nagpapatakbo ka sa likod ng isang proxy ngunit hindi nagtakda ang property na ito sa totoo, ay maaaring gumamit ng isang user sa lahat ng mga kahilingan sa gayon ay magkakaroon din ng iba pang mga gumagamit na makakuha ng isang error na mensahe dahil sa mga limitasyon sa kahilingan.
- Ayusin ang mga tugon ng Pagkatapos ng Deadline mode: ... ay minsan walang laman, nakalilito check ang teksto sa WordPress
- Bitext patakaran ay hindi pinagana ng maayos, kahit na sila ay tinukoy sa isang tamang parameter para sa mga server; ngayon ito ay naayos
- Mga Fixed problema sa hindi tamang posisyon para sa ilang mga alituntunin bitext (isyu # 218)
- GUI:
- Ang isang bagong setting 'errorColors' ay naidagdag na sa ang configuration languagetool.cfg file. Ito ay maaaring gamitin upang itakda ang kulay ng background ng error. Halimbawa, errorColors = typographical: # b8b8ff, style: # ffb8b8 ay ipapakita ang 'typographical' error na may asul na background at 'style' ang mga error sa isang pulang background sa bandang itaas na bahagi ng lt window. 'Typographical' at 'style' ay ang mga uri na naka-set sa grammar.xml bilang "type = ...". Walang user interface pa upang isaayos ang mga kulay. Tandaan na dapat i-edit mo lamang ang languagetool.cfg file kapag lt ay hindi tumatakbo.
- Internal:
- Bugfix: Mga patakaran sa loob ng isang grupo tuntunin ay hindi na-activate kung ang isang naunang patakaran mula sa parehong rulegroup ginagamit default = "off"
- Mga salita ay hindi pinansin anymore pamamagitan ng spell checker dahil lamang sila ay magaganap sa suggestion ng isang patakaran ni. Kung nais mo ang spell checker na balewalain salita globally, idagdag ito sa hunspell / ignore.txt. Upang huwag pansinin ang mga ito depende sa konteksto, magdagdag ng isang 'ignore_spelling' rule na disambiguation.xml.
- Ang isang file 'hunspell / prohibit.txt' maaari na ngayong gamitin upang markahan salita bilang mga error sa spelling kahit na ang spell checker ay normal sa kanila tanggapin. Ito ay kapaki-pakinabang upang mapabuti ang LanguageTool spell checker nang hindi na naghihintay para sa upstream checker ma-update. Ang file 'prohibit.txt' ay ang kabaligtaran ng 'ignore.txt', na nagiging sanhi ng spell checker na balewalain salita.
- Ang partofspeech tagapaglagay ng mga tag para sa karamihan ng mga wika ay maaaring ngayon ay pinalawak na sa pamamagitan ng pagdaragdag ng mga entry sa file org / languagetool / resource / XX / added.txt (XX na ang code ng wika). Ang format ay "fullform baseform postag", tatlong haligi na pinaghihiwalay ng mga tab. Ginagawa nitong mas madali para sa mga gumagamit (at developer) na palawigin ang Pos tagapaglagay ng mga tag, tulad ng hindi nila kailangan mag-export, baguhin, at muling likhain ang mga binary diksyunaryo para sa bawat pagbabago.
Ano ang bago sa bersyon 2.7:
- Breton:
- naidagdag at pinagbuting mga patakaran
- Bagong rule na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "Gwener 28 a viz Eost 2014", gaya ng petsa na ito ay hindi isang Biyernes.
- Catalan:
- naidagdag at pinagbuting mga patakaran
- fixed maling alarma
- Dutch:
- naidagdag at pinagbuting maraming mga patakaran
- inililipat sa batay Morfologik spell checker
- -Paglalagak sa Ingles:
- Nais mo bang maging bahagi ng koponan na bubuo ng mga pinaka-makapangyarihang pagwawasto tool Open Source sa mundo? Kami ay naghahanap para sa isang maintainer para sa mga patakaran ng Ingles sa LanguageTool. Tingnan http://wiki.languagetool.org/tasks-for-language-maintainers para sa mga detalye.
- Lahat ng mga diksyunaryo English ay pinalawig na naglalaman ng salita dalas klase upang mapabuti ang mga mungkahi spell checker (ang dalas ng data ay nakuha mula https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / Latin / diksyonaryo, bilang para sa iba pang mga wika na na gamitin ang tampok na ito).
- Mas mahusay na mga mungkahi para sa mga nag-aaral English: irregular pandiwa, nouns, at pang-uri na ngayon ay karaniwang may isang mas mahusay na mungkahi. Halimbawa, 'thinked' ay nagpapahiwatig 'naisip', 'womans' ay nagpapahiwatig 'babae'.
- More maling pagbabaybay magbigay ng mga mungkahi ngayon, eg 'Garentee' (garantiya), 'nagpapasalamat' (nagpapasalamat). Ito ay maaaring maging sanhi ng isang pagbawas sa pagganap ng ~ 10% (higit pa para sa mga teksto na may maraming mga di-kilalang salita).
- Bagong rule na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "Lunes, Oktubre 7, 2014", tulad ng petsa na ito ay hindi isang Lunes. Ang patakaran na ito ay gagana lamang kung ito ay nakikita ang format ng petsa sa paggamit. Sa ngayon, ang mga format na sinusuportahan: * "Lunes, Oktubre 7, 2014" * "Lunes, Oktubre 7, 2014" * "Lunes, Oktubre 7, 2014" * "Lunes, Oktubre 7, 2014" * (na ito ay gumagana rin sa dinaglat na linggo araw na tulad Mo o Mon para sa Lunes)
- Esperanto:
- Bagong rule na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "Vendredon la 28-an de AAgusto 2014", gaya ng petsa na ito ay hindi isang Biyernes.
- Pranses:
- update Pos dictionary tag at dictionary Hunspell sa Dicollecte-5.2
- nagdagdag ng isang synthesizer - ang kasunduan patakaran ay maaari na ngayong gumawa ng mga mungkahi para sa ilang mga error
- idinagdag / pinabuting ilang mga patakaran
- Bagong rule na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "vendredi 28/08/2014", tulad ng petsa na ito ay hindi isang Biyernes.
- Aleman:
- Mga Fixed isang bihirang NullPointerException at isang ArrayIndexOutOfBoundsException
- Mga Fixed ilang mga maling alarma
- Added at pinabuting mga patakaran
- Bagong rule na tseke para sa mga pangungusap na walang pandiwa (naka-off sa pamamagitan ng default dahil sa ang panganib ng mga maling alarma)
- Bagong rule na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "Dienstag, 2014/09/29", tulad ng petsa na ito ay hindi isang Martes.
- pagpapabuti ng pagganap para sa mga mungkahi spell check
- Persian:
- idinagdag paunang suporta para sa Persian (Farsi)
- Polish:
- idinagdag at pinabuting ilang mga patakaran
- bagong tuntunin na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa
- Portuguese:
- idinagdag / pinabuting ilang mga patakaran
- nagdagdag ng maraming mga dose-dosenang ng mga tambalang salita li>
- Russian:
- nagdagdag ng bagong mga patakaran
- ayusin SourceForge tampok na kahilingan # 38 (check para sa iba't ibang mga panipi)
- nagdagdag ng ilang mga alituntunin false kaibigan (Russian / English)
- bagong tuntunin na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", tulad ng petsa na ito ay hindi isang Lunes .
- pinalawak Russian compound patakaran na may bagong mga salita mula sa diksyunaryo postag
- Spanish:
- Nagdagdag ng bagong kategorya Pos Z (para sa nabaybay na mga numero, hal 'uno', 'dos', ...)
- nabaybay numero ay maaari na ngayong nakita at pinamamahalaang pareho sa paglilinaw at mga patakaran.
- Mga Fixed ilang mga maling lemmas sa diksyunaryo Pos.
- Added Hybrid chunker-disambiguator.
- Tamil:
- Added paunang suporta para sa Tamil. Kung ang mga font para sa Tamil ay hindi maayos na ipinapakita sa iyong computer at gumagamit ka ng Windows, maaaring kailanganin mong mag-apply sa mga trabaho sa paligid ng inilarawan dito: https://bugs.openjdk.java.net/browse/JDK-8008572
- Ukrainian:
- malaking update para dictionary Pos (pag-aayos at bagong salita)
- ilang Pos tag na pinalitan ng pangalan para sa pagbabago; bagong mga tag para sa mga daglat at bihirang mga salita li>
- maraming bagong patakaran at mga pag-aayos para sa mga umiiral na mga patakaran
- bagong tuntunin na tseke kung ang isang karaniwang araw ay tumutugma sa isang petsa, eg Nakikilala "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N- & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", gaya ng petsa na ito ay hindi isang Lunes
- token pagpapabuti ng pagganap normalisation
- integration LibreOffice:
- Hindi makakuha ng nalilito sa pamamagitan ng mga footnote sa LibreOffice 4.3 at mamaya (ito ngayon ay nagbibigay sa amin ng mga posisyon footnote bilang meta data, upang maaari naming huwag pansinin ang mga ito).
- API:
- Major pagpapabuti ng pagganap para sa mga kaso ng paggamit ng multi-thread, kung saan JLanguageTool makakakuha ng nilikha per thread, ngunit ang wika object (eg 'German') ay makakakuha ng nilikha beses lamang. Overhead para sa paglikha JLanguageTool dapat na ngayon ay lubhang mas mababa.
- Inalis ang ilang mga klase at mga pamamaraan na ay pinapagamit dahil ang bersyon 2.6
- Inalis DutchSpellerRule - sa halip na gumamit ng MorfologikDutchSpellerRule
- Ang lagda ng Language.getRelevantRules () ay nagbago
- Ang JLanguageTool at MultiThreadedJLanguageTool constructor ay hindi idedeklara upang ihagis ng isang IOException anymore
- WhitespaceRule ay pinalitan ng pangalan upang MultipleWhitespaceRule (WhitespaceRule umiiral pa rin ngunit ito ay hindi na ginagamit)
- deprecate ang ilang mga paraan na ang visibility ay nabawasan (eg mula sa pampublikong upang protektado)
- MorfologikSpellerRule.getRuleMatch (String, int) ay pinalitan ng pangalan upang MorfologikSpellerRule.getRuleMatches (String, int)
- Ang RuleMatch constructor throws ngayon ng isang exception kung toPosition ay hindi mas malaki kaysa sa fromPosition
- Nagpasimula ng isang bagong abstract class TextLevelRule na umaabot Rule at na maaaring magamit para sa mga patakaran na sumasakop sa higit sa iisang pangungusap.
- Command line:
- Ang pagpapaandar at hindi pagpapagana ng mga tiyak na patakaran sa parehong oras ay pinahihintulutan ngayon. Upang subukan ang ilan lamang sa mga patakaran (hindi pagpapagana ng lahat ng mga natitirang), na dati ay ginagawa sa "--enable LIST_OF_RULES", na ngayon gamitin ang "--enabledonly --enable LIST_OF_RULES" (o "-eo-e LIST_OF_RULES").
- Naka-embed na server:
- Dalawang bagong mga pagpipilian ay maaaring itakda sa mga katangian ng file upang gumawa LanguageTool ibalik ang parehong XML format bilang Matapos ang Deadline (ATD). Sa ganitong paraan maaari itong gamitin bilang isang drop-sa kapalit para sa ATD: * mode - 'LanguageTool' o 'AfterTheDeadline' * afterTheDeadlineLanguage - code ng default na wika kung ang mode ay nakatakda sa 'AfterTheDeadline' NOTE: dapat isaalang-alang ang 'AfterTheDeadline' mode experimental para sa ngayon.
- 'maxCheckThreads' Ang bagong opsyon ay nagbibigay-daan sa pagtatakda ng maximum na bilang ng mga thread na nagtatrabaho sa mga kahilingan sa pagpaparis. Ang default ay 10, dahil ito ay ginagamit na.
- Internals:
- New abstract AbstractDateCheckFilter patakaran na nagbibigay-daan upang suriin kung ang isang araw at petsa week match. Halimbawa "Martes, Septiyembre 29, 2014" ay maaaring napansin, bilang Septiyembre 29, 2014 ay hindi talaga isang Martes. Ito ay gumagamit ng bagong experimental RuleFilter interface na maaaring tinawag mula sa XML na may bagong 'filter' element. 'Filter' tumatagal ng mga katangian: 'class': ang ganap na kwalipikadong pangalan ng isang Java class na nagpapatupad RuleFilter, eg "Org.languagetool.rules.de.DateCheckFilter" 'args': isang string tulad ng "taon: 1 buwan: 2 araw 3 araw na simple: 4", ibig sabihin, ang isang puwang-separated list ng mga pares key / halaga, kung saan ang x ay makakakuha ng nalutas na value token ang pattern ay (tulad ng sa 'mensahe' element)
- Ang tambalan rule pinapansin ngayon token na nai-nabakunahan sa disambiguation.xml
- Ang aksyon "filter" sa disambiguator ay inilapat lamang ngayon sa Pos tag na tumutugma sa Pos tag ibinigay. Kung hindi sila tumutugma, ang mga tuntunin ay hindi na ginagamit.
- Kung ikaw ay pagpapalawak ng mga patakaran XML tulad ng inilarawan sa http://wiki.languagetool.org/tips-and-tricks#toc2, ang panlabas na tuntunin at paglilinaw ng mga file ay maaari na ngayong naka-host sa isang password-protected na server sa pamamagitan ng pagtukoy isang URL na tulad nito: http: // user: password@example.org/path/user-rules.xml
- Ang em dash ("a & euro;" ") ay ngayon ng isang tokenizing character para sa lahat ng mga wika
- Bagong tampok:
- Ang paggamit ng mga modelo ng wika
- LanguageTool ay maaari na ngayong gumamit ng data ngram. ngram data ay impormasyon tungkol sa kung paano madalas mangyari parirala sa isang wika. Sa kasalukuyan, ito ay gumagamit ng mga parirala ng haba 3.
- Ang data ay ginagamit ng isang patakaran English upang mahanap ang mga error homopon, tulad ng paghahalo up bulgar / course o likas na talino / sumiklab. LanguageTool ay nagkaroon ng ilang mga alituntunin ng ganitong uri ng dati, ngunit ngayon ay sumusuporta sa mga bagong tuntunin tungkol sa 900 ng nasabing salita pares / set.
- Ang data na kailangan para ito ay malaking (7GB para sa Ingles) at sa gayon ay hindi bahagi o LanguageTool.
- Ang data (Ingles lamang sa ngayon) at mas babasahin ay makukuha sa http://wiki.languagetool.org/finding-errors-using-big-data li>
- Paggamit ngrams gumagawa LanguageTool bahagyang mas mabagal kapag ang data ay naka-imbak sa isang SSD.
- Kung hindi naka-imbak sa isang SSD, ang pagganap ay maaaring husto mabawasan.
- Gamitin ang bagong --languagemodel pagpipilian sa command line client upang i-activate ang mga tuntunin na gumagamit ng data. Option na iyon ay hindi pa magagamit para sa stand-alone GUI.
Ano ang bago sa bersyon 2.4.1:
- Na-update Morfologik aklatan upang 1.8.3 upang ayusin mabagal mungkahi sa spell checker, na apektado ng hindi bababa sa en-US
Ano ang bago sa bersyon 2.4:
- Breton:
- SRX pangungusap tokenization
- idinagdag / pinabuting ilang mga alituntunin
- naayos ng ilang mga maling alarma
- fixed maling suhestiyon salamat sa idinagdag pagsusulit sa pagwawasto
- Catalan:
- idinagdag / pinabuting ilang mga patakaran
- fixed maling alarma
- ginawa karagdagan at mga pag-aayos sa diksyunaryo tagapaglagay ng mga tag
- dahil ang ilang mga salita mula sa diksyunaryo synthesis (tingnan filterarchaic.txt)
- idinagdag frequency data sa diksyunaryo tagapaglagay ng mga tag; frequency wordlist ay mula sa mga proyekto ng Gaia, sa Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
- English:
- idinagdag / pinabuting ilang mga alituntunin
- naayos ng ilang mga maling alarma
- Pranses:
- idinagdag / pinabuting ilang mga patakaran
- naayos ng ilang mga maling alarma
- Aleman:
- idinagdag / pinabuting ilang mga patakaran
- nagdagdag ng isang synthesizer ang mga tuntunin ng kasunduan ay maaari na ngayong gumawa ng mga mungkahi para sa ilang mga error (hindi lahat ng mungkahing ito ay tama, bagaman)
- Polish:
- idinagdag / pinabuting ilang mga patakaran, lalo na para sa mga gitling at paggamit dash
- idinagdag na impormasyon dalas para dictionary spellcheck; frequency wordlist ay mula sa mga proyekto ng Gaia, sa Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
- naayos ng ilang mga maling alarma
- Portuguese:
- idinagdag / pinabuting ilang mga patakaran (kabilang ang mga ito ngayon alituntunin gender "ng" / "o")
- ito ngayon ay may 3400+ tambalang salita li>
- ang jar file ay pinalitan ng pangalan upang languagetool.jar, mula sa dating languagetoolstandalone.jar upang maiwasan ang pagkalito tungkol sa kung ano standalone 'ay nangangahulugan na sa ganitong konteksto (github isyu # 29)
- para sa wika na may maraming mga patakaran (tulad ng Pranses o Aleman) pagganap sa mahabang teksto ay nadagdagan sa pamamagitan ng tungkol 2030%
- ayusin para threadsafety (maaaring maging sanhi ng tambay sa MultiWordChunker)
- taning ng isang bug kung saan tipak annotation ay hindi nasubok sa mga grupo
- fix: 1 at hindi pa sinusuri sa ...
- naayos ng isang bug sa pagsasama-sama ng mekanismo na tinapon ng ilan sa mga matching pagpapakahulugan prematurely
- idinagdag na suporta para tipak annotation sa disambiguator, at fixed isang bug sa mga token filtering sa tipak annotation
- update Morfologik aklatan upang 1.8.2 (aayos ng bug, mahigpit input katinuan suri, magdagdag ng data dalas sa diksyonaryo)
- idinagdag ang opsyon ng kabilang frequency ng data upang taggging o spelling diksyonaryo. Ang inaasahang format ng dalas wordlists ay ang isa sa mga proyekto ng Gaia, sa Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
- bagong command line tool upang i-export at lumikha ng binary dictionaries:
- org.languagetool.dev.DictionaryExporter
- org.languagetool.dev.POSDictionaryBuilder
- integration LibreOffice / OpenOffice:
- nagdagdag ng isang workaround para sa maling detection pangungusap para sa mga kaso na lumitaw ang isang footnote pagkatapos ng pangungusap na full stop (Sourceforge bug # 191)
- standalone GUI:
- Ang dialog na binuksan sa pamamagitan ng "More ..." item sa context menu ng isang error na ngayon ring ipakita ang tama at hindi tamang halimbawa pangungusap
- API:
- SentenceTokenizer ngayon ay isang interface, ang pagpapatupad ay inilipat sa RegexSentenceTokenizer, ngunit ito ay pinapagamit at SRXSentenceTokenizer halip ay dapat gamitin
- Ang ilang mga pamamaraan mula org.languagetool.tools.StringTools ay inilipat sa klase org.languagetool.gui.Tools sa proyekto languagetoolguicommons
- LanguageToolListener.languageToolEventOccured () ay pinalitan ng pangalan upang LanguageToolListener.languageToolEventOccurred ()
- org.languagetool.tools.SymbolLocator Hindi pampubliko anymore (hindi dapat makakaapekto sa kahit sino)
- dahil DanishSentenceTokenizer kung saan nagkaroon na pinapagamit para sa tatlong taon
- Rule.getCorrectExamples () at Rule.getIncorrectExamples () ay hindi bumalik null anymore ngunit isang walang laman na listahan kung walang mga halimbawa. Bilang resulta, setCorrectExamples () at setIncorrectExamples () ay hindi tumatanggap null anymore.
- Rule.getId () ay maaaring bumalik anumang string ngayon, hindi lamang ASCIIonly string (ang tunay na ito ay ang kaso bago, bilang ang ASCIIonly paghihigpit ay hindi kailanman ipapatupad at lamang na nabanggit sa mga javadoc)
- languagetoolwikipedia: ang mga opsyon na command line para sa pagsusuri ng isang dump Wikipedia ay pinasimple. Ang utos ay maaari na ngayong tinatawag na tulad nito: java jar languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Tumawag lamang ang "java jar languagetoolwikipedia.jar checkdata" upang makakuha ng isang mensahe na paggamit. Higit sa isang file ay maaaring tinukoy sa pamamagitan ng opsyon f. Bukod sa Wikipedia lungkot XML, CSV file mula sa Tatoeba (http://tatoeba.org) ay din suportado na ngayon, na kailangan nila upang ma-filter ang unang upang maglaman lamang ang mga kaugnay na wika.
Ano ang bago sa bersyon 2.3:
- Breton:
- idinagdag / pinabuting ilang mga alituntunin
- fixed maling alarma
- update dictionary Pos mula Apertium (svn r47282)
- Catalan:
- idinagdag na suporta para sa code ng wika ca-ES-valencia (Catalan Valencian), na gagamitin sa LibreOffice 4.2.0
- nagdagdag ng isang simpleng palitan patakaran sa daan-daang ng mga pamalit na mga mungkahi
- idinagdag / pinabuting ilang mga patakaran
- fixed maling alarma
- Intsik:
- nagdagdag ng isang workaround para sa isang StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
- English:
- idinagdag kapalit pattern para sa mga spelling checker upang gawing mas mahusay mungkahi (nag-aalok ngayon 'itinuro' para sa 'teached')
- idinagdag / pinabuting ilang mga alituntunin
- Pranses:
- idinagdag / pinabuting ilang mga alituntunin
- fixed maling alarma
- update Pos dictionary tag at dictionary Hunspell sa Dicollecte-4.12
- Aleman:
- idinagdag / pinabuting ilang mga patakaran
- Portuguese:
- idinagdag / pinabuting ilang mga alituntunin
- ito ngayon ay may 3300+ tambalang salita li>
- Ukrainian:
- idinagdag / pinabuting ilang mga patakaran
- ang source code ay inilipat sa github: https://github.com/languagetool-org/languagetool
- LanguageTool nangangailangan Java 7 ngayon
- LanguageTool gumagawa ng paggamit ng maramihang mga thread na ngayon para sa mga text na suri sa modernong hardware, pagpapabuti ng pagganap (na ito ang nakakaapekto sa stand-alone na bersyon, ang bersyon command line at ang LibreOffice / OpenOffice extension)
- syntax Rule:
- paunang suporta para sa bagong min / max katangian na magbibigay-daan upang tumugma sa isang sangkap na lalabas sa ibinigay na bilang ng beses. Halimbawa: foo ay tutugma wala o "foo", ibig sabihin, "foo" ay opsyonal foo ay tutugma "foo" o "foo foo" foo ay tutugma sa wala, "foo", o "foo foo" I max = "- 1" upang payagan ang unlimited Bahagi. Para sa min, 0 lamang o 1 ay suportado (1 ay ang default).
- suporta para sa OR-pahayag. Halimbawa: a loob at sa run-time, isang patakaran na naglalaman ng OR-pahayag ay convert sa ilang mga patakaran na walang OR-pahayag .
- English ngayon ay may isang chunker na matagpuan, sa gitna ng iba, isahan at maramihan n chunks. Ito ay dokumentado sa http://wiki.languagetool.org/using-chunks
- standalone na bersyon:
- underlines ngayon standalone na bersyon ng mga error na may isang red (spelling error) o blue (iba pang mga error) linya (Panagiotis Minos)
- Tandaan ang pagpili ng wika para sa susunod na start
- Pinahusay na window at dialog placement sa isang multi-monitor setup
- embed server: gumagamit ng default port (8081) muli kung nagsimula nang walang arguments
- update ang morfologik-stemming library sa bersyon 1.7.1 upang paganahin ang mas mahusay na mga mungkahi, kasama ang tamang paghawak ng diacritics at kapalit pattern (katumbas ng MAP at Rep tampok sa hunspell diksyonaryo)
- OpenOffice integration / LibreOffice:
- fix: ang "About" dialog ay hindi gumagana sa Apache OpenOffice 4.0
- ayusin: mga patakaran na partikular sa bansa (tulad ng para sa British English) ay hindi gumagana
- API:
- Sa klase Language, getCountryVariants () ay pinalitan ng pangalan upang getCountries (), at isang bagong paraan getVariant ay naidagdag na.
- Ang ilang mga pamamaraan ay pinapagamit
- Ang ilang mga pamamaraan ay inilipat mula sa Tools class (languagetool-core) sa bagong CommandLineTools class (languagetool-commandline)
Ano ang bago sa bersyon 2.2:
Ano ang bago sa bersyon 2.1:
Ano ang bago sa bersyon 2.0:
Kinakailangan :
- Java 2 Standard Edition Runtime Environment
Mga Komento hindi natagpuan