Apache Solr

Screenshot Software:
Apache Solr
Mga detalye ng Software:
Bersyon: 7.2.1 Na-update
I-upload ang petsa: 22 Jun 18
Nag-develop: Yonik Seeley
Lisensya: Libre
Katanyagan: 3

Rating: 2.0/5 (Total Votes: 1)

Apache Solr ay isang bukas na pinagmulan, libre, platform-independent at mataas na pagganap na server sa paghahanap batay sa proyekto ng Apache Lucene, gamit ang XML / HTTP at JSON API. Ang proyekto ay kasalukuyang nasa ilalim ng inkubasyon sa Apache Software Foundation.


Mga tampok sa isang sulyap
Kabilang sa mga pangunahing tampok ang hit highlight, faceted search, caching, replication, interface ng pangangasiwa sa web, advanced na paghahanap ng mga full-text na kakayahan, na na-optimize para sa mataas na dami ng trapiko sa web, pati na rin ang mga bukas na interface na batay sa mga pamantayan, tulad ng HTTP , XML, at JSON.

Bukod pa rito, may mga komprehensibong HTML interface ng administrasyon, mga istatistika ng server, pagkakasunud-sunod ng auto index, auto recovery at failover, malapit sa real-time na pag-index, madaling ibagay at kakayahang umangkop sa XML configuration, at isang extensible plugin architecture.

Ang proyektong ito ay schemaless, na nagpapahintulot sa user na mabilis na makapagsimula sa Apache Solr. Ang parehong schema at schemaless mode ay sinusuportahan sa oras na ito, ngunit ang huli ay hahantong sa isang malakas na kapaligiran sa produksyon.

Iba't ibang mga uri ay sinusuportahan ng Solr, kabilang ang Mga Uri ng Patlang, na tutulong sa iyo upang makihalubilo at tumugma sa mga analyzer ng Lucene nang walang pagsusulat ng anumang piraso ng code. Bilang karagdagan, sinusuportahan ng proyekto ang mga dynamic na field na maaaring ma-enable sa on-the-fly.

Sa iba pang mga kagiliw-giliw na tampok, maaari naming banggitin ang pag-andar ng field ng kopya na nagbibigay-daan sa mga user na madaling pag-aralan ang parehong nilalaman gamit ang iba't ibang mga paraan, suporta para sa mga tahasang uri upang maalis ang pangangailangan para sa mga uri ng paghula ng mga patlang, mga custom na kumpigurasyon batay sa mga panlabas na file, pati na rin ang maraming karagdagang mga elemento sa pagtatasa ng teksto.


Sa ilalim ng hood at availability

Sa pagtingin sa ilalim ng hood ng Apache Solr, mapapansin namin na ang application ay isinulat nang buo sa Java programming language at sumusuporta sa 32-bit at 64-bit na distribusyon ng Linux, pati na rin ng Microsoft Windows at Mac OS X operating system.

Para sa iyong kaginhawahan, ito ay ipinamamahagi bilang parehong mga binary at mga archive ng pinagmulan, upang madali mong makapagsimula sa Apache Solr sa pinakamababang oras hangga't maaari at walang masyadong maraming problema.

Ano ang bagong sa paglabas na ito:

  • Hindi maaaring iproseso ng tagapangasiwa ang ilang huling mensahe.
  • Palitan ang pangalan ng core sa solr standalone mode ay hindi persisted.
  • Ang pag-parse ng rq parameter ng QueryComponent ay hindi na isinasaalang-alang ang parameter ng defType.
  • Ayusin ang NPE sa SolrQueryParser kapag ang mga tuntunin ng query sa loob ng isang sugnay ng filter ay wala na.

Ano ang bagong sa bersyon:

  • Bilang karagdagan sa maraming iba pang mga pagpapabuti sa balangkas ng seguridad, Kasama na ngayon ng Solr ang isang AuthenticationPlugin na nagpapatupad ng HTTP Basic Auth na nag-iimbak ng mga kredensyal nang ligtas sa ZooKeeper. Ito ay isang simpleng paraan upang mangailangan ng isang username at password para sa sinuman na ma-access ang admin admin screen o API.
  • Sa built AuthorizationPlugin na nagbibigay ng mahusay na kontrol ng grained sa pagpapatupad ng ACLs para sa iba't ibang mga mapagkukunan na may mga patakaran ng permisssion na nakaimbak sa ZooKeeper.
  • Ang JSON Facet API ay maaari na ngayong baguhin ang domain para sa mga command na facet, mahalagang paggawa ng isang bloke na sumali at paglipat mula sa mga magulang patungo sa mga bata, o mga anak sa mga magulang bago ang pagkalkula ng data ng facet.
  • Mga pangunahing pagpapabuti sa pagganap ng bagong Facet Module / JSON Facet API.
  • Query at Saklaw na Mga Facet sa ilalim ng Pivot Facets. Katulad ng JSON Facet API, ang mga facet ng pivot ay maaari kung paano ang iba pang mga uri ng facet tulad ng range at mga facet ng query.
  • Mas Katulad ng mga pagpipilian sa Parser ng Query na ito. Sinusuportahan na ngayon ng MoreLikeThis QParser ang lahat ng mga opsyon na ibinigay ng MLT Handler. Ang query parser ay mas maraming nalalaman kaysa sa handler habang gumagana ito sa cloud mode pati na rin kahit saan ang isang normal na query ay maaaring tinukoy.
  • Nagdagdag ng support API ng Schema sa SolrJ
  • Nagdagdag ng mode ng Pagmamarka para sa pagsali at pagharang ng query-time.
  • Nagdagdag ng format ng tugon ng Smile

Ano ang bago sa bersyon 4.10.3:

  • Solr 4.10.2 ay may kasamang 10 pag-aayos ng bug, pati na rin ang Lucene 4.10.2 at ang 2 mga pag-aayos ng bug nito.

Ano ang bago sa bersyon 4.6.1:

  • Apache Tika 1.4
  • Carrot2 3.8.0
  • Velocity 1.7 at Velocity Tools 2.0
  • Apache UIMA 2.3.1
  • Apache ZooKeeper 3.4.5
  • Pag-aayos ng Bug:
  • SOLR-5408: Hindi tama ang mga marka ng CollapsingQParserPlugin kapag maraming pamantayan sa pag-uuri ang ginagamit
  • (Brandon Chapman, Joel Bernstein)
  • SOLR-5416: CollapsingQParserPlugin Pinaghihiwa ang Tag / Ibinukod ang Faceting
  • (David Boychuck, Joel Bernstein)
  • SOLR-5442: Ang client ng Python ay hindi maaaring mai-parse ang proxied na tugon kapag nagsilbi ng Tomcat.
  • (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
  • SOLR-5445: Dapat na palaganapin ng mga proxied na tugon ang lahat ng mga header sa halip na ang una para sa bawat key.
  • (Patrick Hunt, Mark Miller)
  • SOLR-5479: Ang SolrCmdDistributor retry logic ay hihinto kung ang isang lider para sa kahilingan ay hindi matagpuan sa 1 segundo.
  • (Mark Miller)
  • SOLR-5532: Ang pagpapatunay na Content-Type ng SolrJ ay masyadong mahigpit para sa ilang mga webcontainer / proxy.
  • (Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler, Mark Miller)
  • SOLR-5547: Ang paglikha ng koleksyon alias gamit ang CollectionAdminRequest ng SolrJ ay nagtatakda ng pangalan ng alias at ng mga koleksyon sa alias sa parehong halaga.
  • (Aaron Schram, Mark Miller)
  • SOLR-5577: Malamang na hindi dapat pabagalin ng pag-expire ng ZooKeeper ang mga update ng isang ibinigay na halaga, ngunit sa halip ay i-cut off ang mga update pagkatapos ng isang naibigay na oras.
  • (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
  • SOLR-5580: NPE kapag lumilikha ng isang core na may parehong tahasang shard at coreNodeName.
  • (YouPeng Yang, Mark Miller)
  • SOLR-5552: Maaaring piliin ng lider na proseso ng paggaling ang maling pinuno kung ang lahat ng mga replicas para sa isang shard ay bumaba at nagsisikap na mabawi pati na rin mawawala ang mga update na dapat na mabawi.
  • (Timothy Potter, Mark Miller)
  • SOLR-5569 Ang isang kopya ay hindi dapat subukan at mabawi mula sa isang lider hanggang sa na-publish na ito ay ACTIVE.
  • (Mark Miller)
  • SOLR-5568 Ang isang SolrCore ay hindi makapagpapasiya na maging pinuno dahil lamang sa sinasabi ng kumpol ng estado na walang iba pang aktibong SolrCore.
  • (Mark Miller)
  • SOLR-5496: Dapat naming ibahagi ang isang manager ng koneksyon sa http sa hindi paghahanap ng HttpClients at matiyak na ang lahat ng mga http connection manager ay makakakuha ng shutdown.
  • (Mark Miller)
  • SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished ay maaaring maghintay magpakailanman kung ang serbisyo ng executor ay shutdown.
  • (Mark Miller)
  • SOLR-5586: Ang lahat ng ZkCmdExecutor ay dapat na nasimulan sa timeout ng zk client.
  • (Mark Miller)
  • SOLR-5587: Dapat gamitin ng mga pagpapatupad ng ElectionContext ang ZkCmdExecutor # ensureExists upang matiyak na ang kanilang mga landas ng halalan ay wastong nilikha.
  • (Mark Miller)
  • SOLR-5540: Ang HdfsLockFactory ay dapat na tahasang lumikha ng direktoryo ng magulang ng lock kung kinakailangan.
  • (Mark Miller)
  • SOLR-4709: Ang pangunahing reload pagkatapos ng pagtitiklop kung ang mga file ng config ay nabago ay maaaring mabigo dahil sa isang kondisyon ng lahi. (Mark Miller, Hossman))
  • SOLR-5503: Subukang muli ang mga kahilingan sa pinuno 'nang mas agresibo - sa halip na sa IOException at katayuan 500, ConnectException.
  • (Mark Miller)
  • SOLR-5588: Ang PeerSync ay hindi binibilang ang lahat ng mga pagkabigo ng pagkonekta bilang tagumpay.
  • (Mark Miller)
  • SOLR-5564: hl.maxAlternateFieldLength ay dapat ilapat sa orihinal na field kapag tinangka ang fallback
  • (janhoy)
  • SOLR-5608: Huwag payagan ang isang closed SolrCore na mag-publish ng estado sa ZooKeeper.
  • (Mark Miller, Shawn Heisey)
  • SOLR-5615: Deadlock habang sinusubukang mabawi pagkatapos ng pag-expire ng sesyon ng ZK.
  • (Ramkumar Aiyengar, Mark Miller)
  • SOLR-5543: Ang mga core swaps ay nagresulta sa mga duplicate na entry ng core sa solr.xml kapag gumagamit ng solr.xml na pagtitiyaga.
  • (Bill Bell, Alan Woodward)
  • SOLR-5618: Ayusin ang mga hit na false na cache sa queryResultCache kapag ang mga hashCode ay katumbas at dobleng mga query sa filter na umiiral sa isa sa mga kahilingan
  • (hossman)
  • SOLR-4260: Maaaring makabalik ang ConcurrentUpdateSolrServer # blockUntilFinished bago pa tapos na ang lahat ng dati nang naidagdag na mga update. Maaaring maging sanhi ito ng mga ibinahaging update na sinadya para maalis ang mga replicas.
  • (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
  • SOLR-5645: Ang isang SolrCore reload sa pamamagitan ng CoreContainer ay susubukan at magparehistro sa zk muli gamit ang bagong SolrCore.
  • (Mark Miller)
  • SOLR-5636: Ang SolrRequestParsers ay may ilang mga paghahanap sa xpath sa bawat kahilingan, na maaaring maging sanhi ng mga isyu ng concurrency.
  • (Mark Miller)
  • SOLR-5658: commitWithin at patungan ay hindi ipinamamahagi sa mga replicas ngayon na ginagamit ng SolrCloud ang javabin upang ipamahagi ang mga update.
  • (Mark Miller, Varun Thacker, Elodie Sannier, shalin)
  • Mga Pag-optimize:
  • SOLR-5576: Pagbutihin ang concurrency kapag nagrerehistro at naghihintay para sa lahat ng SolrCore upang magrehistro ng DOWN state.
  • (Christine Poerschke sa pamamagitan ng Mark Miller)

Ano ang bago sa bersyon 4.6.0:

  • Maraming mga pagpapabuti at pagpapahusay para sa mga pagpipilian ng paghahati ng shard
  • Bagong AnalyzingInfixLookupFactory upang magamit ang AnalyzingInfixSuggester
  • Bagong CollapsingQParserPlugin para sa mataas na pagganap na patlang na nag-collapsing sa mga mataas na patlang ng cardinality
  • Mga Bagong SolrJ API para sa pamamahala ng pagkolekta
  • Bagong DokBasedVersionConstraintsProcessorFactory na nagbibigay ng suporta para sa mga na-configure na mga tuntunin ng doc-centric na bersyon ng
  • Bagong format ng default na index: Lucene46Codec
  • Bagong uri ng EnumField

Ano ang bago sa bersyon 4.5.1:

  • Solr 4.5.1 ay naglalaman ng isang maliit na bilang ng mga pag-aayos ng bug, kabilang ang 2 na itinuturing na masyadong malubhang.

Ano ang bago sa bersyon 4.5.0:

  • Custom sharding support, pinabuting routing, at multi-threaded faceting.

Ano ang bago sa bersyon 4.2.0:

  • Isang read side REST API para sa schema. Laging nais na introspect ang schema sa http? Ngayon ay magagawa mo na. Mukhang ang sumulat sa gilid ay darating sa susunod.
  • Ang DocValues ​​ay isinama sa Solr. Maaaring mai-load ang DocValues ​​ng maraming mas mabilis kaysa sa cache ng field at maaari ring gumamit ng iba't ibang mga algorithm sa compression pati na rin sa RAM o sa mga representasyon ng Disk. Ang pakikitungo, pag-uuri, at pag-andar ng mga tanong ay nakikinabang sa lahat. Paano ang tungkol sa paghawak ng OS ng faceting at sorting caches off heap? Wala nang pag-tune ng 60 gigabyte tambak? Paano ang tungkol sa isang mabilis na bagong bawat segment na DocValues ​​sa faceting na paraan? Pinagbuting numeric faceting? Sweet.
  • Collection Aliasing. May data batay sa oras? Gustong muling i-index sa isang pansamantalang koleksyon at pagkatapos ay palitan ito sa produksyon? Tapos na. Manatiling nakatutok para sa Shard Aliasing.
  • Mga sagot sa koleksyon ng API. Ang mga koleksyon API ay pa rin bago sa 4.0, at habang pinahusay nito ang isang patas na bit sa 4.1, tiyak na kinakailangan ang mga tugon, ngunit hindi nakuha ang putol. Sa una, ginawa namin ang desisyon na gawin ang sobrang kasalanan ng Collection API, kung saan ang mga tugon ay mas mahirap gawin. Walang nagnanais na manghuli sa pamamagitan ng mga file ng log upang makita kung paano naging mga bagay. Tapos na sa 4.2.
  • Makipag-ugnay sa anumang koleksyon sa anumang node. Hanggang 4.2, maaari ka lamang makipag-ugnay sa isang node sa iyong kumpol kung naka-host ito ng hindi bababa sa isang kopya ng koleksyon na nais mong i-query / i-update. Hindi na - mag-query sa anumang node, kung mayroon man itong piraso ng iyong nakalaang koleksyon o hindi at makakuha ng proxied na tugon.
  • Pahintulutan ang mga pangalan ng custom shard upang ang mga bagong address ng host ay maaaring magamit para sa mga retiradong shard. Paggawa sa Amazon nang walang nabagong ips? Ito ay para sa iyo.
  • Lucene 4.2 mga pag-optimize tulad ng compressed term vectors.

Ano ang bago sa bersyon 3.3.0:

  • Pagpapangkat / Field Collapsing
  • Isang bagong, nagmumungkahi na batay sa automaton / autocomplete na nag-aalok ng isang order ng magnitude na mas maliit na paggamit ng RAM.
  • KStemFilterFactory, isang na-optimize na pagpapatupad ng isang mas agresibong stemmer para sa Ingles.
  • Ang default na Solr sa isang bago, mas mahusay na patakaran sa pagsasama (TieredMergePolicy). Tingnan ang http://s.apache.org/merging para sa higit pang impormasyon.
  • Mahalagang bugfixes, kabilang ang napakataas na paggamit ng RAM sa pag-spellchecking.
  • Bugfixes at pagpapabuti mula sa Apache Lucene 3.3

Ano ang bago sa bersyon 3.2.0:

  • Kakayahang tukuyin ang i-overwrite at magsagawa ngWithin bilang mga parameter ng kahilingan kapag ginagamit ang format ng pag-update ng JSON
  • TermQParserPlugin, kapaki-pakinabang kapag bumubuo ng mga query sa filter mula sa mga tuntunin na ibinalik mula sa aspeto ng field o sa mga termino na bahagi.
  • Sinusuportahan na ngayon ng DebugComponent ang paggamit ng isang NamedList upang mag-modelo ng mga Paliwanag na bagay sa mga sagot nito sa halip ng Explanation.toString
  • Mga pagpapabuti sa integrasyon ng UIMA at Carrot2
  • Bugfixes at mga pagpapabuti mula sa Apache Lucene 3.2

Ano ang bago sa bersyon 3.2.0:

  • Ginawa ang mga pagpapabuti ng pag-update ng JSON.
  • Ang resulta ng pag-cluster ng paghahanap at pagsasama ng UIMA ay pinabuting.
  • Mga bug naayos.

Mga komento sa Apache Solr

Mga Komento hindi natagpuan
Magdagdag ng komento
I-sa mga imahe!