ASPseek

Screenshot Software:
ASPseek
Mga detalye ng Software:
Bersyon: 1.2.10
I-upload ang petsa: 3 Jun 15
Nag-develop: SWsoft
Lisensya: Libre
Katanyagan: 4

Rating: nan/5 (Total Votes: 0)

ASPseek ay isang Internet search engine software na binuo ng SWsoft at lisensiyado bilang libreng software sa ilalim ng GNU GPL.
ASPseek binubuo ng isang index robot, isang demonyo ng paghahanap, at isang frontend CGI paghahanap. Maaari itong index ng maraming bilang ng ilang milyong mga URL at paghahanap para sa mga salita at parirala, gamitin ang mga wildcard, at gumawa ng isang Boolean paghahanap. Mga resulta ng paghahanap ay maaaring limitado sa oras ng panahon na ibinigay, site o espasyo Web (hanay ng mga site) at nakaayos ayon sa kaugnayan (PageRank ay ginagamit) o ​​petsa.
ASPseek ay sinulit para sa maramihang mga site (sinulid index, async paghahanap sa DNS, pagpangkat resulta sa pamamagitan ng site, Web espasyo), ngunit maaaring magamit para sa paghahanap sa isang site pati na rin. ASPseek maaaring gumana sa maramihang wika / pag-encode ng sabay-sabay (kasama multibyte encode tulad ng mga Intsik) dahil sa Unicode storage mode. Iba pang mga tampok isama stopwords at suporta ispell, isang charset at wika guesser, mga template ng HTML para sa mga resulta ng paghahanap, mga sipi, at mga salita query highlight.
ASPseek ay nakasulat sa C ++ gamit ang STL library, at gumagamit ng halo ng SQL database at binary file para sa imbakan.
Narito ang ilang mga pangunahing katangian ng "ASPseek":
Kakayahang index at paghahanap sa pamamagitan ng ilang mga milyon-milyong mga dokumento
 
· Paggamit ASPseek, maaari kang bumuo ng isang database at paghahanap sa pamamagitan ng maraming mga site, at mga resulta para sa bawat query ay ibabalik mabilis kahit na kung mayroon ka ng ilang mga milyon-milyong mga dokumento index. Siyempre, ito ay depende sa hardware, kaya hindi inaasahan "good old" i486 machine upang pangasiwaan ang bawat site sa .com domain. Lahat ng bagay ay depende sa (mga) CPU, memory, bilis disk atbp Kaya huwag ng iyong sariling mga pagsusuri bago bumili dedikadong hardware.
 
· Ang katotohanan na ASPseek ay sinulit para sa mataas na volume ay hindi dapat itigil mo mula sa paggamit nito sa paghahanap ng iyong sariling mga site na naglalaman ng ilang daang ng mga dokumento - ito ay gumagana doon rin.
 
Napakahusay na kaugnayan ng mga resulta
 
· Ang layunin ng search engine ay upang mahanap kung ano ang user ay nais. Maaaring magkaroon ng libo-libong mga URL na natagpuan bilang isang resulta ng query sa paghahanap, ngunit ito ay maaaring maging mga hindi kaugnay na ang lahat, kaya user ay hindi nasisiyahan.
 
· Resulta Output sa ASPseek ay nakaayos ayon sa kaugnayan (o rank), ngunit pagkalkula ng ranggo ay hindi isang madaling gawain. Sinubukan kanilang pinakamahusay Developers upang isama ang pinakadakila at pinakabagong pamamaraan sa ASPseek engine habang ang pagpapanatili ng mabuting bilis paghahanap.
 
Ispell support
 
· Kapag ASPseek ay ginagamit na may ispell support, searchd (1) ay maaaring optionally mahanap ang lahat ng mga form para sa lahat ng mga tinukoy na mga salita (halimbawa: lumikha -> lumikha OR nilikha OR lumilikha). Kaya, ito ay nagpapahintulot sa iyo upang mahanap ang mga salita sa lahat ng iba't ibang paraan.
 
Mode Unicode storage
 
· Maaaring tindahan ASPseek impormasyon tungkol sa mga dokumento sa Unicode, kaya ang paggawa ng posible na ipatupad ang isang multi-wika ng search engine. Kaya, maaari mong index at paghahanap ng mga dokumento sa Ingles, Ruso at kahit Chinese, lahat sa isang database.
 
HTTP, HTTPS, HTTP proxy, FTP (sa pamamagitan ng proxy) protocol
 
· Bilang ASPseek ay isang Web search engine, ito ay gumagamit ng HTTP protocol sa index sites. Sinusuportahan din ng ASPseek secure na https: // protocol. FTP protocol ay hindi direktang suportado, ngunit maaari mong gamitin ang proxy (tulad ng pusit) at mga site index FTP sa pamamagitan ng proxy.
 
· Sumusuporta ASPseek tampok na "basic authorization" ng HTTP upang maaari mong index password-protected na mga lugar (halimbawa pribadong impormasyon sa iyong intranet).
 
Text / html at / support plain dokumento uri ng teksto
 
· Maintindihan ASPseek dokumento na nakasulat sa HTML, at plain dokumento text. Ito ang mga pinaka-popular na mga format sa Internet.
 
· Iba pang mga format, tulad ng PDF, RTF, etc, ay maaaring suportado sa tulong ng anumang mga panlabas na programa / script na kung saan ay ma-convert na mga format sa HTML o plain text.
 
Multithreaded disenyo, async DNS resolver etc
 
· ASPseek gumagamit POSIX na mga thread, na nangangahulugan na ang isang proseso ay may maraming mga thread na tumatakbo sa pagpaparis. Kaya index downloads dokumento mula sa maraming mga site, at mga proseso ng paghahanap ng demonyo maraming mga query sa paghahanap nang sabay-sabay. Ito ay hindi lamang tumutulong ASPseek sa scale na rin sa SMP (multiprocessor) sistema, ngunit din nagpapabuti sa bilis ng pag-index, dahil sa kaso ng isang thread pinaka-oras ay ginugol sa paghihintay para sa data mula sa network.
 
· Isang bagay na mabagal na proseso sa pag-index down ng isang pulutong ay DNS lookup (isang proseso ng pagtukoy ng IP address gamit ang pangalan ng server). Upang maiwasan ang pagkaantala, asynchronous lookups (lookup ay ginagawa sa pamamagitan ng hiwalay na dedikado proseso) at cache IP address ay ipinatupad.
 
Stopwords
 
· Stopwords ay isang salita na walang kahulugan sa pamamagitan ng kanyang sarili. Mga halimbawa: ang, ay, sa, nito. Naghahanap para sa ay walang silbi, kaya tulad ng mga salita ay hindi kasama mula query sa paghahanap. Stopwords ay ibinukod mula rin sa database sa panahon ng pag-index, kaya nagiging mas maliit at mas mabilis na database.
 
· Walang "built-in" stopwords in ASPseek, sila ay load sa panahon ng start-up mula sa mga file. Maraming stopword file para sa iba't-ibang wika ay may ASPseek.
 
Charset guesse
 
· Ang ilang mga sira o maling na-configure server ay hindi sabihin sa mga kliyente ang charset kung saan nagbibigay sila ng nilalaman. Kung ikaw ay pag-index ng mga server, o gamit ASPseek sa index ftp server (FTP protocol ay wala tungkol charset alam), charset guesser ay maaaring gamitin upang matugunan ito. Charset guesser gumagamit salita dalas talahanayan (tinatawag langmaps) upang matukoy tamang charset.
 
Standard exclusion Robot (robots.txt) support
 
· Ganap na sumusuporta ASPseek ang pamantayang ito. Ito ay inilaan para akda web site para sa mga nagsasabi ang robot (halimbawa, index ASPseek (1)) upang laktawan index ng ilang mga direktoryo sa kanilang mga site.
 
· Para sa karagdagang impormasyon tingnan ang http://www.robotstxt.org/wc/robots.html
 
Mga Setting upang kontrolin ang paggamit ng bandwidth network at Web server load
 
· Maaari mong kontrolin ang tiyak na mga network ng bandwidth na index (1) ay gumagamit. Eksakto, maaari mong limitahan ang bandwidth (na ipinahayag sa bytes per second) na ginagamit ng index (1) para sa ibinigay na oras-ng-araw. Halimbawa, maaari mong limitahan ang bandwidth sa oras ng negosyo upang ang mga tao sa iyong opisina ay hindi makaranas ng mabagal na Internet.
 
· Maaari mo ring itakda ang minimum na oras sa pagitan ng dalawang mga tanong sa parehong Web server, kaya hindi ito ay overloaded at got down sa kanyang tuhod habang mong patakbuhin index (1).
 
Real-time asynchronous index
 
· Nangangailangan ilang mga search engine sa paghahanap na iyon ay dapat na tumigil para sa oras ng update database. ASPseek ay hindi kailangan ng mga ito, kaya maaari kang maghanap non-stop.
 
· Higit pang sabihin, may isang espesyal na mode ng pag-index na tinatawag na "real-time" index. Maaari mong gamitin ito para sa maliit na bilang ng mga dokumento, at makaabot tulad dokumento ay nai-download at naproseso, ang mga pagbabago ay kaagad makikita sa interface ng paghahanap. Ang tampok na ito ay isang malaking tulong kung ikaw ay gusali ng search engine para sa mga pahina na may mabilis na pagbabago ng nilalaman tulad ng mga online na mga balita at iba pa
 
· Tandaan na bilang ng mga dokumento sa "real-time" database ay limitado. Ito ay tungkol sa 1000 sa (Maaaring mag-iba ang iyong mileage) ang aming hardware, at ang mga karagdagang dokumento na mayroon ka sa "real-time" database, ang mabagal ay bilis ng pag-index sa na (at lamang na) database. Ito ay hindi makakaapekto sa bilis ng paghahanap kahit na.
 
· Dokumento mula sa "real-time" database ay inilipat sa normal database matapos ang pagpapatakbo index (1) sa isang normal na paraan.
 
Pag-aayos ng mga resulta ayon sa kaugnayan o ayon sa petsa
 
· Karaniwang nagbabalik ng unang search engine na pinaka-may-katuturang resulta. Ngunit kung ikaw ay naghahanap para sa pinakabagong mga pahina, maaari mong sabihin sa ASPseek upang uriin ang mga resulta ayon sa huling petsa ng pagbabago, kaya kamakailan binago (o nilikha) na mga pahina ay unang ipapakita.
 
Mga sipi, query salita pagha-highlight
· Sipi ay isang piraso ng natagpuan dokumento na may salitang hinanap highlight, magbigay lamang ng isang ideya ng kung ano ang mga dokumento ay tungkol sa. Maaari mong ipasadya ang bilang ng mga sipi sa pagpapakita at kanilang haba. Kung hindi mo pinagana ang mga sipi, ang simula ng dokumento ay ipapakita.
 
· Bawat natagpuan dokumento ay hatid sa mga link na "Naka-cache". ASPseek mapigil ang isang lokal na-compress na kopya ng bawat dokumento proseso, kaya user ay maaaring makita ang buong dokumento sa (opsyonal) highlight ng mga salita na ay naghanap para sa, kahit na ito ay inalis mula sa orihinal na site (na mangyayari kung minsan).
 
Resulta Paggrupo sa pamamagitan ng site
 
· Mga resulta mula sa isang site ay maaaring pinagsama-sama. Kung pagpapangkat ng mga site ay sa, mga resulta lamang ng dalawang ay ipinapakita mula sa parehong site sa pamamagitan ng default, at maaaring makita ang mga user sa ibang mga pahina mula sa parehong site sa pamamagitan ng pagsunod ng isang "Higit pang mga resulta mula sa ..." na link.
 
Clones
 
· Clones ay magkapareho mga dokumento sa iba't ibang mga lokasyon. Sila ay natagpuan at pinagsama-sama, kaya hindi ito ay iniharap user sa isang pahina na puno ng mga URL upang ang parehong dokumento.
 
· I-clone ang detection ay karaniwang limitado sa pamamagitan ng isang site (kaya magkapareho mga dokumento mula sa iba't ibang mga site ay hindi mabibilang bilang mga clones), ngunit maaari mong baguhin ito sa pamamagitan ng recompiling ASPseek may --disable-clones-by-site na opsyon.
 
Puwang at mga subset
 
· Space ay ang hanay ng mga site. Kaya, kung gusto mong magbigay ng mga search mapakipot sa ilang mga lugar, maaari kang lumikha ng isang space at maghanap sa loob ng puwang na iyon. Tanging buong site (eg http://www.mysite.com/) ay pinapayagan upang maisama sa space.
 
· Subset ay maaari ring gamitin upang paghigpitan ang paghahanap. Maaari kang lumikha ng subset at ilagay ang URL mask (tulad http://www.mysite.com/mydir/%) sa na iyon, at pagkatapos ay malimitahan ang saklaw ng paghahanap sa ibinigay lamang subset.
 
· Maaari mong paghigpitan ang saklaw ng paghahanap na hindi lamang isa ngunit maraming mga subset o mga puwang.
 
HTML template para sa madaling-customize na mga resulta sa paghahanap
 
· Maaari mong ipasadya ang iyong mga pahina sa paghahanap, upang sila ay magmukhang at maging walang putol isinama sa mga natitirang bahagi ng iyong site. Ito ay ginagawa sa pamamagitan ng simpleng pag-edit ng template search file.
Instalasyon
gzip -dc aspseek-1.2.10.tar.gz | tar xf -
cd aspseek-1.2.10. / isaayos
gumawa
su
make install

Iba pang mga software developer ng SWsoft

Plesk for Windows
Plesk for Windows

22 Sep 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Mga komento sa ASPseek

Mga Komento hindi natagpuan
Magdagdag ng komento
I-sa mga imahe!