Apache Solr

Geriausios savarankiškos paieškos sistemos

Geriausios savarankiškos paieškos sistemos
Ar jūsų viršininkas žino, kad ieškote kito darbo? Ar esate pasakojęs savo reikšmingam kitam apie negalėjimą nuspręsti, ar norite turėti vaikų, ar ne? Ar jūs, tėvai, žinote apie savo seksualinę orientaciją?? Na, „Google“ ir kitos pagrindinės paieškos sistemos tai daro.

„Dauguma vartotojų ieško„ Google “būdami prisijungę, todėl galima rasti visą informaciją apie jų internetinį gyvenimą:„ YouTube “paieškas, el. Laiškus ir ankstesnę paieškos istoriją“, - sako Adomas Tauberis, pagrindinis privatumą gerbiančio metaduomenų paieškos sistemos „Searx“ kūrėjas.

Žinoma, galite naudoti „Tor“ anonimiškumui ir visada po kiekvienos paieškos ištrinti visus savo veiklos pėdsakus, tačiau tai padarius po kiekvienos paieškos greičiausiai sensta gana greitai. Vietoj to turėtumėte apsvarstyti galimybę įdiegti savarankišką paieškos variklį, kuris galėtų gauti informaciją už jus, neatskleisdamas nieko jautraus apie jus.

Mes pasirinkome du tokius paieškos variklius, taip pat pristatome tris papildomas paieškos sistemas, kad parodytume, jog puikios alternatyvos patentuotiems paieškos varikliams, tokiems kaip „Google“ ar „Bing“, jau yra ir jas lengviau įdiegti ir naudoti, nei galite pagalvoti.

1. Taip

„YaCy“ yra nemokama platinama „peer-to-peer“ paieškos sistema, kurios pagrindinis komponentas parašytas „Java“. Kadangi visi „YaCy“ vartotojai yra vienodi ir kadangi paieškos sistema nesaugo vartotojų paieškos užklausų, cenzūra tiesiog neįmanoma.

Šiuo metu „YaCy“ indeksuoja apie 1.4 milijardai jo indekso dokumentų, kuriuos teikia daugiau nei 600 bendraamžių operatorių, kurie kiekvieną mėnesį prie jo prisideda. Palyginimui, „Google“ paieškos rodyklėje yra šimtai milijardų tinklalapių ir yra gerokai daugiau nei 100 000 000 gigabaitų dydžio.

Nors „YaCy“ dar reikia nueiti ilgą kelią, kol ji galės konkuruoti su didžiausiomis centralizuotomis paieškos sistemomis pasaulyje, ji jau gali būti naudojama kaip privačių intranetų ir konkretiems projektams skirtų programų paieškos portalas, nes „YaCy“ gali veikti kaip vienas paieškos prietaisas, neprisijungęs prie tinklo su kitais. bendraamžiai.

„YaCy“ galima lengvai integruoti į bet kurį tinklalapį dėl paprastų kodo fragmentų, kuriuos be jokių pastangų galima lengvai nukopijuoti ir įklijuoti.

2. Searx

„Searx“ apibūdinamas kaip privatumą gerbiantis, įsilaužtinas meto paieškos variklis. Jį galima įsigyti naudojant „GNU Affero General Public License“ 3 versiją, o pagrindinis jo tikslas yra apsaugoti savo vartotojų privatumą niekada nesidalijant vartotojų IP adresais ar paieškos istorija su paieškos sistemomis, iš kurių ji renka rezultatus.

„Naudojant„ Searx “,„ Google “pagal numatytuosius nustatymus siunčiamas„ Searx “IP adresas, atsitiktinis„ User-Agent “ir paieškos užklausa“, - Adomo Tauberio, dar žinomo kaip „asciimoo“, paaiškinimas, kaip veikia jo meta paieškos variklis. „Žinoma, galite pritaikyti„ Searx “, kad persiųstumėte kitus papildomus parametrus, pvz., Paieškos kalbą ar pageidaujamo rezultatų puslapio puslapio numerį.“

„Searx“ automatiškai blokuoja visus paieškos variklių teikiamus stebėjimo slapukus, kad būtų išvengta naudotojų profiliais pagrįstų rezultatų modifikavimo, kuris gali atsirasti dėl to, kad paieškos variklis bando įgyvendinti paiešką, kuri yra individualizuota atsižvelgiant į tai, ką variklis žino apie vartotoją. „Searx“ yra 100 procentų nemokama, ir kiekvienas gali ją modifikuoti pagal poreikį. Jūs netgi galite paimti „Searx“ kodą ir paleisti metasearch variklį savo serveryje, kuris tikrai turėtų išspręsti visas problemas, susijusias su žurnalais.

3. „ElasticSearch“

„ElasticSearch“ yra paieškos variklis, pagrįstas „Lucene“ - nemokama ir atviro kodo informacijos paieškos programinės įrangos biblioteka, palaikoma „Apache Software Foundation“ ir išleista pagal „Apache“ programinės įrangos licenciją.

„ElasticSearch“ teikia viso teksto paieškos variklį su HTTP žiniatinklio sąsaja. Paieškos variklis gali būti naudojamas ieškant visų rūšių dokumentų, ir jį galima lengvai paskirstyti keliems mazgams.

Naudojant „ElasticSearch“ ir „Docker“ galima susikurti savarankišką paieškos variklį, o instrukciją, kurioje aprašomas procesas, galite rasti čia.

4. Ambaras

„Ambar“ yra atviro kodo dokumentų paieškos sistema, turinti daug naudingų funkcijų. Tai palaiko automatizuotą tikrinimą, žymėjimą ir tiesioginę viso teksto paiešką, kad būtų pateikti keli pavyzdžiai. Viena įdomiausių „Ambar“ funkcijų yra galimybė atlikti OCR vaizdams ir PDF failams. Palaikomos kalbos yra anglų, vokiečių, rusų, italų, prancūzų, ispanų, lenkų ir olandų.

„Ambar“ galima lengvai įdiegti naudojant vieną „Docker-Compose“ failą. Čia galite sužinoti, kaip tai padaryti.

5. Apache Solr

Parašyta „Java“, „Apache Solr“ yra įmonės paieškos platforma, apimanti viso teksto paiešką, paspaudimų paryškinimą, briaunuotą paiešką, indeksavimą realiuoju laiku, dinamišką grupavimą ir daugelį kitų svarbių funkcijų. Jis buvo sukurtas 2004 m. Vykdant vidaus projektą „CNET Networks“. „CNET Networks“ maloniai jį paaukojo „Apache Software Foundation“ 2006 m., Kur 2007 m. Jis baigė inkubacinį statusą ir tapo atskiru aukščiausio lygio projektu.

Šiandien „Solr“ yra labai patikima, keičiamo dydžio ir tolerantiška gedimams įmonės paieškos platforma, valdanti daugelio didžiausių pasaulio interneto svetainių, įskaitant „DuckDuckGo“, „eHarmony“ ir „BestBuy“, paieškos ir naršymo funkcijas. Tu gali

Kaip įdiegti ir konfigūruoti „YaCy“

„YaCy“ diegimas yra labai paprastas ir trunka tik kelias minutes, nes jums nereikia įdiegti išorinės duomenų bazės ar interneto serverio. „YaCy“ yra viskas, ko reikia.

  1. Eikite į oficialią „YaCy“ svetainę ir atsisiųskite naujausią „Linux“ paketą.
  2. Įdiekite „OpenJDK 8“ vykdymo aplinką.
    • Jei naudojate „Debian“ pagrįstą paskirstymą, naudokite šią komandą: $ sudo apt-get install openjdk-8-jre
    • Jei ne, vykdykite savo platinimo instrukcijas.
  3. Ištraukite atsisiųstą paketą į pageidaujamą vietą.
  4. Eikite į naują aplanką ir paleiskite „startYACY.sh “scenarijus terminale.
  5. Turėtumėte pamatyti patvirtinimo pranešimą, informuojantį, kad „YaCy“ pradėjo veikti kaip „deemon“

Išvada

Paieškos sistemos žino apie mus daugiau, nei dauguma žmonių norėtų pripažinti. Jei nenorite didelių korporacijų maitinti sultingais duomenimis, galite paimti daiktus į savo rankas ir sukurti savarankišką paieškos variklį, kad apsaugotumėte jūsų privatumą. Nors savarankiškai priglobtos paieškos sistemos dar turi nueiti ilgą kelią, kad taptų visapusiškai tinkamos naudoti, yra potencialas joms pralenkti tokius, kokius mėgsta „Google“, ir jos užfiksavimas tėra tik pritraukti daugiau vartotojų.

Kaip pakeisti pelės žymeklio ir žymeklio dydį, spalvą ir schemą sistemoje „Windows 10“
„Windows 10“ pelės žymeklis ir žymeklis yra labai svarbūs operacinės sistemos aspektai. Tai galima pasakyti ir apie kitas operacines sistemas, taigi, ...
Nemokami ir atvirojo kodo žaidimų varikliai, skirti kurti „Linux“ žaidimus
Šiame straipsnyje bus pateiktas nemokamų ir atvirojo kodo žaidimų variklių, kurie gali būti naudojami kuriant 2D ir 3D žaidimus „Linux“, sąrašas. Toki...
„Tomb Raider for Linux“ pamoka
„Tomb Raider“ šešėlis yra dvyliktas „Tomb Raider“ serijos priedas - veiksmo ir nuotykių žaidimų franšizė, sukurta „Eidos Montreal“. Žaidimą kritikai i...