Apache Solr

Най-добрите търсачки за домакинство

Най-добрите търсачки за домакинство
Знае ли шефът ви, че търсите друга работа? Казвали ли сте на другата си половинка за невъзможността да решите дали искате да имате деца или не? Знаете ли вие родителите за вашата сексуална ориентация? Е, Google и други големи търсачки го правят.

„Повечето потребители търсят в Google, докато са влезли в системата, така че цялата информация за техния онлайн живот е достъпна: търсения в YouTube, имейли и минала история на търсенията“, казва Адам Таубер, водещият разработчик на механизма за търсене на мета-търсене Searx, зачитащ поверителността.

Разбира се, можете да използвате Tor за анонимност и винаги да изтривате всички следи от активността си след всяко търсене, но това след всяко търсене най-вероятно ще остарее доста бързо. Вместо това трябва да помислите за инсталиране на самостоятелно хостваща търсачка, способна да извлича информация за вас, без да разкрива нищо чувствително за вас.

Избрахме две такива търсачки и въвеждаме и три допълнителни търсачки, за да ви покажем, че отлични алтернативи на собствени търсачки като Google или Bing вече съществуват и са по-лесни за инсталиране и използване, отколкото си мислите.

1. YaCy

YaCy е безплатна разпределена търсачка за равнопоставено търсене, чийто основен компонент е написан на Java. Тъй като всички потребители на YaCy са равни и тъй като търсачката не съхранява заявки за търсене на потребители, цензурата просто не е възможна.

В момента YaCy индексира около 1.4 милиарда документи в неговия индекс благодарение на активността на над 600 партньорски оператори, които допринасят за него всеки месец. За сравнение, индексът на Google Търсене съдържа стотици милиарди уеб страници и е с размер над 100 000 000 гигабайта.

Въпреки че YaCy все още трябва да извърви дълъг път, преди да може да съперничи на най-големите централизирани търсачки в света, той вече може да се използва като портал за търсене на частни интранети и специфични за проекта приложения, тъй като YaCy може да работи като единичен уред за търсене, без да се свързва с други връстници.

YaCy може лесно да се интегрира във всяка уеб страница, благодарение на опростените си кодови фрагменти, които могат лесно да се копират и поставят без никакви модификации.

2. Searx

Searx е описан като механизъм за метатърсене, който спазва поверителността и е хакнат. Предлага се под GNU Affero General Public License версия 3 и основната му цел е да защити поверителността на своите потребители, като никога не споделя IP адресите или историята на търсенето на потребителите с търсачките, от които събира резултати.

„Когато използвате Searx, IP адресът на Searx, случаен потребителски агент и заявка за търсене се изпращат до Google по подразбиране“, Адам Таубер, известен още като asciimoo, обяснява как работи неговият механизъм за метатърсене. „Разбира се, можете да персонализирате Searx да препраща други допълнителни параметри като език за търсене или номер на страницата на заявената страница с резултати.”

Searx автоматично блокира всички проследяващи бисквитки, обслужвани от търсачките, за да предотврати модифициране на резултатите въз основа на профилиране на потребителя, което може да бъде резултат от търсачката, която се опитва да приложи търсене, което е индивидуализирано въз основа на това, което двигателят знае за потребителя. Searx е 100 процента безплатен и всеки може да го модифицира при необходимост. Можете дори да вземете кода на Searx и да стартирате механизма за метатърсене на собствения си сървър, който определено трябва да отговори на всички проблеми, които може да имате относно дневниците.

3. ElasticSearch

ElasticSearch е търсачка, базирана на Lucene, безплатна библиотека със софтуер за извличане на информация с отворен код, поддържана от Apache Software Foundation и е издадена под лиценза на Apache Software.

ElasticSearch предоставя пълнотекстова търсачка с HTTP уеб интерфейс. Търсачката може да се използва за търсене на всякакви документи и може лесно да бъде разпределена в множество възли.

Възможно е да се изгради самостоятелно хостваща търсачка с помощта на ElasticSearch и Docker и можете да намерите урок, който описва процеса тук.

4. Амбар

Ambar е машина за търсене на документи с отворен код с много полезни функции. Той поддържа автоматично обхождане, маркиране и незабавно търсене на пълен текст, само за да даде няколко примера. Една от най-вълнуващите характеристики на Ambar е способността му да извършва OCR върху изображения и PDF файлове. Поддържаните езици включват английски, немски, руски, италиански, френски, испански, полски и холандски.

Ambar може лесно да бъде внедрен с един файл за съставяне на докер и можете да научите как да го направите тук.

5. Apache Solr

Написан на Java, Apache Solr е платформа за корпоративно търсене, която включва пълнотекстово търсене, подчертаване на удари, фасетно търсене, индексиране в реално време, динамично групиране и много други важни функции. Създаден е през 2004 г. за вътрешен проект в CNET Networks. CNET Networks любезно го дари на Apache Software Foundation през 2006 г., където завърши статуса на инкубация в самостоятелен проект от най-високо ниво през 2007 г.

Днес Solr е изключително надеждна, мащабируема и устойчива на грешки платформа за корпоративно търсене, която осигурява функциите за търсене и навигация на много от най-големите интернет сайтове в света, включително DuckDuckGo, eHarmony и BestBuy. Можеш

Как да инсталирате и конфигурирате YaCy

Инсталирането на YaCy е много лесно и отнема само няколко минути, защото не е необходимо да инсталирате външна база данни или уеб сървър - YaCy идва с всичко необходимо.

  1. Отидете на официалния уебсайт на YaCy и изтеглете най-новия пакет за Linux.
  2. Инсталирайте средата за изпълнение на OpenJDK 8.
    • Ако използвате дистрибуция, базирана на Debian, използвайте следната команда: $ sudo apt-get install openjdk-8-jre
    • Ако не, следвайте инструкциите, специфични за вашата дистрибуция.
  3. Извлечете изтегления пакет на предпочитаното от вас място.
  4. Отидете в новата папка и стартирайте “startYACY.sh ”скрипт в терминала.
  5. Трябва да видите съобщение за потвърждение, което ви информира, че YaCy е стартирал като демон

Заключение

Търсачките знаят повече за нас, отколкото повечето хора биха искали да признаят. Ако искате да спрете да захранвате големите корпорации със сочни данни, можете да вземете нещата в свои ръце и да създадете самостоятелно хостваща търсачка, за да защитите поверителността си. Въпреки че самоприемащите търсачки все още трябва да извървят дълъг път, за да станат напълно използваеми, потенциалът им да превъзхождат подобните на Google е налице и улавянето е просто въпрос на привличане на повече потребители.

HD Remastered Games за Linux, които никога преди не са имали издание на Linux
Много разработчици и издатели на игри излизат с HD ремастер на стари игри, за да удължат живота на франчайза, моля феновете, които искат съвместимост ...
Как да използвам AutoKey за автоматизиране на Linux игри
AutoKey е програма за автоматизация на настолни компютри за Linux и X11, програмирана в Python 3, GTK и Qt. Използвайки неговата функционалност за скр...
Как да покажа брояч на FPS в игрите на Linux
Linux игрите получиха голям тласък, когато Valve обяви поддръжка на Linux за Steam клиент и техните игри през 2012 г. Оттогава много AAA и независими ...