Suchmaschinen


Suchmaschinen sind zum wesentlichsten Navigationsmittel im World Wide Web geworden. Die Suchabfrage greift auf einen Index zurück und liefert daraus Ergebnisse, die durch Algorithmen aufbereitet worden sind.

Der Suchmaschinen-Betreiber erzeugt den Index seiner Suchmaschine durch laufende Abfragen von bekannten bzw. erlaubten Websites. Auch hier arbeiten Algorithmen, wie häufig und wie tief indiziert wird und wie eine Website wiederum bewertet wird.

Der Betrieb von universellen Indexen ist technisch aufwendig und teuer. Öffentliche Suchmaschinen mit eigenem Index gibt es noch um die zehn.

Auf derartige Indexe aufsetzen tun sogenannte Metasuchmaschinen wie z.B. metaGer oder searx, die verschiedene Quellen bündeln. Proxysuchmaschinen dagegen haben Verträge mit Index-Suchmaschinenbetreibern, nutzen also deren Index wie z.B. Startpage, die von Google die Ergebnisse erhält, jedoch eine anonyme Suche ermöglicht und somit die Privatsphäre wahrt.

2024ff: vermutlich technologischer Nachfolger von den bisher bekannten Suchmaschinen ist so etwas wie you.com, da hier nicht mehr Ergebnisse gelistet werden, sondern eine textliche Antwort verfasst wird, die dann die konkreten Quellen dazu jeweils mit angibt. Beispiele: "Was passierte in Solingen im August 2024?". Oder eine sehr schwierige Recherche bzw. Frage: "Was ist der juristische Unterschied zwischen POP3 und IMAP?". You.com war die einzige Maschine, die meine immer weiter gehenden Fragen ehrlich beantwortete und beendete, indem diese darauf hinwies, ich solle echte Juristen zu Rate ziehen, da die Frage nicht wie gewünscht beantwortet werden kann (Der Unterschied von POP3 und IMAP ist ein technischer und betrifft Art. 10 und 13 GG sowie StPO etc., also staatliche Überwachungen und Beschlagnahme von Mailpostfächern).

2024-10-09: leider ist dem gemeinnützigen Metager die wichtigste Geldquelle entzogen worden und steht somit nicht mehr kostenfrei zur Verfügung.

Empfehlung für technisch Interessierte und Unternehmen: YaCy (Stand Herbst 2021)

YaCy ist eine dezentralen Suchmaschine. Das Programm kann selbst crawlen, also Websites durchsuchen. Der eigens erzeugte Index kann verteilt werden über das Peer-to-Peer-Prinzip oder wird nur lokal bereitgestellt, z.B. im Intranet oder eben auf dem eigenen Computer.

Neben der zentralen Suchmaschine im Unternehmen, welches verschiedene Quellen im Intranet indiziert, ist auch die themenbasierte Indizierung sehr interessant, wo ein bestimmter Pool an Websites z.B. zum Thema Privatsphäre indiziert wird. Dadurch kann eine Suche stark eingegrenzt werden auf bestimmte Websites und die Suchbegriffe sehr fein angewendet werden. Die vielen Konfigurationsmöglichkeiten lassen eine sehr genaue Steuerung des Indexes zu. Erwähnenswert ist auch die Anwendung in Schulen zur Medienkompetenz im Rahmen von Projektarbeit, da die Schüler:innen hier praktisch und leicht nachvollziehbar durch den Zugriff auf die Konfiguration und Einrichtung z.B. im Bereich Ranking und Heuristik ihre Erfahrungen sammeln und Hintergründe verstehen können.

Das Programm basiert auf Java und kann somit auf allen gängigen Betriebssystemen installiert werden. Support für Unternehmen ist möglich durch den Gründer und Entwickler Michael Christen.

By-the-way: searx bietet sich hier auch als vorgeschaltetes Frontend an, da searx auch YaCy-Instanzen integrieren kann.

Empfehlung Qwant (Stand Sommer 2021)

Ich empfehle von den Suchmaschinen mit eigenem Index Qwant. Der Unternehmenssitz liegt in Frankreich und die Server stehen innerhalb der EU. Die DSGVO wird hofiert und eingehalten. Der Index ist selbst erstellt und zusätzlich wird (noch) auf den Index von Bing (Microsoft) zurückgegriffen. Die Ergebnisse sind OK.

Sehr hilfreich ist auch das Angebot von Qwant junior für Kinder zwischen 6 und 13 Jahren, welches Inhalte mit hohem Bildungswert hervorhebt und Werbung ist hier deaktiviert. Damit sind die Ergebnisse tendenziell für Kinder besser geeignet.

Bei Webbrowsern mit erhöhten Schutzeinstellungen wo Javascript ausgeschaltet ist, leitet Qwant den Aufruf automatisch auf Qwant Lite um. Das ist vorbildlich.

Die Betreiber von Qwant geht auf relevante Fragen offen um wie z.B. die der Finanzierung von Qwant oder dem Recht auf Privatsphäre.

Qwant als Standardsuchmaschine im Browser Firefox einrichten:

  • https://www.qwant.com/ öffnen
  • Neben dem Adressfeld rechts auf die drei Punkte ("Aktionen für Sie") klicken und dort dann in der Liste am Ende auf "Suchmaschine hinzufügen".
  • dann unter EINSTELLUNGEN auf den dortigen Menü-Punkt SUCHE klicken
  • bei STANDARDSUCHMASCHINE sollte am Ende Qwant aufgeführt sein, diese auswählen (und damit ist die Konfiguration auch gespeichert)

Zukünftig wird nun bei der Eingabe von Suchbegriffen in der Adresszeile auf qwant.com zugegriffen und diese Suchmaschine genutzt. Probieren Sie es aus.

Qwant in den technisch-organisatorischen Maßnahmen (TOM) im Unternehmen aufnehmen

Mit Qwant erfüllen Sie die Grundsätze für die Verarbeitung personenbezogener Daten (Art.5 DSGVO), insbesondere Datenminierung laut Absatz 1 lit c). Dokumentieren Sie den Einsatz von Qwant in Ihrer Datenschutz-Dokumentation und den innerbetrieblichen Dienstanweisungen/Anleitungen.

weitere Empfehlungen (2024)

mojeek (mit eigenem Index)

  • moojek.com
  • technologisch interessante Ansätze
  • aufgrund vieler Konfigurationsmöglichkeiten sehr gut für Schule und Ausbildung geeignet, um Möglichkeiten von Suchmaschinen aufzuzeigen und zu verstehen

Quellen