Suchmaschinen

PROJEKT1/EDV/internet/c_suchmaschine.html V0.1 25.09.2024 19:00

Inhaltsverzeichnis

Dateiliste (.php Liste ist nur im Servermodus verfügbar)

1. Einleitung
2. Webcrawler
3. Suchmaschinen
4. KI-Systeme
5. Gängige Suchmaschinen
6. Alternative Suchmaschinen im Vergleich
Literatur

 

 

 

1.

Einleitung

Um Dateien im Internet zu finden und zu durchsuchen, benutzen Browser Suchmaschinen. Damit das schnell möglich ist, müssen Dateien von den Betreibern der Suchmaschine bereits gelesen und indexiert worden sein. Diese Aufgabe wird sogenannte Webcrawler übernommen. Das ist mit einem erheblichen Aufwand an Rechenzeit und Speicher verbunden. So wird von Google angegeben, das etwa 40 Milliarden Seiten indexiert wurden. Das mus nicht nur einmal geschehen, da sich Anzahl und Inhalt der Seiten täglich vielfach ändern. Damit man auch alte Seiten noch wiederfinden kann, müssen nicht nur die aktuellen Seiten, sondern auch die alten Indexe gespeichert bleiben. Das macht den Betrieb von Suchmaschinen kostspielig. Die Kosten werden Verkauf der gewonnenen Daten wieder eingenommen, was offenbar ein einträgliches Geschäft ist.

Der Nutzen von Suchmaschinen ist unbestreitbar, allerdings ist damit auch ein Problem verbunden. Um auf eine Anfrage auch die Antwort an den richtigen Rechner zu schicken, müssen die Daten des anfragenden Rechners und damit auch die Identität des Fragenden bekannt gemacht werden. Diese Daten, Identität und Frage, können von dem Betreiber ausgewertet werden. Diese Informationen haben eine kommerziellen Wert.

Um diese persönlichen Daten nicht aus der Hand zu, werden verschiedene Maßnahmen ergriffen. Diese Anonymisierung wird an anderer Stelle beschrieben. Eine Information hierzu findet man in dem folgenden youtube-Beitrag.

 

 
2.

Webcrawler

Webcrawler sind sogenannte Bots , also weitgehend automatisch arbeitende Programm zum Sammeln und Katalogisieren von Daten.

 

 
3.

Suchmaschinen

Auf Wikipedia existiert eine Liste von aktuellen Suchmaschinen für das World Wide Web .

Wichtig ist zu wissen, ob die Suchmaschine eigene Webcrawler und Datenbanken ( Google , Bing , Qwant ) benutzen oder ob sie Metasuchmaschinen sind, die die Ergebnisse von anderen Suchmaschinen benutzen, kombinieren und weiterleiten.

Weiter ist von großer Bedeutung, in wie weit die Daten des Benutzers geschützt sind. Dafür ist wichtig, dass die Suchmaschine keine persönliche Daten erhebt, was man als Nutzern nicht überprüfen kan. Deshalb ist die Vertrauenswürdigkeit des Betreibers von Bedeutung, was auch nur schwer zu verifizieren ist. Jedoch ist der Standort des Betreibers ein Hinweis. So unterliegen die Betreiber den staatlichen Regularien. Für Betreiber mit Sitz in Deutschlend gilt das verhältnismäßig stringente europäisches Recht, wo sogar die Polizei nicht uneingeschränkten Zugang zu den internen Daten der Suchmaschine hat. Anders ist das ist bei Betreiben mit Sitz in den USA, wo die Geheimdienste bei Bedarf durch eine richterliche Genehmigung uneingeschräkten Zugang erwirken können. Am geringsten ist die Möglichkeit der Anonymisierung der persönlichen Daten bei einem Betreiber, der in China oder Russland seine Sitz. Hier kann man davon ausgehen, das die persönlichen Daten systematisch ausgewertet werden.

Weiter gibt es Proxy-Suchmaschinen, die die Daten zu verschiedenen Zwecken bearbeiten. Sie generieren zum Beispiel Spenden aus Werbeeinnahmen (Ecosia) filtern Daten oder schalten sich zwischen Nutzer und Suchmaschine um personenbezogene Daten in der Anfrage vor der Weitergabe (Startpage, Swisscows) zu unterdrücken.

Man kann auch eigene Intranet-Suchmaschine zum Indizieren der eigenen Webseite benutzen. Diesen speziellen Dienst bietet die Website yacy.net .

 

 

 

Alternative Suchmaschinen im Vergleich

5 alternative und zum Teil bessere Suchmaschinen als Google

00:00 Es gibt nicht nur Google
00:53 Was ist eine Suchmaschine?
02:06 Welche Arten von Suchmaschinen gibt es
03:13 Was ist uns wichtig? muss Privatsphäre respektieren

05:02 Privatsphäre bei Suchmaschinen?
08:22 5 spannende Google Alternativen
08:56 DuckDuckGo
11:03 Swisscows:
13:03 Qwant
14:40 Ecosia
16:36 Startpage
18:00 Fazit

 

 
4.

KI-Systeme

Wikipedia unterstützt KI-Entwicklung

 

 
5.

 

 

 
Literatur

Autor:

Klaus-G. Häusler; haeusler. at .muenster.de

Quellen: