Google Funktion / Programmation ?

pamax

Erfahrenes Mitglied
Hi,

Ich hab mal eine Frage : Wie funktioniert Google?
-ich habe gehört, dass Google sich nicht über Metatags funktoniert,
sondern über links
-in welcher Sprache ist google programmiert, es muss ja eine ziemlich gute Performance haben
-Wie stellt Google den "Suchtext" zusammen den man dann beim suchen findet
-hat vll. jmd. beispiele für " Such-Algorithmen"?

thx

pMx
 
Ich will ja auch keine Seite eintragen lassen, sondern ich will Google vom Prinzip her verstehen.
 
Prinzipiell ist die Funktionsweise eines Suchmaschinen-Robots nicht kompliziert: Es wird ein beliebiger URL aufgerufen, klassifiziert, indexiert und alle im HTML befindlichen Verweise auf andere Ressourcen herausgefiltert. Aus diesen herausgefilterten Adressen wird wieder eine herausgepickt und aufgerufen – der Ablauf beginnt wieder von Vorne.
Die gefundenen Adressen zu bewerten und zu gewichten ist jedoch etwas komplizierter. Denn Googles Algorithmus berücksichtigt meines Wissens nicht nur die Anzahl der Verweise auf eine Ressource, sondern vor allem auch die Relevanz und der Kontext, in dem der Verweis auftrat. Verweist beispielsweise eine Seite mit medizinischem Inhalt auf eine Seite ebenfalls mit medizinischem Inhalt, wird dieser Verweis höher gewertet als ein Verweis auf eine Seite mit handwerklichem Inhalt.
 
Also muss man sich das so vorstellen:?
-die Seite wird nach links durchsucht(z.B bei PHP preg_replace)
-dann wird der Link in einer DB gespeichert und was fürn Text der Link hat
-und dann wird auf der neuen Seite(der Link der in der DB) wieder gesucht
stimmt das so und mit welcher Programmiersprache/Scriptsprache würdet ihr das machen?
Wie wird zufällig ein Link aufgerufen?(am Anfang)
pMx
 
Zuletzt bearbeitet:
Ein kleines Gedankenspiel: Angenommen jede gefundene Seite enthielte nur zwei Verweise, die immer zu einer anderen Seite verwiesen. Damit würde die Anzahl der gefundenen Verweise/Seiten jedes Mal verdoppeln. Viel Spaß bei der Realisierung.
 
Eine Frage habe ich noch.
Die Such-Engine muss doch die ganze Zeit laufen oder?
Wie macht man das mit PHP? mit Cronjobs?

pMx
 
Prinzipiell gibt es kein Ende. Denn das Web ist ein lebender Organismus und ich möchte mal behaupten, dass weltweit etwa alle fünf Sekunden drei neue Domains registriert werden. Die Anzahl der sekündlich neu erstellten oder aktualisierter Seiten möchte ich erst garnicht wissen.
 

Neue Beiträge

Zurück