Seitenrang

Mathematische Pageranks für ein einfaches Netzwerk werden als Prozentsätze ausgedrückt. (Google verwendet a Logarithmische Darstellung.) Seite C hat einen höheren PageRank als Seite E, obwohl es weniger Links zu C gibt; Der eine Link zu C stammt von einer wichtigen Seite und ist daher von hohem Wert. Wenn Web -Surfer, die auf einer zufälligen Seite beginnen 8,1% der Fälle. (Die 17,5% ige Wahrscheinlichkeit, auf eine willkürliche Seite zu springen, entspricht a Dämpfungsfaktor von 82,5%.) Ohne Dämpfung würden alle Web -Surfer schließlich auf den Seiten A, B oder C landen, und alle anderen Seiten hätten PageRank Null. In Gegenwart einer Dämpfung verlinkt Seite A effektiv mit allen Seiten im Web, obwohl es keine eigenen ausgehenden Links hat.

Seitenrang (Pr) ist ein Algorithmus benutzt von Google-Suche Rang Webseiten in ihren Suchmaschine Ergebnisse. Es ist sowohl nach dem Begriff "Webseite" als auch nach Mitbegründer benannt Larry Seite. PageRank ist eine Möglichkeit, die Bedeutung von Website -Seiten zu messen. Laut Google:

PageRank arbeitet, indem sie die Anzahl und Qualität von Links zu einer Seite zählt, um eine grobe Schätzung der wichtigen Website zu ermitteln. Die zugrunde liegende Annahme ist, dass wichtigere Websites wahrscheinlich mehr Links von anderen Websites erhalten.[1]

Derzeit ist PageRank nicht der einzige Algorithmus, der von Google verwendet wird, um Suchergebnisse zu bestellen, aber es ist der erste Algorithmus, der vom Unternehmen verwendet wurde, und es ist das bekannteste.[2][3] Ab dem 24. September 2019 sind PageRank und alle zugehörigen Patente abgelaufen.[4]

Beschreibung

Cartoon veranschaulicht das Grundprinzip der PageRank. Die Größe jedes Gesichts ist proportional zur Gesamtgröße der anderen Gesichter, die darauf hinweisen.

PageRank ist a Verbindungsanalyse Algorithmus und es weist einen numerischen zu Gewichtung zu jedem Element von a hyperlinks einstellen von Dokumenten wie die Weltweites Netzmit dem Zweck, seine relative Bedeutung innerhalb des Satzes zu "messen". Das Algorithmus kann auf jede Sammlung von Einheiten mit angewendet werden gegenseitig Zitate und Referenzen. Das numerische Gewicht, das es einem bestimmten Element zuweist E wird als die bezeichnet Pagerank von e und bezeichnet von

Ein PageRank resultiert aus einem mathematischen Algorithmus basierend auf dem Webgraph, erstellt von allen World Wide Webseiten als Knoten und Hyperlinks als Kanten unter Berücksichtigung von Behörde Hubs wie z. cnn.com oder Mayoclinic.org. Der Rangwert gibt eine Bedeutung einer bestimmten Seite an. Ein Hyperlink zu einer Seite zählt als Unterstützung. Der Pageank einer Seite ist definiert rekursiv und hängt von der Anzahl und der PageRank -Metrik aller Seiten ab, die darauf verknüpfen ("eingehende Links"). Eine Seite, mit der viele Seiten mit hoher PageRank verknüpft sind, erhält selbst einen hohen Rang.

Seit Seite und Brins Originalpapier wurden zahlreiche akademische Arbeiten über Pagerank veröffentlicht.[5] In der Praxis kann das PageRank -Konzept für die Manipulation anfällig sein. Es wurde Forschungen zur Identifizierung fälschlicherweise beeinflusste PageRank -Ranglisten durchgeführt. Ziel ist es, ein effektives Mittel zu finden, um Links aus Dokumenten mit fälschlicherweise beeinflussten PageRank zu ignorieren.[6]

Andere Link-basierte Ranking-Algorithmen für Webseiten umfassen die Hits Algorithmus erfunden von Jon Kleinberg (benutzt von Teoma und nun Ask.com) das IBM Cleveres Projekt, das Trustrank Algorithmus und der Kolibri Algorithmus.[7]

Geschichte

Das Eigenwert Das Problem wurde 1976 von Gabriel Pinski und Francis Narin vorgeschlagen, die daran arbeiteten Scientometrics Ranking wissenschaftliche Zeitschriften,[8] 1977 von Thomas Saaty in seinem Konzept von Analytischer Hierarchieprozess welche alternativen Entscheidungen gewichtete,[9] und 1995 von Bradley Love und Steven Sloman als Kognitiver Modell Für Konzepte der Zentralitätsalgorithmus.[10][11]

Eine Suchmaschine namens "Rankdex"Aus IDD Information Services, entworfen von von Robin li Im Jahr 1996 entwickelte eine Strategie für die Site-Punktzahl und die Seitenrangierung.[12] Li bezeichnete seinen Suchmechanismus als "Linkanalyse", bei der die Beliebtheit einer Website basierte, basierend darauf, wie viele andere Websites damit verbunden waren.[13] RankDex, die erste Suchmaschine mit Seiten- und Site-Scoring-Algorithmen, wurde 1996 gestartet.[14] LI reichte 1997 ein Patent für die Technologie in Rankdex ein; Es wurde 1999 gewährt.[15] Er benutzte es später, als er gründete Baidu in China im Jahr 2000.[16][17] Google -Gründer Larry Seite Bezeichnete die Arbeit von Li als Zitat in einigen seiner US -Patente für PageRank.[18][14][19]

Larry Page und Sergey Brin entwickelte PageRank bei Universität in Stanford 1996 als Teil eines Forschungsprojekts über eine neue Art von Suchmaschine. Ein Interview mit Héctor García-Molina: Stanford Informatikprofessor und Berater von Sergey [20] Bietet Hintergrund zur Entwicklung des Seiten-Rang-Algorithmus.[21] Sergey Brin hatte die Idee, dass Informationen im Web in einer Hierarchie durch "Linkpopularität" bestellt werden könnten: Eine Seite ist höher, da mehr Links dazu vorliegen.[22] Das System wurde mit Hilfe von Scott Hassan und Alan Steremberg entwickelt, die beide von Page und Brin als entscheidend für die Entwicklung von Google zitiert wurden.[5] Rajeev Motwani und Terry Winograd Mitautorisiert mit Page und Brin das erste Papier über das Projekt und beschreibt PageRank und den ersten Prototyp des Google -Suchmaschine, veröffentlicht 1998.[5] Kurz darauf gründeten Page und Brin Google Inc., das Unternehmen hinter der Google -Suchmaschine. Während PageRank nur einer von vielen Faktoren, die das Ranking der Google-Suchergebnisse bestimmen, liefert PageRank weiterhin die Grundlage für alle Web-Such-Tools von Google.[23]

Der Name "PageRank" spielt auf dem Namen des Entwicklers Larry Page sowie vom Konzept von a Website.[24][25] Das Wort ist eine Marke von Google, und der PageRank -Prozess war patentiert (US -Patent 6.285.999). Das Patent ist jedoch der Stanford University und nicht an Google zugeordnet. Google hat exklusive Lizenzrechte für das Patent der Stanford University. Die Universität erhielt 1,8 Millionen Aktien von Google im Austausch für die Nutzung des Patents. Es verkaufte die Aktien 2005 für US$336 Millionen.[26][27]

PageRank wurde von beeinflusst von Zitieranalyse, früh entwickelt von Eugene Garfield in den 1950er Jahren an der Universität von Pennsylvania und von durch Hypersuche, entwickelt von Massimo Marchiori Bei der Universität von Padua. Im selben Jahr wurde PageRank eingeführt (1998), Jon Kleinberg veröffentlichte seine Arbeiten an Hits. Die Gründer von Google zitieren Garfield, Marchiori und Kleinberg in ihren ursprünglichen Papieren.[5][28]

Algorithmus

Der PageRank -Algorithmus gibt a Wahrscheinlichkeitsverteilung Wird verwendet, um die Wahrscheinlichkeit darzustellen, dass eine Person, die zufällig auf Links klickt, zu einer bestimmten Seite ankommt. PageRank kann für Sammlungen von Dokumenten jeder Größe berechnet werden. In mehreren Forschungsarbeiten wird angenommen, dass die Verteilung zu Beginn des Computerprozesses gleichmäßig auf alle Dokumente in der Sammlung aufgeteilt wird. Die PageRank -Berechnungen erfordern über die Sammlung mehrere Pässe, die als "Iterationen" bezeichnet werden, um die ungefähren PageRank -Werte anzupassen, um den theoretischen tatsächlichen Wert genauer zu reflektieren.

Eine Wahrscheinlichkeit wird als numerischer Wert zwischen 0 und 1 ausgedrückt. Eine Wahrscheinlichkeit von 0,5 wird üblicherweise als "50% -Chance" von etwas ausgedrückt. Ein Dokument mit einer PageRank von 0,5 bedeutet daher eine 50% ige Wahrscheinlichkeit, dass eine Person, die auf einen zufälligen Link klickt, in das Dokument gerichtet wird.

Vereinfachter Algorithmus

Nehmen Sie ein kleines Universum von vier Webseiten an: A, B, C, und D. Links von einer Seite zu sich selbst werden ignoriert. Mehrere ausgehende Links von einer Seite zur anderen Seite werden als einzelner Link behandelt. PageRank wird für alle Seiten auf denselben Wert initialisiert. In der ursprünglichen Form von PageRank war die Summe von PageRank über alle Seiten die Gesamtzahl der Seiten im Web zu diesem Zeitpunkt, sodass jede Seite in diesem Beispiel einen Anfangswert von 1. später, spätere Versionen von Pagerank und der Der Rest dieses Abschnitts nimmt a an Wahrscheinlichkeitsverteilung Zwischen 0 und 1. beträgt der Anfangswert für jede Seite in diesem Beispiel 0,25.

Die PageRank, die von einer bestimmten Seite auf die Ziele seiner ausgehenden Links nach der nächsten Iteration übertragen wurde, wird gleichermaßen unter allen ausgehenden Links aufgeteilt.

Wenn die einzigen Links im System von Seiten stammten B, C, und D zu AJede Verbindung überträgt 0,25 PageRank auf A Bei der nächsten Iteration für insgesamt 0,75.

Nehmen wir stattdessen diese Seite an B hatte einen Link zu Seiten C und A, Seite C Hatte einen Link zur Seite A, und Seite D Hatte Links zu allen drei Seiten. So nach der ersten Iteration, Seite B würde die Hälfte seines bestehenden Werts (0,125) auf Seite übertragen A und die andere Hälfte oder 0,125 bis Seite C. Buchseite C würde den gesamten vorhandenen Wert 0,25 auf die einzige Seite übertragen, auf die sie verlinkt, A. Seit D hatte drei ausgehende Links, es würde ein Drittel seines bestehenden Werts oder ungefähr 0,083 übertragen auf A. Nach Abschluss dieser Iteration, Seite A wird einen Pagerank von ungefähr 0,458 haben.

Mit anderen Worten, der PageRank, der von einem Outbound -Link verliehen wird L ().

Im allgemeinen Fall der PageRank -Wert für jede Seite u kann ausgedrückt werden als:

,

d.h. der PageRank -Wert für eine Seite u hängt von den PageRank -Werten für jede Seite ab v im Satz enthalten Bu (Der Satz, der alle Seiten enthält, die mit der Seite verknüpft sind u), geteilt durch die Zahl L(v) von Links von Seite v.

Dämpfungsfaktor

Die PageRank -Theorie besagt, dass ein imaginärer Surfer, der zufällig auf Links klickt, letztendlich aufhört zu klicken. Die Wahrscheinlichkeit, dass die Person fortgesetzt wird, ist ein Dämpfungsfaktor d. Verschiedene Studien haben unterschiedliche Dämpfungsfaktoren getestet, es wird jedoch allgemein angenommen, dass der Dämpfungsfaktor auf 0,85 festgelegt wird.[5]

Der Dämpfungsfaktor wird von 1 abgezogen (und in einigen Variationen des Algorithmus wird das Ergebnis durch die Anzahl der Dokumente geteilt (Dokumente (N) in der Sammlung) und dieser Begriff wird dann dem Produkt des Dämpfungsfaktors und der Summe der eingehenden PageRank -Scores hinzugefügt. Das ist,

So wird jeder PageRank einer Seite zum großen Teil von den Pageranks anderer Seiten abgeleitet. Der Dämpfungsfaktor passt den abgeleiteten Wert nach unten an. Das ursprüngliche Papier ergab jedoch die folgende Formel, was zu einer gewissen Verwirrung geführt hat:

Der Unterschied zwischen ihnen besteht darin, dass die PageRank -Werte in der ersten Formel -Sum N und die Summe wird N. Eine Aussage in Seite und Brins Papier, dass "die Summe aller Pageranks eine ist"[5] und Ansprüche anderer Google -Mitarbeiter[29] Unterstützen Sie die erste Variante der obigen Formel.

Page und Brin verwirrten die beiden Formeln in ihrem beliebtesten Papier "Die Anatomie einer großen hypertextuellen Web-Suchmaschine", in der sie fälschlicherweise behaupteten, dass die letztere Formel eine Wahrscheinlichkeitsverteilung über Webseiten bildete.[5]

Google berechnet die PageRank -Ergebnisse jedes Mal neu, wenn es das Web kriecht und seinen Index wieder aufgebaut hat. Wenn Google die Anzahl der Dokumente in seiner Sammlung erhöht, nimmt die anfängliche Näherung der PageRank für alle Dokumente ab.

Die Formel verwendet ein Modell von a zufälliger Surfer Wer nach mehreren Klicks ihre Zielstelle erreicht, wechselt dann zu einer zufälligen Seite. Der PageRank -Wert einer Seite spiegelt die Wahrscheinlichkeit wider, dass der zufällige Surfer auf dieser Seite landet, indem er auf einen Link klickt. Es kann als als verstanden werden Markov -Kette in denen die Zustände Seiten sind und die Übergänge die Verbindungen zwischen Seiten sind - alle sind alle gleich wahrscheinlich.

Wenn eine Seite keine Links zu anderen Seiten enthält, wird sie zu einer Senke und beendet daher den zufälligen Surfenprozess. Wenn der zufällige Surfer auf einer Sink -Seite ankommt, wählt er eine andere aus URL zufällig und surft erneut.

Bei der Berechnung der PageRank werden Seiten ohne ausgehende Links angenommen, um sich auf alle anderen Seiten der Sammlung zu verknüpfen. Ihre PageRank -Werte sind daher gleichmäßig auf alle anderen Seiten aufgeteilt. Mit anderen Worten, um mit Seiten, die keine Senken sind, fair zu sein, werden diese zufälligen Übergänge zu allen Knoten im Web hinzugefügt. Diese Restwahrscheinlichkeit, d, wird normalerweise auf 0,85 eingestellt, geschätzt aus der Frequenz, dass ein durchschnittlicher Surfer das Lesezeichen für das Browser verwendet. Die Gleichung lautet also wie folgt:

wo sind die betrachteten Seiten, ist der Satz von Seiten, auf die sich verknüpfen , ist die Anzahl der ausgehenden Links auf Seite , und ist die Gesamtzahl der Seiten.

Die PageRank -Werte sind die Einträge des dominanten Rechts Eigenvektor des modifizierten Adjazenzmatrix Neu skaliert, so dass jede Spalte zu einer summiert. Dies macht PageRank zu einer besonders eleganten Metrik: Der Eigenvektor ist

wo R ist die Lösung der Gleichung

wo die Adjazenzfunktion ist das Verhältnis zwischen der Anzahl der Links von Seite j zu Seite I zu der Gesamtzahl der ausgehenden Links von Seite j. Die Adjazenzfunktion ist 0, wenn Seite Verknüpft nicht auf und so normalisiert, dass für jeden j

,

d.h. die Elemente jeder Spalte bis zu 1, so dass die Matrix a ist Stochastische Matrix (Weitere Details finden Sie in der Berechnung Abschnitt unten). Somit ist dies eine Variante der Eigenvektor -Zentralität Messung häufig in Netzwerkanalyse.

Wegen der großen Eigengap der modifizierten Adjazenzmatrix oben,[30] Die Werte des PageRank -Eigenvektors können innerhalb eines hohen Maßes an Genauigkeit innerhalb weniger Iterationen angenähert werden.

Die Gründer von Google in ihrem Originalpapier,[28] berichtete, dass der PageRank-Algorithmus für ein Netzwerk, das aus 322 Millionen Verbindungen (In-Eduges und Out-Out-Pendges) besteht, innerhalb einer tolerierbaren Grenze in 52 Iterationen konvergiert. Die Konvergenz in einem Netzwerk von der Hälfte der oben genannten Größe dauerte ungefähr 45 Iterationen. Durch diese Daten kamen sie zu dem Schluss, dass der Algorithmus sehr gut skaliert werden kann und dass der Skalierungsfaktor für extrem große Netzwerke in ungefähr linear ist , wo n ist die Größe des Netzwerks.

Als Ergebnis von Markov -TheorieEs kann gezeigt werden, dass die PageRank einer Seite nach einer großen Anzahl von Klicks die Wahrscheinlichkeit ist, auf dieser Seite zu kommen. Dies geschieht gleich wo ist der Erwartung der Anzahl der Klicks (oder zufälligen Sprünge), die erforderlich sind, um von der Seite zurück zu sich selbst zu gelangen.

Ein Hauptnachteil von PageRank ist, dass es ältere Seiten bevorzugt. Eine neue Seite, selbst eine sehr gute, hat nicht viele Links, es sei denn Wikipedia).

Es wurden mehrere Strategien vorgeschlagen, um die Berechnung der PageRank zu beschleunigen.[31]

Verschiedene Strategien zur Manipulation von PageRank wurden in konzertierten Anstrengungen zur Verbesserung der Suchergebnisse eingesetzt und Werbeverbindungen monetarisieren. Diese Strategien haben die Zuverlässigkeit des PageRank -Konzepts stark beeinflusst, das vorgibt, festzustellen, welche Dokumente tatsächlich von der Web -Community bewertet werden.

Seit Dezember 2007, als es anfing aktiv Bestrafung von Websites, die bezahlte Textlinks verkaufen, hat Google gekämpft Linkfarmen verknüpfen und andere Programme, die zum künstlichen Aufblasen von PageRank entwickelt wurden. Wie Google Link -Farmen und andere PageRank -Manipulationstools identifiziert, gehört zu den Google's Geschäftsgeheimnisse.

Berechnung

PageRank kann entweder iterativ oder algebraisch berechnet werden. Die iterative Methode kann als die angesehen werden Kraft -Iteration Methode [32][33] oder die Leistungsmethode. Die ausgeführten grundlegenden mathematischen Operationen sind identisch.

Iterativ

Bei Eine anfängliche Wahrscheinlichkeitsverteilung wird normalerweise angenommen

.

wo n ist die Gesamtzahl der Seiten und ist Seite I zum Zeitpunkt 0.

Zu jedem Zeitschritt ergibt die Berechnung, wie oben detailliert, die Berechnung

wo d der Dämpfungsfaktor ist,

oder in der Matrixnotation

,

 

 

 

 

(1)

wo und ist der Säulenvektor der Länge nur eine enthalten.

Die Matrix ist definiert als

d.h.

,

wo bezeichnet die Adjazenzmatrix der Grafik und ist die diagonale Matrix mit den Außenbereiche in der Diagonale.

Die Wahrscheinlichkeitsberechnung wird für jede Seite zu einem Zeitpunkt durchgeführt und dann zum nächsten Zeitpunkt wiederholt. Die Berechnung endet, wenn für einige kleine

,

d.h., wenn die Konvergenz angenommen wird.

Leistungsmethode

Wenn die Matrix ist eine Übergangswahrscheinlichkeit, d. H. Säulenstochastisch und ist eine Wahrscheinlichkeitsverteilung (d. H., , wo ist Matrix aller), dann Gleichung (2) ist äquivalent zu

.

 

 

 

 

(3)

Daher Pagerank ist der Hauptmerkmale von . Eine schnelle und einfache Möglichkeit, dies zu berechnen Leistungsmethode: Beginnend mit einem willkürlichen Vektor , der Bediener wird nacheinander angewendet, d. H.,

,

bis um

.

Beachten Sie das in Gleichung (3) Die Matrix auf der rechten Seite in der Klammer kann als interpretiert werden

,

wo ist eine anfängliche Wahrscheinlichkeitsverteilung. n der aktuelle Fall

.

Endlich, wenn Spalten mit nur Nullwerten, sie sollten durch den anfänglichen Wahrscheinlichkeitsvektor ersetzt werden. Mit anderen Worten,

,

wo die Matrix ist definiert als

,

mit

In diesem Fall werden die oben genannten zwei Berechnungen verwendet Geben Sie nur den gleichen PageRank an, wenn ihre Ergebnisse normalisiert sind:

.

Implementierung

Scala/Apache Funken

Ein typisches Beispiel ist die Verwendung der funktionellen Programmierung von Scala mit Apache Spark RDDs, um die Seitenränge iterativ zu berechnen.[34] [35]

Objekt Sparkpagerank {  def hauptsächlich(Args: Array[Saite])) {  val Funke = SparkSession  .Erbauer  .App Name("Sparkpagerank")  .Getorcreate()  val ITERS = wenn (Args.Länge > 1) Args(1).Toint anders 10  val Linien = Funke.lesen.Textdatei(Args(0)).RDD  val Links = Linien.Karte{ s =>  val Teile = s.Teilt("\\ s+")  (Teile(0), Teile(1))  }.unterscheidbar().GroupByKey().Zwischenspeicher()       var Ränge = Links.MapValues(v => 1.0)  zum (i <- 1 zu ITERS) {  val Beiträge = Links.beitreten(Ränge).Werte.Flatmap{ Fall (URLs, Rang) =>  val Größe = URLs.Größe  URLs.Karte(URL => (URL, Rang / Größe))  }  Ränge = Beiträge.Redebykey(_ + _).MapValues(0,15 + 0,85 * _)  }  val Ausgang = Ränge.sammeln()  Ausgang.für jeden(Tup => println(Tup._1 + "hat Rang:" + Tup._2 + "."))  Funke.Pause()  } } 

Matlab/Oktave

% Parameter m adjazenzmatrix wobei M_I, J den Link von 'J' zu 'I' darstellt, so dass für alle 'j' % sum (i, m_i, j) = 1 % Parameter D Dämpfungsfaktor % Parameter v_quadratic_error quadratischer Fehler für v % Return V, ein Vektor von Rängen, so dass V_I der i-te Rang von [0, 1] ist Funktion [v] = Rang2(M, d, v_quadratic_error) N = Größe(M, 2); % N entspricht einer beiden Dimension von m und der Anzahl der Dokumente v = Rand(N, 1); v = v . Norm(v, 1);  % Das ist jetzt L1, nicht L2 last_v = Einsen(N, 1) * Inf; M_hat = (d .* M) + ((((1 - d) / N) .* Einsen(N, N)); während (Norm(v - last_v, 2) > v_quadratic_error) 	last_v = v; 	v = M_hat * v;   % hat die L2 -Norm der iterierten PR entfernt Ende Ende %Funktion 

Beispiel für Code, die die oben definierte Rangfunktion aufruft:

M = [0 0 0 0 1 ; 0,5 0 0 0 0 ; 0,5 0 0 0 0 ; 0 1 0,5 0 0 ; 0 0 0,5 1 0]; Rang2(M, 0,80, 0,001) 

Python

"" "PageRank -Algorithmus mit explizite Anzahl von Iterationen. Kehrt zurück ------- Ranking von Knoten (Seiten) in der Adjazenzmatrix "" " importieren Numpy wie np def Seitenrang(M, num_iterations: int = 100, d: schweben = 0,85):  "" PageRank: Der Billion -Dollar -Algorithmus.     Parameter     ----------     M: Numpy Array         Adjazenzmatrix, wobei M_I, J den Link von 'J' zu 'I' repräsentiert, so dass für alle 'j'         sum (i, m_i, j) = 1     num_iterations: int, optional         Anzahl der Iterationen standardmäßig 100     D: Float, optional         Dämpfungsfaktor standardmäßig 0,85     Kehrt zurück     -------     Numpy Array         Ein Vektor von Rängen, so dass V_I der i-te Rang von [0, 1] ist.         V summen bis 1     "" "  N = M.Form[1]  v = np.Einsen(N) / N  M_hat = (d * M + (1 - d) / N)  zum i in Angebot(num_iterations):  v = v @ M_hat  Rückkehr v M = np.Array[[[[0, 0, 0, 0, 1],  [0,5, 0, 0, 0, 0],  [0,5, 0, 0, 0, 0],  [0, 1, 0,5, 0, 0],  [0, 0, 0,5, 1, 0]])) v = Seitenrang(M, 100, 0,85) 

Dieses Beispiel dauert ~ 13 Iterationen, um zu konvergieren.

Variationen

Pageank eines ungerichteten Graphen

Der Pageank eines ungerichteten Graph ist statistisch nahe zu der Gradverteilung der Grafik ,[36] aber sie sind im Allgemeinen nicht identisch: wenn ist der oben definierte PageRank -Vektor, und ist der Gradverteilungsvektor

wo bezeichnet den Grad des Scheitelpunkts , und ist dann der Kantensatz des Diagramms mit ,[37] zeigt, dass:

Das heißt, der PageRank eines ungerichteten Graphen entspricht dem Gradverteilungsvektor, wenn und nur dann, wenn der Diagramm regelmäßig ist, d. H. Jeder Scheitelpunkt hat den gleichen Grad.

Verallgemeinerung der PageRank- und Eigenvektor -Zentralität für die Rangliste von Objekten zweier Arten

Eine Verallgemeinerung von PageRank für den Fall von zwei interagierenden Gruppen von Objekten wurde von Daugulis beschrieben.[38] In Anwendungen kann es erforderlich sein, Systeme mit Objekten von zwei Arten zu modellieren, bei denen eine gewichtete Beziehung zu Objektpaaren definiert wird. Dies führt zu Betrachtung Bipartitale Grafiken. Für solche Diagramme können zwei verwandte positive oder nichtnegative irreduzible Matrizen, die den Vertex -Partitionssätzen entsprechen, definiert werden. Man kann die Rangliste von Objekten in beiden Gruppen als Eigenvektoren berechnen, die den maximalen positiven Eigenwerten dieser Matrizen entsprechen. Normierte Eigenvektoren existieren und sind durch den Theorem Perron oder Perron -Frobenius einzigartig. Beispiel: Verbraucher und Produkte. Das Beziehungsgewicht ist die Produktverbrauchsrate.

Verteilter Algorithmus für die PageRank -Berechnung

Sarma et al. Beschreibe zwei zielloser Spaziergang-basierend verteilte Algorithmen Für die Berechnung der PageRank von Knoten in einem Netzwerk.[39] Ein Algorithmus nimmt Runden mit hoher Wahrscheinlichkeit in jedem Diagramm (gerichtet oder ungerichtet), wobei n die Netzwerkgröße und ist ist die zurücksetzende Wahrscheinlichkeit (, was als Dämpfungsfaktor bezeichnet wird) verwendet in der PageRank -Berechnung. Sie präsentieren auch einen schnelleren Algorithmus, der nimmt Runden in ungerichteten Graphen. In beiden Algorithmen verarbeitet und sendet jeder Knoten eine Reihe von Bits pro Runde, die in N, die Netzwerkgröße, polylogarithmisch sind.

Google Toolbar

Das Google Toolbar Long hatte eine PageRank -Funktion, in der die PageRank einer besuchten Seite zwischen 0 (am wenigsten beliebt) und 10 (am beliebtesten) angezeigt wurde. Google hatte die spezifische Methode zur Ermittlung eines Symbolleisten -PageRank -Werts nicht offengelegt, der nur als grobe Hinweis auf den Wert einer Website angesehen werden sollte. Die "Symbolleiste PageRank" war für verifizierte Site -Wardiener über die Schnittstelle von Google Webmaster Tools verfügbar. Am 15. Oktober 2009 bestätigte ein Google -Mitarbeiter jedoch, dass das Unternehmen die PageRank von seinem entfernt hatte Webmaster werkzeuge Abschnitt, der sagt: "Wir haben den Leuten schon lange gesagt, dass sie sich nicht so sehr auf PageRank konzentrieren sollten. Viele Site -Eigentümer scheinen es für das Wichtigste zu denken, dass es das wichtigste ist metrisch Für sie zu verfolgen, was einfach nicht wahr ist. "[40]

Die "Symbolleiste Pagerank" wurde sehr selten aktualisiert. Es wurde zuletzt im November 2013 aktualisiert. Im Oktober 2014 gab Matt Cutts bekannt, dass ein weiteres sichtbares PageRank -Update nicht kommen würde.[41] Im März 2016 kündigte Google an, diese Funktion nicht mehr zu unterstützen, und die zugrunde liegende API würde bald aufhören zu arbeiten.[42] Am 15. April 2016 hat Google die Anzeige von PageRank -Daten in der Google -Symbolleiste ausgeschaltet.[43] Die PageRank wurde zwar weiterhin intern verwendet, um Inhalte in den Suchergebnissen zu bewerten.[44]

SERP Rang

Das Seite der Suchmaschinenergebnisse (SERP) ist das tatsächliche Ergebnis, das von einer Suchmaschine als Antwort auf eine Keyword -Abfrage zurückgegeben wird. Die SERP besteht aus einer Liste von Links zu Webseiten mit zugehörigen Textausschnitten. Der SERP -Rang einer Webseite bezieht sich auf die Platzierung des entsprechenden Links auf der SERP, wo eine höhere Platzierung einen höheren SERP -Rang bedeutet. Der SERP -Rang einer Webseite ist nicht nur eine Funktion seiner PageRank, sondern auch eines relativ großen und kontinuierlich eingestellten Satzes von Faktoren (über 200).[45][unzuverlässige Quelle?] Suchmaschinenoptimierung (SEO) zielt darauf ab, den SERP -Rang für eine Website oder eine Reihe von Webseiten zu beeinflussen.

Die Positionierung einer Webseite auf Google Serps für ein Schlüsselwort hängt von Relevanz und Ruf ab, auch als Autorität und Popularität bezeichnet. PageRank ist Googles Hinweis auf die Bewertung des Rufs einer Webseite: Es ist nicht keywordspezifisch. Google verwendet eine Kombination aus Webseite und Website -Autorität, um die Gesamtberechtigung einer Webseite zu bestimmen, die um ein Keyword konkurriert.[46] Die PageRank der Homepage einer Website ist der beste Hinweis, der Google für die Website -Autorität bietet.[47]

Nach der Einführung von Google Plätze In den Mainstream -Bio -SERP wirken sich zahlreiche andere Faktoren neben der PageRank auf die Rangliste eines Unternehmens in lokalen Geschäftsergebnissen aus.[48] Als Google die Gründe für die PageRank -Abschaltung bei Q & A #March 2016 ausführte, kündigten sie Links und Inhalte als Top -Ranking -Faktoren an. RankBrain war Anfang Oktober 2015 als Nr. 3 Ranking -Faktor bekannt gegeben, sodass die Top -3 -Faktoren von Google offiziell bestätigt wurden.[49]

Google Directory Pagerank

Das Google -Verzeichnis PageRank war eine 8-Einheiten-Messung. Im Gegensatz zur Google -Symbolleiste, die einen numerischen PageRank -Wert beim Mausover der Green Balken anzeigt, zeigte das Google -Verzeichnis nur die Balken, niemals die numerischen Werte. Google Directory wurde am 20. Juli 2011 geschlossen.[50]

Falsche oder gefälschte PageRank

Es war bekannt, dass der in der Symbolleiste gezeigte Pagerank leicht sein konnte gefälscht. Umleitung von einer Seite zur anderen, entweder über a HTTP 302 Antwort oder eine "Aktualisierung" Meta -Tag, veranlasste die Quellseite, die PageRank der Zielseite zu erwerben. Daher hätte eine neue Seite mit PR 0 und keine eingehenden Links PR 10 erfassen können, indem sie auf die Google -Startseite umgeleitet werden. Spoofing kann normalerweise durch Ausführen einer Google -Suche nach einer Quell -URL erkannt werden. Wenn die URL einer völlig anderen Stelle in den Ergebnissen angezeigt wird, kann die letztere URL das Ziel einer Umleitung darstellen.

PageRank manipulieren

Zum Suchmaschinenoptimierung Zwecke bieten einige Unternehmen an, hohe PageRank -Links zu Webmastern zu verkaufen.[51] Da die Verbindungen von höheren PR-Seiten als wertvoller angesehen werden, sind sie tendenziell teurer. Es kann eine effektive und praktikable Marketingstrategie sein, um Link -Anzeigen auf Inhaltsseiten von Qualitäts- und relevanten Websites zu kaufen, um den Verkehr voranzutreiben und die Linkpopularität eines Webmaster zu erhöhen. Google hat jedoch öffentlich die Webmaster gewarnt, dass ihre Links abgewertet werden (ignoriert bei der Berechnung der Pageranks anderer Seiten), wenn sie entdeckt werden, dass sie Links zum Zweck der Verleihung von PageRank und dem Ruf von PageRank und Reputation verkaufen). Die Praxis des Kaufens und Verkaufs [52] wird in der Webmaster -Community intensiv diskutiert. Google riet Webmaster, die zu verwenden Nofollow HTML attribute Wert für bezahlte Links. Entsprechend Matt CuttsGoogle ist besorgt über Webmaster, die es versuchen, es zu versuchen Spiel das Systemund dadurch die Qualität und Relevanz der Google -Suchergebnisse verringern.[51]

Im Jahr 2019 bot Google eine neue Art von Tags an, die "Link Juice" nicht übergeben und daher keinen Wert für die SEO-Link-Manipulation haben: rel = "ugc" als Tag für benutzergenerierte Inhalte, wie z. B. Kommentare; und rel = "gesponserte" Tag für Anzeigen oder andere Arten von gesponserten Inhalten.[53]

Obwohl PageRank für SEO-Zwecke weniger wichtig geworden ist, treibt die Existenz von Backlinks von beliebteren Websites weiterhin eine Webseite in Suchrankings weiter.[54]

Direktes Surfer -Modell

Ein intelligenterer Surfer, der je nach Inhalt der Seiten und Abfragen von Surfer von Seite zu Seite probabilistisch hüpft. Dieses Modell basiert auf einer abfrageabhängigen PageRank-Punktzahl einer Seite, die, wie der Name schon sagt, auch eine Funktion der Abfrage ist. Wenn eine Multiple-Term-Abfrage gegeben wird, Der Surfer wählt a Nach einer Wahrscheinlichkeitsverteilung,, und verwendet diesen Begriff, um sein Verhalten für eine große Anzahl von Schritten zu leiten. Es wählt dann einen anderen Begriff gemäß der Verteilung aus, um sein Verhalten zu bestimmen, usw. Die resultierende Verteilung über besuchte Webseiten ist QD-PageRank.[55]

Soziale Komponenten

Katja Mayer betrachtet PageRank als ein soziales Netzwerk, da es unterschiedliche Standpunkte und Gedanken an einem einzigen Ort verbindet.[56] Die Leute gehen nach PageRank, um Informationen zu erhalten und werden mit überflutet Zitate von anderen Autoren, die ebenfalls eine Meinung zum Thema haben. Dies schafft einen sozialen Aspekt, in dem alles diskutiert und gesammelt werden kann, um das Denken zu provozieren. Es gibt eine soziale Beziehung zwischen PageRank und den Menschen, die sie nutzen, da sie sich ständig an die Veränderungen in der modernen Gesellschaft anpasst und sich an die Veränderungen verändert. Betrachten der Beziehung zwischen Pagerank und dem Individuum durch Soziometrie Ermöglicht einen detaillierten Blick auf die Verbindung, die sich ergibt.

[57] Matteo Pasquinelli hält die Grundlage für die Überzeugung, dass PageRank eine soziale Komponente hat Aufmerksamkeitswirtschaft. Mit der Aufmerksamkeitsökonomie wird der Wert auf Produkte gelegt, die eine größere Menge an menschlicher Aufmerksamkeit erhalten, und die Ergebnisse oben auf der PageRank sammeln eine größere Menge an Fokus als die auf den folgenden Seiten. Die Ergebnisse mit dem höheren Pagerank werden daher in größerem Maße in das menschliche Bewusstsein eintreten. Diese Ideen können die Entscheidungsfindung beeinflussen und die Handlungen des Betrachters haben eine direkte Beziehung zum PageRank. Sie verfügen über ein höheres Potenzial, um die Aufmerksamkeit eines Benutzers zu erregen, wenn ihr Standort die auf die Website verbundene Aufmerksamkeitswirtschaft erhöht. Mit diesem Standort können sie mehr Verkehr erhalten und ihr Online -Marktplatz wird mehr Einkäufe haben. Die PageRank dieser Websites ermöglicht es ihnen, vertrauenswürdig zu sein, und sie können dieses Vertrauen in ein verstärktes Geschäft einstellen.

Andere Verwendungen

Die Mathematik von PageRank ist völlig allgemein und gilt für alle Grafiken oder Netzwerke in einer Domäne. Daher wird PageRank nun regelmäßig in der Analyse von Bibliometrie, Sozial- und Informationsnetzwerk sowie für die Vorhersage und Empfehlung von Verbindungen verwendet. Es wird zur Systemanalyse von Straßennetzwerken sowie in Biologie, Chemie, Neurowissenschaften und Physik verwendet.[58]

Wissenschaftliche Forschung und Wissenschaft

PageRank wurde verwendet, um die wissenschaftlichen Auswirkungen von Forschern zu quantifizieren. Die zugrunde liegenden Zitier- und Zusammenarbeitennetzwerke werden in Verbindung mit dem PageRank -Algorithmus verwendet, um ein Ranking -System für einzelne Veröffentlichungen zu entwickeln, das sich an einzelne Autoren ausbreitet. Der neue Index, der als Pagerank-Index (PI) bekannt ist, wird im Vergleich zu H-Index im Zusammenhang mit vielen von H-Index gezeigten Nachteilen als fairer erwiesen.[59]

Für die Analyse von Proteinnetzwerken in der Biologie ist PageRank auch ein nützliches Instrument.[60][61]

In jedem Ökosystem kann eine modifizierte Version von PageRank verwendet werden, um Arten zu bestimmen, die für die kontinuierliche Gesundheit der Umwelt unerlässlich sind.[62]

Eine ähnliche neuere Verwendung von PageRank besteht darin, akademische Doktorandenprogramme auf der Grundlage ihrer Aufzeichnungen über die Vermittlung ihrer Absolventen in Fakultätspositionen zu bewerten. In PageRank -Begriffen verknüpfen akademische Abteilungen miteinander, indem sie ihre Fakultät voneinander (und von sich selbst) einstellen.[63]

Eine Version von PageRank wurde kürzlich als Ersatz für das traditionelle Vorgang vorgeschlagen Institut für wissenschaftliche Informationen (ISI) Schlagfaktor,[64] und implementiert bei Eigenfaktor sowie bei Scimago. Anstatt nur Gesamtzitate für eine Zeitschrift zu zählen, wird die "Bedeutung" jedes Zitats in PageRank -Weise bestimmt.

Im Neurowissenschaften, der Pageank von a Neuron Es wurde festgestellt, dass in einem neuronalen Netzwerk mit seiner relativen Feuerrate korreliert.[65]

Internetnutzung

Personalisierte PageRank wird von verwendet von Twitter Um den Benutzern andere Konten zu präsentieren, möchten sie möglicherweise folgen.[66]

SWIFTYPE's SEADSEUCHER -Produkt erstellt eine "PageRank, die für einzelne Websites spezifisch ist", indem Sie die Signale der einzelnen Website von Bedeutung betrachten und Inhalte basierend auf Faktoren wie der Anzahl der Links auf der Startseite priorisieren.[67]

A Web -Crawler Kann PageRank als eine von einer Reihe von Wichtigkeitsmetriken verwenden, mit denen er während eines Kriechs des Webs bestimmt werden soll. Eines der frühen Arbeitspapiere[68] die bei der Erstellung von Google verwendet wurden, ist Effizientes Krabbeln durch URL -Bestellung,[69] Dies erörtert die Verwendung einer Reihe unterschiedlicher Wichtigkeitsmetriken, um festzustellen, wie tief und wie viel von einer Website Google kriecht wird. PageRank wird als eine von einer Reihe dieser Wichtigkeitsmetriken dargestellt, obwohl andere aufgeführt sind, wie die Anzahl der eingehenden und ausgehenden Links für eine URL und die Entfernung vom Wurzelverzeichnis auf einer Site zur URL.

Der PageRank kann auch als Methodik verwendet werden, um die offensichtlichen Auswirkungen einer Gemeinschaft wie die zu messen Blogosphäre im Gesamtnetz selbst. Dieser Ansatz verwendet daher den PageRank, um die Aufmerksamkeitsverteilung in der Reflexion der zu messen Skalenfreies Netzwerk Paradigma.

Andere Anwendungen

Im Jahr 2005 in einer Pilotstudie in Pakistan,, Strukturelle Deep Democracy, SD2[70][71] wurde für die Auswahl der Führung in einer nachhaltigen Landwirtschaftsgruppe namens Contact Youth verwendet. SD2 verwendet Seitenrang Für die Verarbeitung der transitiven Proxy -Stimmen mit den zusätzlichen Einschränkungen, mindestens zwei anfängliche Stellvertreter pro Wähler vorzuschreiben, und alle Wähler sind Proxy -Kandidaten. Komplexere Varianten können auf SD2 aufgebaut werden, z. B. das Hinzufügen von speziellen Proxys und direkten Stimmen für bestimmte Themen.

Im Sport wurde der PageRank -Algorithmus verwendet, um die Leistung von: Teams in der National Football League (NFL) in den USA zu bewerten;[72] Einzelfußballspieler;[73] und Athleten in der Diamond League.[74]

PageRank wurde verwendet, um Räume oder Straßen zu rangieren, um vorherzusagen, wie viele Menschen (Fußgänger oder Fahrzeuge) in die einzelnen Räume oder Straßen kommen.[75][76] Im lexikalische Semantik Es wurde verwendet, um durchzuführen Wortgefühl Disambiguation,[77] Semantische Ähnlichkeit,[78] und auch automatisch ein Rang Wordnet Synsets Wie stark sie ein bestimmtes semantisches Eigentum besitzen, wie z. B. Positivität oder Negativität.[79]

Nofollow

Anfang 2005 hat Google einen neuen Wert implementiert. "Nofollow",",[80] für die rel Attribut von HTML -Link und Ankerelementen, so dass Website -Entwickler und Blogger Kann Links erstellen, die Google für die Zwecke der PageRank nicht berücksichtigen wird - sie sind Links, die keine "Abstimmung" im PageRank -System mehr darstellen. Die Nofollow -Beziehung wurde hinzugefügt, um zu helfen Spamdexing.

Als Beispiel könnten Personen zuvor viele Nachrichten-Board-Beiträge mit Links zu ihrer Website erstellen, um ihre PageRank künstlich aufzublasen. Mit dem Nofollow-Wert können Nachrichten-Board-Administratoren ihren Code so ändern, dass sie "rel = 'nofollow" automatisch in alle Hyperlinks in Posts einfügen und so verhindern, dass PageRank von diesen bestimmten Posts betroffen ist. Diese Vermeidungsmethode hat jedoch auch verschiedene Nachteile, z. B. die Reduzierung des Verbindungswerts legitimer Kommentare. (Sehen: Spam in Blogs#nofollow))

Um den PageRank -Fluss zwischen den Seiten innerhalb einer Website manuell zu steuern, üben viele Webmaster, was als PageRank Sculpting genannt wird[81]- Dies ist der Akt der strategischen Bestimmung des Nofollow -Attributs auf bestimmte interne Links einer Website, um die PageRank auf diese Seiten zu übertragen, die der Webmaster als am wichtigsten erachtet hat. Diese Taktik wurde seit Beginn des Nofollow -Attributs angewendet, ist jedoch möglicherweise nicht mehr wirksam, da Google angekündigt hat, dass das Blockieren der PageRank -Transfer mit Nofollow diese PageRank nicht auf andere Links weiterleitet.[82]

Siehe auch

Verweise

Zitate

  1. ^ "Fakten über Google und Wettbewerb". Archiviert von das Original am 4. November 2011. Abgerufen 12. Juli 2014.
  2. ^ Sullivan, Danny (2007-04-26). "Was ist Google PageRank? Ein Leitfaden für Suchende und Webmaster". Suchmaschinenland. Archiviert vom Original am 2016-07-03.
  3. ^ Cutts, Matt. "Algorithmen bewerten relevante Ergebnisse höher". Archiviert von das Original am 2. Juli 2013. Abgerufen 19. Oktober 2015.
  4. ^ "US7058628B1 - Methode für das Knotenranking in einer verknüpften Datenbank - Google Patents". Google -Patente. Archiviert Aus dem Original am 16. Januar 2020. Abgerufen 14. September, 2019.
  5. ^ a b c d e f g Brin, S.; Seite, L. (1998). "Die Anatomie einer groß angelegten hypertextuellen Web-Suchmaschine" (PDF). Computernetzwerke und ISDN -Systeme. 30 (1–7): 107–117. Citeseerx 10.1.1.115.5930. doi:10.1016/s0169-7552 (98) 00110-x. ISSN 0169-7552. Archiviert (PDF) vom Original am 2015-09-27.
  6. ^ Gyöngyi, Zoltán; Berkhin, Pavel; Garcia-Molina, Hector; Pedersen, Jan (2006), "Link -Spam -Erkennung basierend auf Massenschätzung", Proceedings der 32. Internationalen Konferenz über sehr große Datenbasis (VLDB '06, Seoul, Korea) (PDF), S. 439–450, archiviert (PDF) vom Original am 2014-12-03.
  7. ^ "FAQ: Alles über den neuen Google" Hummingbird "Algorithmus". Suchmaschinenland. 26. September 2013. Archiviert Aus dem Original am 23. Dezember 2018. Abgerufen 18. Dezember 2018.
  8. ^ Gabriel Pinski & Francis Narin (1976). "Zitiereinfluss für Journalaggregate wissenschaftlicher Veröffentlichungen: Theorie, mit Anwendung auf die Literatur der Physik". Informationsverarbeitung und -verwaltung. 12 (5): 297–312. doi:10.1016/0306-4573 (76) 90048-0.
  9. ^ Thomas Saaty (1977). "Eine Skalierungsmethode für Prioritäten in hierarchischen Strukturen". Zeitschrift für mathematische Psychologie. 15 (3): 234–281. doi:10.1016/0022-2496 (77) 90033-5. HDL:10338.DMLCZ/101787.
  10. ^ Bradley C. Love & Steven A. Sloman. "Veränderlichkeit und die Determinanten der konzeptionellen Transformierbarkeit" (PDF). Verfahren der 17. Jahreskonferenz der Cognitive Science Society. S. 654–659. Archiviert (PDF) vom Original am 2017-12-23. Abgerufen 2017-12-23.
  11. ^ "Wie ein COGSCI -Studenten PageRank drei Jahre vor Google erfunden hat". Bradlove.org. Archiviert vom Original am 2017-12-11. Abgerufen 2017-12-23.
  12. ^ Li, Yanhong (6. August 2002). "Auf dem Weg zu einer qualitativen Suchmaschine". IEEE Internet Computing. 2 (4): 24–29. doi:10.1109/4236.707687.
  13. ^ "Der Aufstieg von Baidu (das ist Chinesisch für Google)". Die New York Times. 17. September 2006. Archiviert Aus dem Original am 27. Juni 2019. Abgerufen 16. Juni 2019.
  14. ^ a b "About: Rankdex" Archiviert 2015-05-25 in der Wayback -Maschine, Rankdex; Zugriff am 3. Mai 2014.
  15. ^ USPTO, "Hypertext -Dokument -Abrufsystem und Methode" Archiviert 2011-12-05 im Wayback -Maschine, US -Patentnummer: 5920859, Erfinder: Yanhong LI, Anmeldetag: 5. Februar 1997, Ausgabedatum: 6. Juli 1999
  16. ^ Greenberg, Andy, "Der Mann, der Google schlägt" Archiviert 2013-03-08 bei der Wayback -Maschine, Forbes Magazin, 5. Oktober 2009
  17. ^ "About: Rankdex" Archiviert 2012-01-20 bei der Wayback -Maschine, Rankdex.com
  18. ^ "Methode für das Knotenranking in einer verknüpften Datenbank". Google -Patente. Archiviert Aus dem Original am 15. Oktober 2015. Abgerufen 19. Oktober 2015.
  19. ^ Altucher, James (18. März 2011). "10 ungewöhnliche Dinge über Google". Forbes. Archiviert Aus dem Original am 16. Juni 2019. Abgerufen 16. Juni 2019.
  20. ^ Greg Wientjes. "Hector Garcia-Molina: Stanford Informatikprofessor und Berater von Sergey". S. Minuten 25.45-32.50, 34.00–38.20. Abgerufen 2019-12-06.
  21. ^ Seite, Larry, "Pagerank: Bestellung in das Web bringen". Archiviert von das Original am 6. Mai 2002. Abgerufen 2016-09-11., Stanford Digital Library Project, Talk. 18. August 1997 (Archiviert 2002)
  22. ^ 187-seitige Studie an der Graz University, Österreich Archiviert 2014-01-16 bei der Wayback -MaschineEnthält die Notiz, dass auch menschliche Gehirne verwendet werden, wenn der Seitenrang in Google ermittelt wird.
  23. ^ "Unsere Produkte und Dienstleistungen". Archiviert vom Original am 2008-06-23. Abgerufen 2011-05-27.
  24. ^ David Vise & Mark Malseed (2005). Die Google -Geschichte. p.37. ISBN 978-0-553-80457-7.
  25. ^ "Google Press Center: Unterhaltsame Fakten". Archiviert von das Original Am 2001-07-15.
  26. ^ Lisa M. Krieger (1. Dezember 2005). "Stanford verdient 336 Millionen US -Dollar von Google Stock". San Jose Mercury News. Archiviert Aus dem Original am 8. April 2009. Abgerufen 2009-02-25 - über zitiert von Redorbit.
  27. ^ Richard Brandt. "Starten. Wie Google seinen Groove bekam". Stanford Magazine. Archiviert vom Original am 2009-03-10. Abgerufen 2009-02-25.
  28. ^ a b Seite, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry (1999). Das Pageank Citation Ranking: Bestellung in das Web bringen (Bericht). Archiviert vom Original am 2006-04-27., veröffentlicht als technischer Bericht am 29. Januar 1998 PDF Archiviert 2011-08-18 bei der Wayback -Maschine
  29. ^ Matt CuttsBlog: Direkt von Google: Was Sie wissen müssen Archiviert 2010-02-07 am Wayback -Maschinesiehe Seite 15 seiner Folien.
  30. ^ Taher Haveliwala & Sepandar Kamvar (März 2003). "Der zweite Eigenwert der Google -Matrix" (PDF). Technischer Bericht der Stanford University: 7056. Arxiv:Math/0307056. Bibcode:2003math ...... 7056n. Archiviert (PDF) vom Original am 2008-12-17.
  31. ^ Gianna M. del Corso; Antonio Gullí; Francesco Romani (2005). Schnelle PageRank -Berechnung über ein spärliches lineares System. Internet -Mathematik. Vorlesungsnotizen in Informatik. Vol. 2. S. 118–130. Citeseerx 10.1.1.58.9060. doi:10.1007/978-3-540-30216-2_10. ISBN 978-3-540-23427-2. Archiviert vom Original am 2014-02-09.
  32. ^ Arasu, A. und Novak, J. und Tomkins, A. und Tomlin, J. (2002). "PageRank -Berechnung und die Struktur des Web: Experimente und Algorithmen". Proceedings der elften Internationalen World Wide Web Conference, Poster Track. Brisbane, Australien. S. 107–117. Citeseerx 10.1.1.18.5264.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)
  33. ^ Massimo Franceschet (2010). "Pagerank: Auf den Schultern der Riesen stehen". Arxiv:1002.2858 [cs.ir].
  34. ^ "Spark -Seitenrang -Implementierung | Github". GitHub. Archiviert vom Original am 2020-08-18. Abgerufen 2020-03-21.
  35. ^ "Page -Rang -Algorithmus & Spark Implementierung | Mit gutem Beispielsweise". GitHub. 10. September 2021.
  36. ^ Nicola Perra und Santo Fortunato; Fortunato (September 2008). "Spektrale Zentralitätsmessungen in komplexen Netzwerken". Phys. Rev. e. 78 (3): 36107. Arxiv:0805.3322. Bibcode:2008phrve..78C6107p. doi:10.1103/Physreve.78.036107. PMID 18851105. S2CID 1755112.
  37. ^ Vince Grolmusz (2015). "Eine Notiz über die PageRank von ungerichteten Graphen". Informationsverarbeitungsbriefe. 115 (6–8): 633–634. Arxiv:1205.1960. doi:10.1016/j.ipl.2015.02.015. S2CID 9855132.
  38. ^ Peteris Daugulis; Daugulis (2012). "Ein Hinweis über eine Verallgemeinerung der Eigenvektorzentralität für zweigliedrige Graphen und Anwendungen". Netzwerke. 59 (2): 261–264. Arxiv:1610.01544. doi:10.1002/net.20442. S2CID 1436859.
  39. ^ Atish Das Sarma; Anisur Rahaman Molla; Gopal Pandurangan; Eli Upfal (2015). "Schnellverteilte PageRank -Berechnung". Theoretische Informatik. 561: 113–121. Arxiv:1208.3071. doi:10.1016/j.tcs.2014.04.003. S2CID 10284718.
  40. ^ Susan Moskwa. "PageRank -Verteilung von WMT entfernt". Archiviert Aus dem Original am 17. Oktober 2009 2009. Abgerufen 16. Oktober, 2009.
  41. ^ Bartleman, Wil (2014-10-12). "Google Page Rang Update kommt nicht". Verwalteter Admin. Archiviert vom Original am 2015-04-02. Abgerufen 2014-10-12.
  42. ^ Schwartz, Barry (8. März 2016). "Google hat bestätigt, dass es die Symbolleiste PageRank entfernen". Suchmaschinenland. Archiviert Aus dem Original am 10. März 2016.
  43. ^ Schwartz, Barry (18. April 2016). "Google Symbolleiste Pagerank wird offiziell dunkel". Suchmaschinenland. Archiviert vom Original am 2016-04-21.
  44. ^ Southern, Matt (2016-04-19). "Google Pagerank schließt offiziell die Türen für die Öffentlichkeit". Suchmaschinenjournal. Archiviert vom Original am 2017-04-13.
  45. ^ Fishkin, Rand; Jeff Pollard (2. April 2007). "Suchmaschinenranking -Faktoren - Version 2". seomoz.org. Archiviert Aus dem Original am 7. Mai 2009. Abgerufen 11. Mai, 2009.
  46. ^ Dover, D. Suchmaschinenoptimierungsgeheimnisse Indianapolis. Wiley. 2011.
  47. ^ Viniker, D. Die Bedeutung des Keyword -Schwierigkeitsuntersuchs auf SEO. Ed. Schwartz, M. Volumen des digitalen Reiseführer 5. Nachrichten Presse. S. 160–164.
  48. ^ "Ranking von Listings: Ranking - Google Places helfen". Archiviert vom Original am 2012-05-26. Abgerufen 2011-05-27.
  49. ^ Clark, Jack. "Google, die seine lukrative Websuche auf AI -Maschinen übergibt". Bloomberg. Archiviert Aus dem Original am 25. März 2016. Abgerufen 26. März 2016.
  50. ^ Google Directory#Google -Verzeichnis
  51. ^ a b "Wie man bezahlte Links meldet". Mattcutts.com/blog. 14. April 2007. Archiviert Aus dem Original am 28. Mai 2007. Abgerufen 2007-05-28.
  52. ^ "Google -Linkschemata" Archiviert 2020-05-21 im Wayback -Maschine Links
  53. ^ "Sich entwickeln". Google -Entwickler. Abgerufen 2022-02-08.
  54. ^ "Also ... du denkst, SEO hat sich verändert". 19. März 2014. Archiviert vom Original am 31. März 2014.
  55. ^ Matthew Richardson & Pedro Domingos, A. (2001). Der intelligente Surfer: Probabilistische Kombination aus Link- und Inhaltsinformationen in PageRank (PDF). S. 1441–1448. Archiviert (PDF) vom Original am 2016-03-04.
  56. ^ Mayer, Katja (2009). Deep Search: Die Politik der Suche jenseits von Google, über die Soziometrie der Suchmaschinen. Studien Verlag.
  57. ^ Pasquinelli, Matteo (2009). Tiefe Suche: Die Politik der Suche jenseits von Google, Diagramm des kognitiven Kapitalismus und die mieteere des gemeinsamen Intellekts. Studien Verlag.
  58. ^ Geil, David F. (Januar 2015). "Pagerank jenseits des Web". Siam Review. 57 (3): 321–363. Arxiv:1407.5107. doi:10.1137/140976649. S2CID 8375649.
  59. ^ Senanayake, Upul; Piraveenan, Mahendra; Zomaya, Albert (2015). "Der Pagerank-Index: Überschreiten Sie die Zitat über die Quantifizierung der wissenschaftlichen Auswirkungen von Forschern hinaus". PLUS EINS. 10 (8): E0134794. Bibcode:2015PLOSO..1034794s. doi:10.1371/journal.pone.0134794. ISSN 1932-6203. PMC 4545754. PMID 26288312.
  60. ^ G. Ivan & V. Grolmusz (2011). "Wenn das Web auf die Zelle trifft: Verwenden Sie personalisierten PageRank zur Analyse von Protein -Interaktionsnetzwerken". Bioinformatik. 27 (3): 405–7. doi:10.1093/bioinformatics/btq680. PMID 21149343.
  61. ^ D. Banky und G. Ivan und V. Grolmusz (2013). "Chancengleichheit für Netzwerkknoten mit niedrigem Grad: Eine Pageein-basierte Methode zur Proteinzielidentifikation in metabolischen Graphen". PLUS EINS. 8 (1): 405–7. Bibcode:2013ploso ... 854204b. doi:10.1371/journal.pone.0054204. PMC 3558500. PMID 23382878.
  62. ^ Burns, Judith (2009-09-04). "Google Trick verfolgt Aussterben". BBC News. Archiviert vom Original am 2011-05-12. Abgerufen 2011-05-27.
  63. ^ Benjamin M. Schmidt & Matthew M. Chingos (2007). "Ranking -Doktorandenprogramme durch Platzierung: Eine neue Methode" (PDF). PS: Politikwissenschaft und Politik. 40 (Juli): 523–529. Citeseerx 10.1.1.582.9402. doi:10.1017/s1049096507070771. S2CID 6012229. Archiviert (PDF) vom Original am 2015-02-13.
  64. ^ Johan Bollen, Marko A. Rodriguez und Herbert van de Sompel.; Rodriguez; Van de Sompel (Dezember 2006). Journalstatus. Scientometrics. Vol. 69. S. 669–687. Arxiv:Cs.gl/0601030. Bibcode:2006cs ........ 1030b. doi:10.1145/1255175.1255273. ISBN 9781595936448. S2CID 3115544.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)
  65. ^ Fletcher, Jack McKay und Wennekers, Thomas (2017). "Von Struktur zur Aktivität: Zentralitätsmessungen zur Vorhersage der neuronalen Aktivität". Internationales Journal of Neural Systems. 28 (2): 1750013. doi:10.1142/s0129065717500137. PMID 28076982.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)
  66. ^ Gupta, Pankaj; Goel, Ashish; Lin, Jimmy; Sharma, Aneesh; Wang, Dong; Zadeh, Reza (2013). "WTF: Die WHO, die den Service bei Twitter folgt". Verfahren der 22. Internationalen Konferenz über World Wide Web. ACM. S. 505–514. doi:10.1145/2488388.2488433. ISBN 9781450320351. S2CID 207205045. Abgerufen 11. Dezember 2018.
  67. ^ Ha, Anthony (2012-05-08). "Y Combinator-unterstützt Swiftype baut Site-Suche, die nicht saugt.". Techcrunch. Archiviert vom Original am 2014-07-06. Abgerufen 2014-07-08.
  68. ^ "Arbeitspapiere zur Erstellung von Google". Google. Archiviert vom Original am 28. November 2006. Abgerufen 29. November, 2006.
  69. ^ Cho, J., Garcia-Molina, H. und Page, L. (1998). "Effizientes Krabbeln durch URL -Bestellung". Verfahren der siebten Konferenz über World Wide Web. Brisbane, Australien. Archiviert vom Original am 2008-06-03.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)
  70. ^ "Yahoo! Gruppen". Groups.yahoo.com. Archiviert vom Original am 2013-10-04. Abgerufen 2013-10-02.
  71. ^ "CiteSeerx - Autopoetische Informationssysteme in modernen Organisationen". Citeseerx 10.1.1.148.9274. {{}}: Journal zitieren erfordert |journal= (Hilfe)
  72. ^ Zack, Laurie; Lamm, Ron; Ball, Sarah (2012-12-31). "Eine Anwendung von Googles PageRank auf NFL -Rankings". Beteiligung ein Journal of Mathematics. 5 (4): 463–471. doi:10.2140/einbezogen.2012.5.463. ISSN 1944-4184.
  73. ^ Peña, Javier López; Touchette, Hugo (2012-06-28). "Eine Netzwerktheorieanalyse von Fußballstrategien". Arxiv:1206.6904 [math.co].
  74. ^ Beggs, Clive B.; Shepherd, Simon J.; Emmonds, Stacey; Jones, Ben (2017-06-02). Zhou, Wei-Xing (Hrsg.). "Eine neuartige Anwendung von PageRank- und Benutzerpräferenzalgorithmen zur Bewertung der relativen Leistung von Track -Athleten im Wettbewerb". PLUS EINS. 12 (6): E0178458. Bibcode:2017ploso..1278458b. doi:10.1371/journal.pone.0178458. ISSN 1932-6203. PMC 5456068. PMID 28575009.
  75. ^ B. Jiang (2006). "Ranking Räume zur Vorhersage der menschlichen Bewegung in einer städtischen Umgebung". Internationales Journal of Geographical Information Science. 23 (7): 823–837. Arxiv:Physik/0612011. Bibcode:2006Physics..12011J. doi:10.1080/13658810802022822. S2CID 26880621.
  76. ^ Jiang b.; Zhao S. & Yin J. (2008). "Selbstorganisierte natürliche Straßen zur Vorhersage des Verkehrsflusss: eine Sensitivitätsstudie". Journal of Statistical Mechanics: Theorie und Experiment. P07008 (7): 008. Arxiv:0804.1630. Bibcode:2008JSMTE..07..008J. doi:10.1088/1742-5468/2008/07/P07008. S2CID 118605727.
  77. ^ Roberto Navigli, Mirella Lapata. "Eine experimentelle Untersuchung der Graphenkonnektivität für unbeaufsichtigte Disambiguation von Wort Sinnessinn" Archiviert 2010-12-14 bei der Wayback -Maschine. IEEE -Transaktionen zur Musteranalyse und Machine Intelligence (TPAMI), 32 (4), IEEE Press, 2010, S. 678–692.
  78. ^ M. T. Pilehvar, D. Jürgens und R. Navigli. Ausrichtung, Disams und Gehen: Ein einheitlicher Ansatz zur Messung der semantischen Ähnlichkeit. Archiviert 2013-10-01 im Wayback -Maschine. Proc. der 51. Jahrestagung des Vereins für Computer-Linguistik (ACL 2013), Sofia, Bulgarien, 4. bis 9. August 2013, S. 1341-1351.
  79. ^ Andrea Esuli & Fabrizio Sebastiani. "Pageranking WordNet-Synsets: Eine Anwendung zu Meinungseigenschaften" (PDF). In Proceedings of the 35. Meeting des Association for Computational Linguistics, Prag, CZ, 2007, S. 424–431. Archiviert (PDF) Aus dem Original am 28. Juni 2007. Abgerufen 30. Juni, 2007.
  80. ^ "Kommentarspam verhindern". Google. Archiviert Aus dem Original am 12. Juni 2005. Abgerufen 1. Januar, 2005.
  81. ^ "PageRank -Skulption: Analyse des Wertes und der potenziellen Vorteile der Bildhauerung PR mit Nofollow". Seomoz. Archiviert vom Original am 05.05.14 Uhr. Abgerufen 2011-05-27.
  82. ^ "PageRank -Bildhauerei". Mattcutts.com. 2009-06-15. Archiviert vom Original am 05.05.1111. Abgerufen 2011-05-27.

Quellen

Relevante Patente

Externe Links

(Google verwendet eine logarithmische Skala.)