Proximity -Suche (Text)

Im Textverarbeitung, a Proximity -Suche sucht nach Dokumenten, in denen zwei oder mehr separat übereinstimmende Vorkommen in einem bestimmten Vorkommen liegen Distanz, wo die Entfernung die Anzahl der Zwischenwörter oder Zeichen ist. Zusätzlich zur Nähe können einige Implementierungen der Wortreihenfolge auch eine Einschränkung auferlegen, da die Reihenfolge im durchsuchten Text mit der Reihenfolge der Suchabfrage identisch sein muss. Die Proximity -Suche geht über die einfache Übereinstimmung von Wörtern hinaus durch Hinzufügen der Einschränkung der Nähe und wird allgemein als Form der fortgeschrittenen Suche angesehen.

Zum Beispiel könnte eine Suche verwendet werden, um "rotes Ziegelhaus" zu finden und Sätze wie "Red House of Brick" oder "Haus aus rotem Ziegel" zu entsprechen. Durch die Begrenzung der Nähe können diese Phrasen gleichgeschnitten werden, während Dokumente vermieden werden, in denen die Wörter verstreut oder auf einer Seite oder in nicht verwandten Artikeln in einer Anthologie verteilt sind.

Begründung

Die grundlegende sprachliche Annahme der Nähe ist, dass die Nähe der Wörter in einem Dokument a impliziert a Beziehung zwischen den Wörtern. Angesichts der Tatsache, dass Autoren von Dokumenten versuchen, Sätze zu formulieren, die eine einzelne Idee oder eine Gruppe verwandter Ideen in benachbarten Sätzen enthalten oder in Absätze organisiert sind, gibt es eine inhärente, relativ hohe Wahrscheinlichkeit innerhalb der miteinander verwendeten Dokumentstruktur, die mit den verwendeten Wörtern verwandt sind. Andererseits ist die Wahrscheinlichkeit einer Beziehung zwischen den Wörtern relativ schwach. Durch die Begrenzung von Suchergebnissen auf nur Übereinstimmungen, bei denen sich die Wörter innerhalb der angegebenen maximalen Nähe oder Abstand befinden, werden die Suchergebnisse als höher angenommen Relevanz als die Übereinstimmungen, in denen die Wörter verstreut sind.

Kommerzielle Internet -Suchmaschinen produzieren in der Regel zu viele Übereinstimmungen (bezeichnet als Rückruf) für die durchschnittliche Suchabfrage. Die Proximity -Suche ist eine Methode zur Reduzierung der Anzahl der Seitenübereinstimmungen und zur Verbesserung der Relevanz der übereinstimmenden Seiten durch Verwendung von Word -Nähe zur Unterstützung beim Ranking. Als zusätzlicher Vorteil hilft die Proximity -Suche bei der Bekämpfung Spamdexing Durch Vermeiden von Webseiten, die Wörterbuchlisten oder Schrotflintenlisten enthalten Wortfrequenz.

Boolesche Syntax und Operatoren

Beachten Sie, dass eine Näherungssuche feststellen kann, dass nur einige Schlüsselwörter in einem bestimmten Abstand liegen dürfen. Die Proximity -Suche kann mit anderen Suchsyntax und/oder Steuerelementen verwendet werden, um mehr artikulierte Suchanfragen zu ermöglichen. Manchmal werden Abfragebetreiber wie in der Nähe, nicht in der Nähe, gefolgt von, nicht gefolgt von Satz oder weitem verwendet, um eine Proximity-Suchgrenze zwischen angegebenen Schlüsselwörtern anzuzeigen: zum Beispiel "Ziegel in der Nähe von House".

Nutzung in kommerziellen Suchmaschinen

In Bezug auf die implizite/automatische und explizite Proximity -Suche im November 2008 das meiste Internet Suchmaschinen Implementieren Sie nur eine implizite Proximity -Suchfunktion. Das heißt, sie bewerten diese Suchergebnisse automatisch höher, bei denen die Schlüsselwörter der Benutzer in solchen Ergebnissen eine gute "Gesamtnäherungsbewertung" haben. Wenn sich nur zwei Schlüsselwörter in der Suchabfrage befinden, hat dies keinen Unterschied zu einer expliziten Proximity -Suche, die einen nahezu Operator zwischen den beiden Schlüsselwörtern setzt. Wenn jedoch drei oder mehr als drei Schlüsselwörter vorhanden sind, ist es häufig wichtig, dass der Benutzer angeben, welche Teilmengen dieser Schlüsselwörter eine Nähe in den Suchergebnissen erwarten. Dies ist nützlich, wenn der Benutzer a machen möchte vorherige Kunst Suche (z. B. Finden eines vorhandenen Ansatzes zur Erfüllung einer bestimmten Aufgabe, die ein Dokument finden, das ein System offenbart, das ein prozedurales Verhalten aufweist, das von mehreren Komponenten und Verbindungen zwischen diesen Komponenten durchgeführt wird).

Web -Suchmaschinen die die Proximity -Suche über einen expliziten Proximity -Operator in ihrer Abfragesprache unterstützen Walhello, Exalead, Yandex, Yahoo!, Altavista, und Bing:

  • Bei Verwendung der Walhello Suchmotor kann die Nähe durch die Anzahl der Zeichen zwischen den Schlüsselwörtern definiert werden.[1]
  • Mit der Suchmaschinen -Exalead kann der Benutzer die erforderliche Nähe als maximale Anzahl von Wörtern zwischen Schlüsselwörtern angeben. Die Syntax ist (Keyword1 in der Nähe/n Keyword2) wo n ist die Anzahl der Wörter.[2]
  • Yandex Verwendet die Syntax Keyword1 /n Keyword2 So suchen Sie nach zwei Schlüsselwörtern, die von höchstens von getrennt voneinander getrennt sind Wörter und unterstützt einige andere Variationen dieser Syntax.[3]
  • Yahoo! und Altavista Beide unterstützen einen undokumentierten Nahtellbetreiber.[4][5] Die Syntax ist Keyword1 in der Nähe von Keyword2.
  • Google-Suche Unterstützt (#).[6][7]
  • Bing Unterstützt in der Nähe.[8] Die Syntax ist Keyword1 in der Nähe: n Keyword2 wobei n = die Anzahl der maximalen Trennwörter.

Bestellte Suche innerhalb der Google und Yahoo! Suchmaschinen können mit dem Sternchen (*) volles Wort verwendet werden Wildcards: In Google entspricht dies einem oder mehreren Wörtern,[9] und ein in yahoo! Durchsuchen Sie dies genau mit einem Wort.[10] (Dies kann leicht überprüft werden, indem Sie nach dem folgenden Satz in Google und Yahoo!

Um die ungeordnete Suche nach dem Nahbetrieb zu emulieren, kann dies mit einer Kombination aus geordneten Suchvorgängen durchgeführt werden. Um beispielsweise ein enges Auftreten von "House" und "Dog" festzulegen, könnte die folgende Suchausdruck angegeben werden: "House Dog" oder "Hund House" oder "House * Dog" oder "Dog * House" oder "House Dog" oder "Hundehaus" oder "Haus * Hund" oder "Hund * House" oder "Häuser" oder "Häuser "Haus * * Hund" oder "Hund * * Haus".

Siehe auch

Anmerkungen