Schaberstelle

A Schaberstelle ist ein Webseite Das kopiert Inhalte von anderen Websites mithilfe Web -Scraping. Der Inhalt spiegelt sich dann mit dem Ziel wider, Einnahmen zu erzielen, normalerweise durch Werbung und manchmal durch den Verkauf von Benutzerdaten. Schaberstellen gibt es in verschiedenen Formen. Einige bieten wenig, wenn auch Material oder Informationen an und sollen Benutzerinformationen wie E-Mail-Adressen erhalten, die für SPAM-E-Mails abzielen. Preisaggregation und Einkaufsseiten zugreifen auf mehrere Einträge eines Produkts und ermöglichen es einem Benutzer, die Preise schnell zu vergleichen.

Beispiele für Schaber -Websites

Suchmaschinen wie zum Beispiel Google könnte als Art von Schaberstelle angesehen werden. Suchmaschinen sammeln Inhalte von anderen Websites, speichern sie in ihren eigenen Datenbanken, indizieren sie und präsentieren die abgekratzten Inhalte den eigenen Benutzern ihrer Suchmaschine. Der Großteil der von Suchmaschinen abgekratzten Inhalten ist urheberrechtlich geschützt.[1]

Die Scraping -Technik wurde auch auf verschiedenen Dating -Websites verwendet. Diese Websites kombinieren ihre Kratzeraktivitäten oft mit Gesichtserkennung.[2][3][4][5][6][7][8][9][10][11]

Scraping wird auch auf allgemeinen Bilderkennungswebsites und Websites verwendet, um Bilder von Pflanzen mit Schädlingen und Krankheiten zu identifizieren[12][13]

Für Werbung gemacht

Einige Scraper -Sites werden erstellt, um Geld mit Werbeprogrammen zu verdienen. In diesem Fall werden sie gerufen Gemacht für Adsense Standorte oder MFA. Dieser abfällige Begriff bezieht sich auf Websites, die keinen Einlösungswert haben, außer um Besucher auf die Website zu locken, um auf Werbung zu klicken.[14]

Für Adsense gemacht Standorte werden berücksichtigt Suchmaschinenspam Dadurch wird die Suchergebnisse mit weniger als nachzufriedenen Suchergebnissen verwässert. Der abgekratzte Inhalt ist überflüssig zu dem, was unter normalen Umständen von der Suchmaschine angezeigt wird, wobei in den Auflistungen keine MFA -Website gefunden worden wäre.

Einige Scraper -Websites verlinken zu anderen Websites, um ihre zu verbessern Suchmaschinenranking durch ein Privates Blog -Netzwerk. Vor dem Update von Google zu seinem Suchalgorithmus als bekannt als als Panda, eine Art Schaberstelle, der als als bekannt ist Auto -Blog war bei Black-Hut-Vermarktern, die eine Methode nutzten Spamdexing.

Rechtmäßigkeit

Schaberstellen können verletzt werden Urheberrechtsgesetz. Sogar Inhalte von einem nehmen Inhalt öffnen Site kann a sein Urheberrechtsverletzung, wenn es auf eine Weise durchgeführt wird, die die Lizenz nicht respektiert. Zum Beispiel die GNU kostenlose Dokumentationslizenz (GFDL)[15] und Creative Commons Sharealike (cc-by-sa)[16] Lizenzen für Wikipedia[17] Fordern Sie, dass ein Republiser von Wikipedia seine Leser über die Bedingungen für diese Lizenzen informiert und dem ursprünglichen Autor Anerkennung erteilen.[Originalforschung?]

Techniken

Abhängig vom Ziel eines Schabers unterscheiden sich die Methoden, auf die Websites gezielt sind. Beispielsweise könnten Websites mit großen Mengen an Inhalten wie Fluggesellschaften, Unterhaltungselektronik, Kaufhäusern usw. routinemäßig durch ihre Konkurrenz angezeigt werden, nur um auf dem Laufenden über Preisinformationen zu bleiben.

Eine andere Art von Schaber zieht Snippets und Text von Websites, die hoch für Keywords rangieren, die sie ins Visier genommen haben. Auf diese Weise hoffen sie, hoch in der Rang zu rängen Suchmaschinenergebnisseiten (SERPS), Huckepacking auf der Originalseite der Originalseite Seitenrang. RSS Futtermittel sind anfällig für Scraper.

Andere Scraper -Websites bestehen aus Werbung und Absätzen von Wörtern, die zufällig aus einem Wörterbuch ausgewählt wurden. Oft klickt ein Besucher auf eine Pay-per-Click Anzeige auf einer solchen Website, da es sich um den einzigen verständlichen Text auf der Seite handelt. Die Betreiber dieser Scraper -Websites profitieren finanziell von diesen Klicks. Werbeetzwerke behaupten, ständig daran zu arbeiten, diese Websites aus ihren Programmen zu entfernen, obwohl diese Netzwerke direkt von den Klicks profitieren, die auf dieser Art von Site generiert werden. Aus der Sicht der Werbetreibenden scheinen die Netzwerke nicht genug Anstrengungen zu unternehmen, um dieses Problem zu stoppen.

Scrapers neigen dazu, mit zu assoziiert zu sein Linkfarmen verknüpfen und werden manchmal als dasselbe wahrgenommen, wenn mehrere Schaber mit derselben Zielstelle verlinken. Aufgrund des künstlichen Musters eingehender Links zu einer Opfer-Website, die von mehreren Scraper-Websites verknüpft ist, kann eine häufige Site für das Opfer von Linkbauern vorgeworfen werden.

Domain Hijacking

Einige Programmierer, die Schaber -Websites erstellen Domainname Um seine SEO -Leistung in Google wiederzuverwenden. Ganze Unternehmen konzentrieren sich darauf, alle abgelaufenen Domänen zu verstehen und sie für ihre historische Ranking -Fähigkeiten zu nutzen. Wenn Sie dies tun, können SEOs die bereits etablierten Nutzung verwenden Backlinks zum Domainnamen. Einige Spammer können versuchen, das Thema der abgelaufenen Website zu entsprechen oder den vorhandenen Inhalt aus dem zu kopieren Internetarchiv Um die Authentizität der Website zu erhalten, so dass die Backlinks nicht fallen. Beispielsweise kann eine abgelaufene Website über einen Fotografen erneut registriert werden, um eine Website über Fotografie-Tipps zu erstellen oder den Domain-Namen in ihrem zu verwenden Privates Blog -Netzwerk ihre eigene Fotografie -Site mit Strom versorgen.

Die Dienste bei einigen abgelaufenen Domain -Namensregistrierungsagenten bieten sowohl die Einrichtung, um diese abgelaufenen Domänen zu finden als auch die HTML, die der Domänenname früher auf seiner Website hatte.

Siehe auch

Verweise

  1. ^ Google 'nahm illegal Inhalte von Amazon, Yelp, TripAdvisor, “, findet der Bericht
  2. ^ Mit dieser App können Sie Menschen auf Tinder finden, die wie Prominente aussehen
  3. ^ Dating-App-Chef sieht „kein Problem“ bei der Gesichtsanpassung ohne Zustimmung
  4. ^ Dating.ai App passt zu Ihnen mit Promi-Look-Alikes
  5. ^ Die Gesichtserkennungs -App entspricht Fremden zu Online -Profilen
  6. ^ NAMETAG: Gesichtserkennungs -App als gruselig und invasiv kritisiert
  7. ^ Wischbuster
  8. ^ Stalker-freundliche App, Nametag, verwendet die Gesichtserkennung, um Sie online nachzuschlagen
  9. ^ Mit dieser intelligenten (aber beunruhigenden) App können Sie Ihr Telefon auf die Leute richten, um herauszufinden, wer sie sind
  10. ^ Wirklich.am verwendet die Gesichtserkennung, um Ihnen dabei zu helfen, Ihre Online -Daten zu überprüfen
  11. ^ 3 faszinierende Suchmaschinen, die nach Gesichtern suchen
  12. ^ Wolfram hat eine Website erstellt, auf der jedes Bild identifiziert wird, das Sie darauf werfen
  13. ^ Maschinelles Lernen hilft kleinen Landwirten, Pflanzenschädlinge und Krankheiten zu identifizieren
  14. ^ Für Adsense gemacht
  15. ^ "Text der GNU Free Dokumentation Lizenz".
  16. ^ "Creative Commons Attribution-Sharealike 3.0 Unported Lizenz".
  17. ^ "Wikipedia: Wiederverwendung von Wikipedia -Inhalten".