Archivgelände

Im Webarchivierung, ein Archivgelände ist ein Webseite Dadurch werden Informationen zu Webseiten aus der Vergangenheit gespeichert, die jeder anzeigen kann.

Gemeinsame Techniken

Zwei gemeinsame Techniken für die Archivierung von Websites verwenden a Web -Crawler oder Bitten von Benutzern:

  1. Verwendung einer Web -Crawler: Mithilfe eines Webcrawlers (z. B. die, die Internetarchiv) Der Dienst hängt nicht von einer aktiven Community für seinen Inhalt ab und kann dadurch eine größere Datenbank schneller erstellen. Webcrawlers sind jedoch nur in der Lage, Informationen zu indizieren und zu archivieren, die die Öffentlichkeit für das Internet ausgewählt hat, oder dies kann gekrabbt werden, da Website -Entwickler und Systemadministratoren die Möglichkeit haben, Webcrawlers vom Zugriff auf [bestimmte] Webseiten zuzugreifen (Verwendung einer Robots.txt).
  2. Benutzereinreichungen: Obwohl es schwierig sein kann, die Benutzereinreichungsdienste aufgrund potenziell niedriger Raten der Einreichungen von Benutzern zu starten, kann dieses System einige der besten Ergebnisse erzielen. Wenn Sie Webseiten kriechen, kann man nur die Informationen erhalten, die die Öffentlichkeit für Online -Veröffentlichungen ausgewählt hat. Potenzielle Inhaltsanbieter haben sich jedoch möglicherweise nicht die Mühe, bestimmte Informationen zu veröffentlichen, vorausgesetzt, niemand würde sich dafür interessieren, da ihnen ein geeigneter Ort fehlt, an dem sie sie veröffentlichen können, oder aufgrund von Urheberrechtsbedenken.[1] Benutzer, die jemanden sehen, der sich wünscht, können ihre Informationen jedoch eher dazu beitragen, sie einzureichen.

Beispiele

Google -Gruppen

Am 12. Februar 2001, Google erworben die Usenet Diskussionsgruppenarchive von Deja.com und verwandelte es in ihre Google -Gruppen Service.[2] Sie ermöglichen es Benutzern, nach alten Diskussionen mit der Suchtechnologie von Google zu suchen und gleichzeitig die Benutzer in die zu veröffentlichen Mailinglisten.

Internetarchiv

Das Internetarchiv baut ein Kompendium von Websites auf und digitale Medien. Ab 1996 hat das Archiv einen Web -Crawler verwendet, um ihre Datenbank aufzubauen. Es ist eine der bekanntesten Archivstandorte.

NBCUniversal -Archive

NBCUniversal -Archive Bieten Sie Zugriff auf exklusive Inhalte von Nbcuniversal und seine Tochtergesellschaften. Die Website von NBCUniversal Archives bietet eine einfache Anzeige vergangener und neuerer Nachrichtenclips, und es ist ein hervorragendes Beispiel für ein Nachrichtenarchiv.[3]

Nächster Punkt

NextPoint bietet eine automatisierte Wolke-basierend, Saas Für Marketing, Einhaltung und Rechtsstreitigkeiten, einschließlich elektronischer Entdeckung.

Pandora Archiv

Pandora (Pandora Archiv), 1996 von der Nationalbibliothek von gegründet Australien, steht für die Erhaltung und Zugriff auf vernetzte Dokumentarfilmressourcen Australiens, was ihre Mission zusammenfasst. Sie bieten einen langfristigen Katalog ausgewählter Online-Veröffentlichungen und Websites, die von Australier verfasst wurden oder die von einem australischen Thema sind. Sie beschäftigen ihre Pandas (Pandora Digital Archiving System) beim Aufbau ihres Katalogs.

textfiles.com

textfiles.com ist eine große Bibliothek alter Textdateien, die von verwaltet werden von Jason Scott Sadofsky. Seine Mission ist es, die alten Dokumente zu archivieren, die um die herumgegangen waren Bulletin -Board -Systeme (BBS) seiner Jugend und um die Erfahrungen anderer Menschen in den Bulletin Board -Systemen zu dokumentieren.

Siehe auch

Verweise

  1. ^ Jinfang Niu, Universität von Südflorida (März - April 2012). "Ein Überblick über die Webarchivierung". D-Lib Magazine. Vol. 18, nein. 3/4. doi:10.1045/März2012-NIU1.
  2. ^ "Google erwirbt den Usenet -Diskussionsdienst und bedeutende Vermögenswerte von Deja.com".12. Februar 2001.
  3. ^ NBCUniversal -Archive