CiteSeerX
Art der Site | Bibliographische Datenbank |
---|---|
Eigentümer | Pennsylvania Staatsuniversität College of Information Sciences und Technologie |
URL | Citeseerx |
Anmeldung | Optional |
Gestartet | 2008 | / 1997
Aktueller Status | Aktiv |
Inhaltslizenz | Creative Commons BY-NC-SA-Lizenz[1] |
CiteseerX (früher genannt Citeseer) ist eine Öffentlichkeit Suchmaschine und digitale Bibliothek für wissenschaftliche und akademische Arbeiten, vor allem in den Bereichen von Computer und Informationswissenschaft. CiteSeer wird als Vorgänger von akademischen Suchwerkzeugen betrachtet Google Scholar und Microsoft Academic Search.[2] CiteSeer-ähnliche Motoren und Archive ernten normalerweise nur Dokumente von öffentlich verfügbaren Websites und kriechen keine Publisher-Websites. Aus diesem Grund sind Autoren, deren Dokumente frei verfügbar sind, im Index eher vertreten.
Das Ziel von Citeseers ist es, die Verbreitung und den Zugang der akademischen und wissenschaftlichen Literatur zu verbessern. Als gemeinnütziger Dienst, der von irgendjemandem frei genutzt werden kann, wurde er als Teil der betrachtet uneingeschränkter Zugang Bewegung, die versucht zu ändern akademischer und wissenschaftlicher Verlagswesen um einen größeren Zugang zu wissenschaftlicher Literatur zu ermöglichen. Citeseer frei bereitgestellt Offene Archivinitiative Metadaten von allen indizierten Dokumenten und Verknüpfungen indizierte Dokumente, wenn möglich mit anderen Quellen von Metadaten wie z. DBLP und die ACM -Portal. Befördern Daten öffnen, CiteseerX teilt seine Daten für nichtkommerzielle Zwecke unter a Creative Commons License.[1]
Citeseer änderte seinen Namen an einem Punkt in ResearchIndex und änderte ihn dann zurück.
Geschichte
Citeseer und Citeseer.ist
Citeseer wurde von Forschern geschaffen Lee Giles, Kurt Bollacker und Steve Lawrence 1997, als sie bei der waren NEC Research Institute (jetzt NEC Labs), Princeton, New Jersey, VEREINIGTE STAATEN VON AMERIKA. Das Ziel von Citeseers war es, aktiv akademische und wissenschaftliche Dokumente im Internet zu kriechen und zu ernten und autonom zu verwenden Zitierindexierung Abfragen durch Zitat oder Dokument zuzulassen, um sie durch zu rängen Zitiereinfluss. Irgendwann hieß es ResearchIndex.
Citeseer wurde 1998 öffentlich und hatte zu dieser Zeit viele neue Funktionen in akademischen Suchmaschinen. Diese enthielten:
- Die autonome Zitierindexierung erstellte automatisch einen Zitierindex, der für die Suche und Bewertung der Literatur verwendet werden kann.
- Zitierstatistiken und verwandte Dokumente wurden für alle in der Datenbank genannten Artikel berechnet, nicht nur für die indizierten Artikel.
- Referenzverknüpfung, die das Surfen der Datenbank unter Verwendung von Zitierlinks ermöglicht.
- Der Zitierkontext zeigte den Kontext von Zitaten in einem bestimmten Papier, sodass ein Forscher schnell und einfach erkennen kann, was andere Forscher über einen interessierenden Artikel zu sagen haben.
- Verwandte Dokumente wurden unter Verwendung von Zitier- und wortbasierten Maßnahmen gezeigt, und für jedes Dokument wird eine aktive und kontinuierlich aktualisierte Bibliographie gezeigt.
Citeseer wurde in den USA gewährt Patent #6289342 mit dem Titel "Autonome Zitierindexierung und Literaturstöbern unter Verwendung des Zitierkontexts", Am 11. September 2001. Das Patent wurde am 20. Mai 1998 eingereicht und hat bis zum 5. Januar 1998 Priorität. Ein Fortsetzungspatent (US -Patent Nr. 6738780) wurde am 16. Mai 2001 eingereicht und am 18. Mai gewährt. 2004.
Nach der NEC wurde es 2004 als Citeseer.ist auf der Weltweites Netz Am College of Information Sciences and Technology die Pennsylvania Staatsuniversitätund hatte über 700.000 Dokumente. Für verstärkte Zugang, Leistung und Forschung wurden ähnliche Versionen von Citeseer an Universitäten wie dem unterstützt Massachusetts Institute of Technology, Universität Zürich und die Nationale Universität von Singapur. Diese Versionen von Citeseer erwiesen sich jedoch als schwer zu pflegen und sind nicht mehr verfügbar. Da Citeseer nur frei verfügbare Papiere im Web und keinen Zugriff auf Publisher -Metadaten hat, gibt es weniger Zitierzählungen zurück als Websites, wie z. Google Scholar, das haben Publisher -Metadaten.
Citeseer war seit 2005 aufgrund von Einschränkungen seines Architekturdesigns nicht umfassend aktualisiert worden. Es gab eine repräsentative Stichprobe von Forschungsdokumenten in Computer- und Informationswissenschaft, war jedoch begrenzt, da sie auf öffentlich verfügbare Papiere, normalerweise auf der Homepage eines Autors oder von einem Autor eingereicht wurden. Um einige dieser Einschränkungen zu überwinden, wurde eine modulare und Open -Source -Architektur für Citeseer entworfen - CiteseerX.
CiteseerX
CiteseerX Ersetzte Citeseer und alle Fragen an Citeseer wurden umgeleitet. CiteseerX[3] ist eine Öffentlichkeit Suchmaschine und digitale Bibliothek und Repository Für wissenschaftliche und akademische Arbeiten hauptsächlich mit Schwerpunkt auf Computer und Informationswissenschaft.[3] Vor kurzem CiteseerX hat sich in andere wissenschaftliche Bereiche wie Ökonomie, Physik und andere erweitert. Es wurde 2008 veröffentlicht und basierte lose auf der vorherigen Citeseer -Suchmaschine und der digitalen Bibliothek und wurde mit einem neuen gebaut Open Source Infrastruktur, SERSUITE und neue Algorithmen und deren Implementierungen. Es wurde von den Forschern Dr. Isaac Councill und Dr. C. entwickelt Lee Giles bei Das College of Information Sciences and Technology, Pennsylvania Staatsuniversität. Es unterstützt weiterhin die von Citeseer beschriebenen Ziele, um akademische und wissenschaftliche Dokumente im öffentlichen Web aktiv zu kriechen und zu ernten und eine Zitieranfrage durch Zitate und Rangliste der Dokumente durch die Auswirkungen von Zitaten zu verwenden. Derzeit sind Lee Giles, Prasenjit Mitra, Susan Gauch, Min-yen Kan, Pradeep Teregowda, Juan Pablo Fernández Ramírez, Pucktada Treeratpituk, Jian Wu, Douglas Jordan, Stare Carman, Jack Carroll, Jim Jansen und Shuyi Zhen, oder haben sich aktiv und Shuyi Zheg oder Shuyi Zheg oder Shuyi Zhen or Actival waren, oder waren aktiv oder haben sich aktiv und shuyi zhen or ordern waren oder waren ordnungswesen oder waren aktiv waren oder waren oder waren aktiv waren oder waren oder waren aktiv waren, oder waren oder waren aktiv waren oder waren oder waren reagent waren oder waren ordnungswesen oder waren ordnungswesen oder waren aktiv waren or waren or ordn an seiner Entwicklung beteiligt. Kürzlich wurde eine Tabellensuchfunktion eingeführt.[4] Es wurde von der finanziert Nationale Wissenschaftsstiftung, NASA, und Microsoft Research.
CiteseerX wird weiterhin als eines der weltweit führenden Repositorys eingestuft und wurde im Juli 2010 mit der Nummer 1 bewertet.[5] Derzeit hat es über 6 Millionen Dokumente mit fast 6 Millionen einzigartigen Autoren und 120 Millionen Zitaten.
CiteseerX teilt auch seine Software, Daten, Datenbanken und Metadaten mit anderen Forschern, die derzeit von anderen Forschern Amazon S3 und von rsync.[6] Die neue modulare Open -Source -Architektur und -software (zuvor verfügbar auf SourceForge Aber jetzt an GitHub) ist aufgebaut Apache Solr und andere Apache und Open -Source -Tools, mit denen es ein Testbett für neue Algorithmen in der Dokumenternte, Rangliste, Indizierung und Informationsextraktion ermöglicht.
CiteseerX Zwischenspeichern Sie einige PDF -Dateien, die sie gescannt haben. Als solche enthält jede Seite a DMCA Link, der verwendet werden kann, um Urheberrechtsverletzungen zu melden.[7]
Aktuelle Funktionen
Automatisierte Informationsextraktion
CiteseerX verwendet automatisiert Informationsextraktion Tools, die normalerweise auf Methoden für maschinelles Lernen basieren, um wissenschaftliche Dokumentmetadaten wie Titel, Autoren, Zusammenfassung, Zitate usw. zu entziehen. Daher gibt es einige Zeitfehler in Autoren und Titeln. Andere akademische Suchmaschinen haben ähnliche Fehler.
Konzentriertes Krabbeln
CiteseerX Krabbelt öffentlich verfügbare wissenschaftliche Dokumente hauptsächlich von Autorenwebseiten und anderen offenen Ressourcen und hat keinen Zugriff auf Verlagsmetadaten. Als solche zählt Zitier in CiteseerX sind normalerweise weniger als die in Google Scholar und Microsoft Academic Search, die Zugriff auf Publisher -Metadaten haben.
Verwendungszweck
CiteseerX Hat fast 1 Million Benutzer weltweit basierend auf einzigartigen IP -Adressen und täglich Millionen von Hits. Die jährlichen Downloads von Dokument -PDFs betrugen für 2015 fast 200 Millionen.
Daten
CiteseerX Daten werden regelmäßig unter a geteilt Creative Commons BY-NC-SA-Lizenz mit Forschern weltweit und wurde und wird in vielen Experimenten und Wettbewerben verwendet.
Danke an sein Oai-pmh Endpunkt,[8] Citeseerx ist ein offenes Archiv und sein Inhalt wird wie eine indiziert Institutionales Repository in Akademische Suchmaschinen, zum Beispiel BASE und Unpaywall Verbraucher.
Andere seersuite-basierte Suchmaschinen
Das Citeseer -Modell wurde erweitert, um akademische Dokumente im Geschäft mit SmealSearch und in E-Business mit eBizSearch. Diese wurden jedoch nicht von ihren Sponsoren aufrechterhalten. Eine ältere Version von beiden könnte einst bei Bizseer.ist gefunden werden, ist jedoch nicht mehr in Betrieb.
Andere SEER-ähnliche Such- und Repository-Systeme wurden für die Chemie entwickelt. ChemXSeher und für die Archäologie, Archseer. Ein anderer war für die Suche von robots.txt -Dateien erstellt worden, BotSeer. All dies basiert auf dem Open Source -Tool -SeerSuite, der den Open Source Indexer verwendet Lucene.
Siehe auch
Verweise
- ^ a b "CiteSeerx -Datenrichtlinie". Archiviert von das Original Am 2012-01-05. Abgerufen 2015-11-10.
- ^ Kodakateri Pudhiyavetil, Ajith; Gauch, Susan; Luong, Himp; Eno, Josh (2009). "Konzeptionales Empfehlungssystem für CiteSeerx". Verfahren der dritten ACM -Konferenz über Empfehlungssysteme - Recsys '09. New York, New York, USA: ACM Press: 241. doi:10.1145/1639714.1639758. ISBN 9781605584355. S2CID 13900679.
- ^ a b "Über Citeseerx". Archiviert vom Original am 07.07.2010-22. Abgerufen 2010-05-07.
- ^ "Das Citeseerx -Team". Pennsylvania Staatsuniversität. Archiviert von das Original Am 2018-07-26. Abgerufen 2018-05-01.
- ^ "Ranking Web of World Repositories: Top 800 Repositories". Cybermetrics Lab. Juli 2010. archiviert von das Original Am 2010-07-24. Abgerufen 2010-07-24.
- ^ "Über Citeseerx -Daten". Pennsylvania Staatsuniversität. Archiviert von das Original Am 2012-01-05. Abgerufen 2012-01-25.
- ^ Zum Beispiel, "CiteSeerx - DMCA -Hinweis". Citeseerx 10.1.1.604.4916.
Das Dokument mit der Kennung "10.1.1.604.4916" wurde aufgrund einer DMCA -Takedown -Mitteilung entfernt. Wenn Sie der Meinung sind, dass die Entfernung fehlerhaft war, kontaktieren Sie uns bitte über die Feedback -Seite zusammen mit der auf dieser Seite erwähnten Kennung.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ Hirst, Tony (2011-12-08). "Verwenden von OAI-PMH als Query-Schnittstelle für einzelne Datensatzebene zu CiteSeer". Archiviert vom Original am 2020-11-24. Abgerufen 2020-04-25.
Weitere Lektüre
- Giles, C. Lee; Bollacker, Kurt D.; Lawrence, Steve (1998). "Citeseer: Ein automatisches Zitierindexierungssystem". Verfahren der dritten ACM -Konferenz über digitale Bibliotheken. S. 89–98. Citeseerx 10.1.1.30.6847. doi:10.1145/276675.276685. ISBN 978-0-89791-965-4. S2CID 514080.