Semantisches Web

Das Semantisches Web, manchmal bekannt als als Web 3.0 (nicht zu verwechseln mit Web3), ist eine Erweiterung der Weltweites Netz durch Standards[1] gesetzt von der World Wide Web Konsortium (W3C). Das Ziel des semantischen Netzes ist es zu machen Internet Daten maschinenlesbar.

Um die Kodierung von zu ermöglichen Semantik mit den Daten, Technologien wie Ressourcenbeschreibung Framework (RDF)[2] und Web -Ontologie -Sprache (EULE)[3] werden verwendet. Diese Technologien werden verwendet, um formell darzustellen Metadaten. Zum Beispiel, Ontologie kann beschreiben Konzepte, Beziehungen zwischen Entitätenund Kategorien von Dingen. Diese eingebetteten Semantik bieten erhebliche Vorteile wie Argumentation über Daten und Betrieb mit heterogenen Datenquellen.[4]

Diese Standards fördern gemeinsame Datenformate und Austauschprotokolle im Web, im Grunde genommen im RDF. Laut W3C "bietet das semantische Web einen gemeinsamen Framework, mit dem Daten über Anwendungen, Unternehmen und Community -Grenzen übertragen werden können."[5] Das semantische Web wird daher als Integrator für verschiedene Inhalts- und Informationsanwendungen und -systeme angesehen.

Der Begriff wurde von geprägt von Tim Berners-Lee für ein Datennetz (oder Datennetz)[6] das kann von Maschinen verarbeitet werden[7]- das heißt, in dem viel von dem Bedeutung ist maschinenlesbar. Während seine Kritiker seine Machbarkeit in Frage gestellt haben, argumentieren die Befürworter, dass Anwendungen in Bibliothek und Informationswissenschaft, Industrie, Biologie und Geisteswissenschaften Untersuchungen haben bereits die Gültigkeit des ursprünglichen Konzepts bewiesen.[8]

Berners-Lee drückte ursprünglich seine Vision des semantischen Webs 1999 wie folgt aus:

Ich habe einen Traum für das Web [in dem Computer] in der Lage sein, alle Daten im Web zu analysieren - die Inhalte, Links und Transaktionen zwischen Personen und Computern. Ein "semantisches Web", das dies ermöglicht, hat noch nicht entstanden, aber wenn dies der Fall ist, werden die täglichen Mechanismen des Handels, der Bürokratie und unseres täglichen Lebens von Maschinen behandelt, die mit Maschinen sprechen. Das "intelligente Agenten"Die Leute haben seit Ewigkeiten endlich materialisieren.[9]

Die 2001 Wissenschaftlicher Amerikaner Artikel von Berners-Lee, Hendler, und Lassila beschrieb eine erwartete Entwicklung des vorhandenen Webs in ein semantisches Web.[10] Im Jahr 2006 erklärten Berners-Lee und Kollegen: "Diese einfache Idee ... bleibt weitgehend nicht realisiert".[11] Im Jahr 2013 enthielten mehr als vier Millionen Web -Domänen (von ungefähr 250 Millionen insgesamt) semantisches Web -Markup.[12]

Beispiel

Im folgenden Beispiel wird der Text "Paul Schuster in Dresden" auf einer Website kommentiert und verbindet eine Person mit ihrem Geburtsort. Folgende Html Fragment zeigt, wie ein kleines Diagramm beschrieben wird, in RDFA-Syntax mit a schema.org Wortschatz und a Wikidata ICH WÜRDE:

<div Vokabeln="https://schema.org/" Art der="Person">  <Spanne Eigentum="Name">Paul SchusterSpanne> wurde geboren in <Spanne Eigentum="Geburtsort" Art der="Ort" href="https://www.wikidata.org/entity/q1731">  <Spanne Eigentum="Name">DresdenSpanne>. Spanne> div> 
Diagramm infolge des RDFA -Beispiels

Das Beispiel definiert die folgenden fünf Dreifach (gezeigt in Schildkröte Syntax). Jedes Triple repräsentiert eine Kante im resultierenden Diagramm: das erste Element des Triple (die Thema) ist der Name des Knotens, an dem die Kante beginnt, das zweite Element (das Prädikat) die Art der Kante und das letzte und dritte Element (das Objekt) Entweder der Name des Knotens, an dem die Kante endet, oder ein wörtlicher Wert (z. B. ein Text, eine Zahl usw.).

Die Dreifach führen zu der in gezeigten Grafik in die angegebene Figur.

Diagramm, das aus dem RDFA -Beispiel resultiert und mit weiteren Daten aus dem Web angereichert ist

Einer der Vorteile der Verwendung Einheitliche Ressourcenidentifikatoren (URIS) ist, dass sie mit der Derferene der Http Protokoll. Nach Angaben der sogenannten Verknüpfte offene Daten Prinzipien, ein solches Dereferenced URI sollte zu einem Dokument führen, das weitere Daten über die angegebene URI anbietet. In diesem Beispiel alle URIs, sowohl für Kanten als auch für Knoten (z. http://schema.org/Person, http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) kann derenferenziert werden und führt zu weiteren RDF -Diagrammen, die den URI beschreiben, z. Dass Dresden eine Stadt in Deutschland ist oder dass eine Person im Sinne dieses URI fiktiv sein kann.

Das zweite Diagramm zeigt das vorherige Beispiel, aber jetzt mit einigen der Dreifachdokumente angereichert, die sich aus Dereferenzierung ergeben https://schema.org/Person (grüne Kante) und https://www.wikidata.org/entity/Q1731 (blaue Kanten).

Zusätzlich zu den in den beteiligten Dokumenten ausdrücklich angegebenen Kanten können die Kanten automatisch abgeleitet werden: Das Triple

Aus dem ursprünglichen RDFA -Fragment und dem Triple

aus dem Dokument bei https://schema.org/Person (grüne Kante in der Abbildung) Ermöglichen Sie das folgende Triple, gegeben EULE Semantik (rote gestrichelte Linie in der zweiten Abbildung):

Hintergrund

Das Konzept der Semantisches Netzwerk Das Modell wurde Anfang der 1960er Jahre von Forschern wie dem gebildet Kognitiver Wissenschaftler Allan M. Collins, Linguist M. Ross Quillian und Psychologe Elizabeth F. Loftus als Form zur Darstellung des semantisch strukturierten Wissens. Wenn es im Kontext des modernen Internets angewendet wird, erweitert es das Netzwerk von hyperlinks für Menschen lesbar Webseiten Durch Einfügen von maschinenlesbaren Metadaten über Seiten und wie sie miteinander verbunden sind. Das ermöglicht automatisierte Agenten So greifen Sie intelligenter auf das Web zu und führen Sie im Namen von Benutzern mehr Aufgaben aus. Der Begriff "semantisches Web" wurde von geprägt von Tim Berners-Lee,[7] Der Erfinder des World Wide Web und Direktor des World Wide Web Consortium ("W3c"), das die Entwicklung vorgeschlagener semantischer Webstandards überwacht. Er definiert das semantische Web als" ein Datennetz, das direkt und indirekt von Maschinen verarbeitet werden kann ".

Viele der vom W3C vorgeschlagenen Technologien existierten bereits, bevor sie unter dem W3C -Regenschirm positioniert wurden. Diese werden in verschiedenen Kontexten verwendet, insbesondere in denjenigen, die sich mit Informationen befassen, die eine begrenzte und definierte Domäne umfassen, und bei denen das Teilen von Daten eine häufige Notwendigkeit ist, wie z. B. wissenschaftlicher Forschung oder Datenaustausch zwischen Unternehmen. Darüber hinaus sind andere Technologien mit ähnlichen Zielen entstanden, wie z. Mikroformate.

Einschränkungen von HTML

Viele Dateien auf einem typischen Computer können ebenfalls lose in dokumente und maschinenlesbare Daten unterteilt werden. Dokumente wie Mail -Nachrichten, Berichte und Broschüren werden von Menschen gelesen. Daten wie Kalender, Adressbücher, Wiedergabelisten und Tabellenkalkulationen werden unter Verwendung eines Anwendungsprogramms angezeigt, mit dem sie angezeigt, gesucht und kombiniert werden können.

Derzeit basiert das World Wide Web hauptsächlich auf Dokumenten in geschriebenen Dokumenten Hypertext -Markup -Sprache (HTML), eine Markup -Konvention, die zum Codieren eines Textes von Text verwendet wird, das mit Multimedia -Objekten wie Bildern und interaktiven Formen durchsetzt ist. Metadaten -Tags bieten eine Methode, mit der Computer den Inhalt von Webseiten kategorisieren können. In den folgenden Beispielen werden den Feld "Schlüsselwörter", "Beschreibung" und "Autor" Werte wie "Computing" und "billige Widgets zum Verkauf" und "John Doe" zugewiesen.

<Meta Name="Schlüsselwörter" Inhalt="Computer, Computerstudien, Computer" /> <Meta Name="Bezeichnung" Inhalt="Günstige Widgets zum Verkauf" /> <Meta Name="Autor" Inhalt="John Doe" /> 

Aufgrund dieser Metadaten -Tagging und -kategorisierung können andere Computersysteme, die auf diese Daten zugreifen und diese teilen möchten, die relevanten Werte leicht identifizieren.

Mit HTML und einem Werkzeug, um es zu rendern (vielleicht Webbrowser Software, vielleicht eine andere User-Agent), man kann eine Seite erstellen und präsentieren, auf der Artikel zum Verkauf angeboten werden. Die HTML dieser Katalogseite kann einfache Behauptungen auf Dokumentebene wie "Der Titel dieses Dokuments ist" Widget Superstore erstellen'", aber es gibt keine Fähigkeit innerhalb des HTML selbst, eindeutig zu behaupten, dass beispielsweise die Artikelnummer X586172 ein ACME -Gizmo mit einem Einzelhandelspreis von 199 € ist oder dass es sich Textspanne "x586172" ist etwas, das in der Nähe von "Acme Gizmo" und "199" usw. positioniert werden sollte. Der Titel oder dieser "199 €" ist ein Preis. Es gibt auch keine Möglichkeit, auszudrücken, dass diese Informationen zusammen mit der Beschreibung eines diskreten Elements verbunden sind, das sich von anderen auf der Seite aufgeführten Elementen unterscheidet.

Semantische HTML Bezieht sich auf die traditionelle HTML -Praxis des Markups nach Absicht, anstatt direkt Layout -Details anzugeben. Zum Beispiel die Verwendung von bezeichnen "Betonung" eher als " , was angibt Kursivschrift. Layoutdetails bleiben dem Browser in Kombination mit mit Cascading Style Sheets. Diese Praxis ist jedoch nicht die Semantik von Objekten wie Gegenständen zum Verkauf oder Preisen angegeben.

Mikroformaten erweitern die HTML -Syntax auf Erzeugung maschinenlesbar Semantisches Aufschlag über Objekte wie Personen, Organisationen, Veranstaltungen und Produkte.[13] Ähnliche Initiativen umfassen RDFA, Mikrodaten und Schema.org.

Semantische Weblösungen

Das semantische Netz führt die Lösung weiter. Es umfasst die Veröffentlichung in Sprachen, die speziell für Daten entwickelt wurden: Ressourcenbeschreibung Framework (RDF), Web -Ontologie -Sprache (OWL) und erweiterbare Markup -Sprache (Xml). HTML beschreibt Dokumente und die Verbindungen zwischen ihnen. RDF, Eule und XML können dagegen willkürliche Dinge wie Menschen, Besprechungen oder Flugzeugteile beschreiben.

Diese Technologien werden kombiniert, um Beschreibungen bereitzustellen, die den Inhalt von Webdokumenten ergänzen oder ersetzen. Somit können sich der Inhalt als beschreibende Daten manifestieren, die in Web-zugänglich gespeichert sind Datenbanken,[14] oder als Markup innerhalb von Dokumenten (insbesondere in erweiterbarem HTML (Xhtml) Durchsetzt mit XML oder häufiger in XML, mit Layout- oder Rendering -Hinweisen separat gespeichert). Mit den maschinenlesbaren Beschreibungen können Inhaltsmanager dem Inhalt Sinn hinzufügen, d. H. Die Struktur des Wissens, das wir über diesen Inhalt haben, zu beschreiben. Auf diese Weise kann eine Maschine das Wissen selbst anstelle von Text verarbeiten, wobei Prozesse ähnlich dem Menschen verwendet werden deduktive Argumentation und Inferenzdamit aussagekräftigere Ergebnisse erzielen und Computern bei der Durchführung automatisierter Informationen und Forschungsarbeiten bei der Durchführung von Informationen helfen.

Ein Beispiel für ein Tag, das auf einer nicht-semantischen Webseite verwendet wird:

Blog 

Die Kodierung ähnlicher Informationen auf einer semantischen Webseite könnte so aussehen:

 RDF: Über ="https://example.org/semantic-web/">Semantisches Web 

Tim Berners-Lee nennt das resultierende Netzwerk von Verknüpfte Daten das Riesige globale Grafikim Gegensatz zum HTML-basierten World Wide Web. Berners-Lee stellt fest, dass die Zukunft die Zukunft ist, wenn die Vergangenheit eine Dokumentenaustausch war, die Zukunft ist Datenübertragung. Seine Antwort auf die Frage von "Wie" liefert drei Unterrichtspunkte. Erstens sollte eine URL auf die Daten verweisen. Zweitens sollte jeder, der auf die URL zugreift, Daten zurückholen. Drei Beziehungen in den Daten sollten auf zusätzliche URLs mit Daten verweisen.

Tags und Kennungen

Stichworte, einschließlich hierarchischer Kategorien und Tags, die gemeinsam hinzugefügt und gepflegt werden (z. B. mit Leute) kann als Teil des potenziellen Gebrauchs oder eines Schritts in Richtung der semantischen Web Vision betrachtet werden.[15][16][17]

Einzigartig Kennungen, einschließlich hierarchischer Kategorien und kollaborativ hinzugefügte Analysetools (z. B. Scite.ai -Algorithmen)[18] und Metadaten, einschließlich Tags, können verwendet werden, um Formulare semantischer Netze zu erstellen - Netze, die bis zu einem gewissen Grad semantisch sind. Insbesondere wurde dies zur Strukturierung der wissenschaftlichen Forschung verwendet. durch Forschungsthemen und Wissenschaftliche Felder durch die Projekte Openalex,[19][20][21] Wikidata und Scholia die in der Entwicklung sind und bereitstellen Apis, Webseiten, Feeds und Grafiken für verschiedene Semantische Abfragen.

Web 3.0

Semantisches Web

Tim Berners-Lee hat das semantische Web als Komponente von Web 3.0 beschrieben.[22]

Die Leute fragen immer wieder, was Web 3.0 ist. Ich denke vielleicht, wenn Sie eine Overlay von haben Skalierbare Vektorgrafiken - Alles rippend und faltet und aussieht neblig - auf Web 2.0 und Zugriff auf ein semantisches Web, das über einen riesigen Datenbereich integriert ist, haben Sie Zugriff auf eine unglaubliche Datenressource…

-Tim Berners-Lee, 2006

"Semantisches Web" wird manchmal als Synonym für "Web 3.0" verwendet.[23] Obwohl die Definition jedes Begriffs variiert.

Herausforderungen

Einige der Herausforderungen für das semantische Web sind Weite, Unbestimmtheit, Unsicherheit, Inkonsistenz und Täuschung. Automatisierte Argumentationssysteme muss sich mit all diesen Problemen befassen, um das Versprechen des semantischen Webs zu versprechen.

  • Weite: Das World Wide Web enthält viele Milliarden Seiten. Das Snomed ct Medizinische Terminologie Ontologie allein enthält 370.000 Klasse Namen und vorhandene Technologie konnten noch nicht alle semantisch doppelten Begriffe beseitigen. Irgendein automatisiertes Argumentationssystem Muss sich mit wirklich großen Inputs auseinandersetzen.
  • Unbestimmtheit: Dies sind ungenaue Konzepte wie "jung" oder "groß". Dies ergibt sich aus der Unbestimmtheit von Benutzeranfragen, von Konzepten, die von Inhaltsanbietern dargestellt werden, die Anfragebedingungen an die Begriffe der Anbieter und den Versuch, unterschiedlich zu kombinieren Wissensbasis mit überlappenden, aber subtil unterschiedlichen Konzepten. Fuzzy Logic ist die häufigste Technik für den Umgang mit Unbestimmtheit.
  • Unsicherheit: Dies sind genaue Konzepte mit ungewisse Werten. Beispielsweise kann ein Patient eine Reihe von Symptomen aufweisen, die einer Reihe verschiedener unterschiedlicher Diagnosen mit einer anderen Wahrscheinlichkeit entsprechen. Probabilistisch Es werden im Allgemeinen Argumentationstechniken eingesetzt, um die Unsicherheit anzugehen.
  • Inkonsistenz: Dies sind logische Widersprüche, die unweigerlich während der Entwicklung großer Ontologien und wenn Ontologien aus getrennten Quellen kombiniert werden. Deduktives Denken scheitert katastrophal, wenn sie mit Inkonsistenz konfrontiert sind, weil "Alles folgt aus einem Widerspruch". Überlegungsfähige Argumentation und Paraconsistentes Denken sind zwei Techniken, die eingesetzt werden können, um mit Inkonsistenz umzugehen.
  • Täuschung: Dies ist, wenn der Hersteller der Informationen den Verbraucher der Informationen absichtlich irreführen. Kryptographie Derzeit werden Techniken eingesetzt, um diese Bedrohung zu lindern. Durch die Bereitstellung eines Mittel zur Bestimmung der Integrität der Informationen, einschließlich der, die sich auf die Identität des Unternehmens beziehen, das die Informationen erstellt oder veröffentlicht hat, jedoch Glaubwürdigkeit Probleme müssen noch in Fällen von potenziellen Täuschungen behandelt werden.

Diese Liste der Herausforderungen ist eher veranschaulichend als erschöpfend und konzentriert sich auf die Herausforderungen der "einheitlichen Logik" und "Beweis" der semantischen Web. Das World Wide Web Consortium (W3C) Incubator Group für Unsicherheitsredening für das World Wide Web[24] (URW3-XG) Abschlussbericht fasst diese Probleme unter der einzigen Überschrift "Unsicherheit" zusammen.[25] Viele der hier genannten Techniken erfordern Erweiterungen der Web -Ontology -Sprache (OWL) zum Beispiel, um bedingte Wahrscheinlichkeiten zu kommentieren. Dies ist ein Bereich der aktiven Forschung.[26]

Standards

Die Standardisierung für semantisches Web im Kontext von Web 3.0 steht unter der Obhut von W3C.[27]

Komponenten

Der Begriff "semantisches Web" wird häufig genauer verwendet, um auf die Formate und Technologien zu verweisen, die ihn aktivieren.[5] Die Sammlung, Strukturierung und Wiederherstellung verknüpfter Daten werden durch Technologien aktiviert, die a bereitstellen formelle Beschreibung von Konzepten, Begriffen und Beziehungen innerhalb einer gegebenen Wissensdomäne. Diese Technologien werden als W3C -Standards angegeben und umfassen:

Das Semantic Web Stack zeigt die Architektur des semantischen Webs. Die Funktionen und Beziehungen der Komponenten können wie folgt zusammengefasst werden:[28]

  • XML liefert eine elementare Syntax für die Inhaltsstruktur in Dokumenten, assoziiert jedoch keine Semantik mit der Bedeutung des darin enthaltenen Inhalts. XML ist derzeit in den meisten Fällen keine notwendige Komponente semantischer Webtechnologien, da alternative Syntaxe existieren, wie z. Schildkröte. Turtle ist ein De-facto-Standard, hat jedoch keinen formalen Standardisierungsprozess durchgeführt.
  • XML -Schema ist eine Sprache zur Bereitstellung und Einschränkung der Struktur und des Inhalts von Elementen, die in XML -Dokumenten enthalten sind.
  • RDF ist eine einfache Sprache zum Ausdruck Datenmodelle, die sich auf Objekte beziehen ("Webressourcen") und ihre Beziehungen. Ein RDF-basierter Modell kann in einer Vielzahl von Syntaxen dargestellt werden, z. B.,, RDF/XML, N3, Turtle und RDFA. RDF ist ein grundlegender Standard des semantischen Webs.[29][30]
  • Das RDF-Schema erweitert RDF und ist ein Wortschatz für die Beschreibung von Eigenschaften und Klassen von RDF-basierten Ressourcen mit Semantik für generalisierte hierarchien solcher Eigenschaften und Klassen.
  • Owl fügt mehr Vokabular für die Beschreibung von Eigenschaften und Klassen hinzu: Unter anderem Beziehungen zwischen Klassen (z. B. Disjunktizität), Kardinalität (z. B. "genau eins"), Gleichheit, reichere Typisierung von Eigenschaften, Eigenschaften von Eigenschaften (z. B. Symmetrie) und aufgezählten Klassen.
  • SPARQL ist eine Protokoll- und Abfragesprache für semantische Webdatenquellen.
  • RIF ist das W3C -Regel -Austauschformat. Es ist eine XML -Sprache, um Webregeln auszudrücken, die Computer ausführen können. RIF liefert mehrere Versionen, die als Dialekte bezeichnet werden. Es enthält einen RIF Basic Logic Dialekt (RIF-BLD) und RIF-Produktionsregeln (RIF PRD).

Aktueller Stand der Standardisierung

Gut etablierte Standards:

Noch nicht vollständig verwirklicht:

Anwendungen

Die Absicht ist, die zu verbessern Benutzerfreundlichkeit und Nützlichkeit des Webs und seiner miteinander verbundenen Nützlichkeit Ressourcen durch Erstellen Semantische Webdienste, wie zum Beispiel:

  • Server, die vorhandene Datensysteme mithilfe der RDF- und SPARQL -Standards aufdecken. Viele Konverter zu RDF existieren aus verschiedenen Anwendungen.[31] Relationale Datenbanken sind eine wichtige Quelle. Das Semantischer Webserver An das vorhandene System angeschlossen, ohne den Betrieb zu beeinflussen.
  • Dokumente "markiert" mit semantischen Informationen (a Verlängerung des HTML Stichworte Wird auf den heutigen Webseiten verwendet, um Informationen für bereitzustellen Web -Suchmaschinen Verwendung Webcrawler). Das könnte sein maschinell verständlich Informationen über den menschlich verständlichen Inhalt des Dokuments (z. B. den Ersteller, Titel, Beschreibung usw.) oder es kann sich nur um Metadaten handeln, die eine Reihe von Fakten darstellen (wie Ressourcen und Dienste an anderer Stelle auf der Website). Beachten Sie, dass irgendetwas das kann mit a identifiziert werden Einheitliche Ressourcenkennung (URI) kann beschrieben werden, sodass das semantische Web über Tiere, Menschen, Orte, Ideen usw. argumentieren kann. Es gibt vier semantische Annotationsformate, die in HTML -Dokumenten verwendet werden können. Mikroformat, RDFA, Mikrodata und JSON-LD.[32] Semantisches Markup wird häufig automatisch und nicht manuell erzeugt.
  • Übliche Metadatenvokabularien (Ontologien) und Karten zwischen Vokabularen, die es den Erstellern von Dokumenten ermöglichen, zu wissen, wie sie ihre Dokumente markieren können, damit Agenten die Informationen in den mitgelieferten Metadaten verwenden können (damit das so Autor im Sinne von "Der Autor der Seite" wird nicht verwechselt werden Autor im Sinne eines Buches, das Gegenstand einer Buchbesprechung ist).
  • Automatisierte Agenten, um Aufgaben für Benutzer des semantischen Webs mit diesen Daten auszuführen.
  • Semantische Übersetzung
  • Webbasierte Dienste (häufig mit eigenen Agenten), um Informationen speziell an Agenten zu liefern, a Vertrauensdienst dass ein Agent fragen könnte, ob ein Online -Shop eine Geschichte mit schlechtem Service hat oder Spam.

Solche Dienste könnten für öffentliche Suchmaschinen nützlich sein oder für die Verwendung verwendet werden Wissensmanagement Innerhalb einer Organisation. Geschäftsanwendungen umfassen:

  • Erleichterung der Integration von Informationen aus gemischten Quellen[33]
  • Unklarheiten in der Unternehmensterminologie auflösen
  • Verbesserung Informationsrückgewinnung dadurch reduzieren Informationsüberlastung und Erhöhen der Verfeinerung und Präzision der abgerufenen Daten[34][35][36][37]
  • Identifizierung relevanter Informationen in Bezug auf eine bestimmte Domäne[38]
  • Bereitstellung von Unterstützung bei der Entscheidungsfindung

In einem Unternehmen gibt es eine geschlossene Gruppe von Nutzern und das Management kann Unternehmensrichtlinien wie die Einführung spezifischer Ontologien und die Verwendung von durchsetzen Semantische Annotation. Im Vergleich zum öffentlichen semantischen Web gibt es geringere Anforderungen an Skalierbarkeit und die Informationen, die innerhalb eines Unternehmens verbreitet werden, können im Allgemeinen vertrauensvoller werden. Die Privatsphäre ist außerhalb des Umgangs mit Kundendaten weniger ein Problem.

Skeptische Reaktionen

Praktische Machbarkeit

Kritiker stellen die grundlegende Machbarkeit einer vollständigen oder sogar teilweisen Erfüllung des semantischen Webs in Frage, was auf beide Schwierigkeiten bei der Festlegung und einem Mangel an allgemeiner Nützlichkeit hinweist, der die erforderlichen Anstrengungen investiert. In einem Papier von 2003 weisen Marshall und Shipman auf den kognitiven Overhead hin, der dem formalisierenden Wissen im Vergleich zur Autorin des traditionellen Webs inhärent ist Hypertext:[39]

Während das Erlernen der Grundlagen von HTML relativ einfach ist, muss der Autor eine Sprache oder das Werkzeug der Wissensrepräsentation oder ihres Tools über die Abstraktionsmethoden der Repräsentation und deren Auswirkungen auf die Argumentation informieren. Zum Beispiel ist es mehr als zu verstehen, dass ein Konzept eine „Art von“ ein anderes Konzept ist, wenn sie beispielsweise die Beziehung zwischen Klassenunternehmen oder der Beziehung zur Superklasse-Unterklasse verstehen. […] Diese Abstraktionen werden den Informationslustern im Allgemeinen und Wissensingenieuren im Besonderen beigebracht, entsprechen jedoch nicht der ähnlichen natürlichen Sprache, die eine "Art von" etwas ist. Eine effektive Verwendung einer solchen formellen Darstellung erfordert, dass der Autor zusätzlich zu anderen von der Domäne erforderlichen Fähigkeiten ein qualifizierter Wissensingenieur wird. […] Sobald man eine formale Repräsentationssprache gelernt hat, ist es immer noch viel mehr Anstrengung, Ideen in dieser Darstellung auszudrücken als in einer weniger formalen Darstellung […]. In der Tat ist dies eine Form der Programmierung, die auf der Erklärung semantischer Daten basiert und ein Verständnis dafür erfordert, wie Argumentationsalgorithmen die verfassten Strukturen interpretieren.

Nach Marshall und Shipman die stillschweigend und die Veränderung der Natur vieler Wissens erhöht die Knowledge Engineering Problem und begrenzt die Anwendbarkeit des semantischen Webs auf bestimmte Bereiche. Ein weiteres Thema, auf das sie hinweisen, sind domänen- oder organisationsspezifische Möglichkeiten, Wissen auszudrücken, die eher durch Gemeinschaftsvereinbarungen als nur durch technische Mittel gelöst werden müssen.[39] Wie sich herausstellt, haben spezielle Gemeinschaften und Organisationen für Intra-Kompanien-Projekte tendenziell semantische Webtechnologien übernommen, die größer sind als periphere und weniger spezialisierte Gemeinschaften.[40] Die praktischen Einschränkungen für die Adoption waren weniger herausfordernd, wenn Domain und Umfang begrenzter sind als die der breiten Öffentlichkeit und des weltweiten Webs.[40]

Schließlich sehen Marshall und Shipman pragmatische Probleme in der Idee von (Wissensnavigator-Style) Intelligente Agenten, die im weitgehend manuell kuratierten semantischen Web arbeiten:[39]

In Situationen, in denen die Benutzerbedürfnisse bekannt sind und verteilte Informationsressourcen gut beschrieben sind, kann dieser Ansatz sehr effektiv sein. In Situationen, die nicht vorgesehen sind und eine unerwartete Reihe von Informationsressourcen zusammenbringen, ist der Google -Ansatz robuster. Darüber hinaus beruht das semantische Web auf Inferenzketten, die spröder sind. Ein fehlendes Element der Kette führt dazu, dass die gewünschte Wirkung nicht ausführt, während der Mensch fehlende Teile in einem Google-ähnlichen Ansatz liefern kann. […] Kosten-Nutzen-Kompromisse können für speziell geschaffene semantische Web-Metadaten arbeiten, die darauf abzielen, vernünftige, gut strukturierte domänenspezifische Informationsressourcen zusammenzuweben. Ein Hinweis auf die Bedürfnisse von Benutzern/Kunden wird diese Verbände vorantreiben, wenn sie erfolgreich sein sollen.

Cory Doctorow's Kritik ("Metacrap") stammt aus der Perspektive des menschlichen Verhaltens und der persönlichen Vorlieben. Zum Beispiel können Menschen falsche Metadaten in Webseiten einbeziehen, um semantische Webmaschinen irrezuführen Altavista Ranking -Algorithmus zur Erhöhung der Rangfolge bestimmter Webseiten: Die Google Indexing Engine sucht speziell nach solchen Manipulationsversuchen. Peter Gärdenfors und Timo Honkela Zeigen Sie darauf hin, dass logikbasierte semantische Webtechnologien nur einen Bruchteil der relevanten Phänomene im Zusammenhang mit der Semantik abdecken.[41][42]

Zensur und Privatsphäre

Die Begeisterung über das semantische Web könnte durch Bedenken hinsichtlich der Bedenken hinsichtlich Zensur und Privatsphäre. Zum Beispiel, Textanalyse Techniken können nun leicht umgangen werden, indem andere Wörter, beispielsweise Metaphern oder durch Verwendung von Bildern anstelle von Wörtern verwendet werden. Eine erweiterte Implementierung des semantischen Webs würde es den Regierungen erheblich erleichtern, die Anzeige und Erstellung von Online-Informationen zu steuern, da diese Informationen für eine automatisierte inhaltsblockierende Maschine viel einfacher sind, um sie zu verstehen. Darüber hinaus wurde das Problem auch angesprochen, das mit der Verwendung von Foaf Dateien und Geolokalisierung Meta-DatenEs würde nur sehr wenig Anonymität mit der Urheberschaft von Artikeln zu Dingen wie einem persönlichen Blog in Verbindung gebracht. Einige dieser Bedenken wurden im Projekt "Richtlinienbewusstes Web" behandelt[43] und ist ein aktives Forschungs- und Entwicklungsthema.

Verdoppelung der Ausgangsformate

Eine weitere Kritik am semantischen Web ist, dass es viel zeitaufwändiger wäre, Inhalte zu erstellen und zu veröffentlichen, da es zwei Formate für ein Daten geben müsste: eines für die menschliche Betrachtung und eine für Maschinen. Viele Webanwendungen in der Entwicklung befassen sich jedoch mit diesem Problem, indem sie ein maschinenlesbares Format bei der Veröffentlichung von Daten oder der Anfrage eines Computers für solche Daten erstellen. Die Entwicklung von Mikroformaten war eine Reaktion auf diese Art von Kritik. Ein weiteres Argument zur Verteidigung der Machbarkeit des semantischen Webs ist der wahrscheinliche Preis für Aufgaben menschlicher Intelligenz auf digitalen Arbeitsmärkten, wie z. Amazonas's Mechanischer Turk.

Spezifikationen wie ERDF und RDFA ermöglicht es, dass beliebige RDF -Daten in HTML -Seiten eingebettet werden. Das Grddl (Durch das Aufnehmen von Ressourcenbeschreibungen aus dem Sprachdialekten) Mechanismus ermöglicht es ermöglicht, vorhandene Materialien (einschließlich Mikroformaten) automatisch als RDF zu interpretieren, sodass Verlage nur ein einziges Format wie HTML verwenden müssen.

Forschungsaktivitäten zu Unternehmensanwendungen

Die erste Forschungsgruppe, die sich ausdrücklich auf das semantische Web -Web -Web -Web konzentrierte, war das Acacia -Team bei Inria-Sophia-Antipolis, gegründet im Jahr 2002. Die Ergebnisse ihrer Arbeit sind die RDF (s) Basierend Corse[44] Suchmaschine und die Anwendung der semantischen Web -Technologie im Bereich von verteilte künstliche Intelligenz für Wissensmanagement (z. B. Ontologien und Multi-Agent-Systeme Für Unternehmenssemantik -Web) [45] und E-Learning.[46]

Seit 2008 befindet sich die Corporate Semantic Web Research Group in der Freie Universität Berlin, konzentriert sich auf Bausteine: semantische Unternehmenssuche, semantische Zusammenarbeit von Unternehmen und Corporate Ontology Engineering.[47]

Ontology Engineering Research beinhaltet die Frage, wie Nicht-Experten-Benutzer in das Erstellen von Ontologien und semantisch kommentierten Inhalten einbezogen werden können[48] und um explizite Wissen aus der Interaktion von Benutzern innerhalb von Unternehmen zu extrahieren.

Zukunft der Anwendungen

Tim O'Reilly, der den Begriff Web 2.0 geprägt hat, schlug eine langfristige Vision des semantischen Webs als Datennetz vor, in dem ausgefeilte Anwendungen das Datennetz manipulieren.[49] Das Data Web transformiert das World Wide Web von a verteilt Dateisystem in ein verteiltes Datenbanksystem.[50]

Siehe auch

Verweise

  1. ^ Semantisches Web bei W3C: https://www.w3.org/standards/semanticweb/
  2. ^ "World Wide Web Consortium (W3C)," RDF/XML -Syntaxspezifikation (überarbeitet) ", 25. Februar 2014".
  3. ^ "World Wide Web Consortium (W3C)," Owl Web Ontology Sprachübersicht ", W3C -Empfehlung, 10. Februar 2004".
  4. ^ Chung, Seung-Hwa (2018). "Der Mausansatz: Zuordnung von Ontologien mit UML für Systemingenieure". Computer Reviews Journal: 8–29. ISSN 2581-6640.
  5. ^ a b "W3C Semantische Webaktivität". World Wide Web Konsortium (W3C). 7. November 2011. Abgerufen 26. November, 2011.
  6. ^ "Fragen und Antworten mit Tim Berners-Lee, Sonderbericht". Businessweek.com. Abgerufen 14. April 2018.
  7. ^ a b Berners-Lee, Tim; James Hendler; Ora Lassila (17. Mai 2001). "Das semantische Web". Wissenschaftlicher Amerikaner. Abgerufen 2. Juli, 2019.
  8. ^ Lee Feigenbaum (1. Mai 2007). "Das semantische Web in Aktion". Wissenschaftlicher Amerikaner. Abgerufen 24. Februar, 2010.
  9. ^ Berners-Lee, Tim; Fischetti, Mark (1999). Weben des Netzes. Harpersanfrancisco. Kapitel 12. ISBN 978-0-06-251587-2.
  10. ^ Berners-Lee, Tim (17. Mai 2001). "Das semantische Web" (PDF). Wissenschaftlicher Amerikaner. S2CID 32015696. Archiviert von das Original (PDF) am 10. Oktober 2017. Abgerufen 13. März, 2008.
  11. ^ Nigel Shadbolt; Wendy Hall; Tim Berners-Lee (2006). "Das semantische Web überarbeitet" (PDF). IEEE Intelligente Systeme. Abgerufen 13. April, 2007.
  12. ^ Ramanathan V. Guha (2013). "Licht am Ende des Tunnels". Internationale semantische Webkonferenz 2013 Keynote. Abgerufen 8. März, 2015.
  13. ^ Allsopp, John (März 2007). Mikroformaten: Stärke Ihres Markups für Web 2.0. Freunde von Ed. p.368. ISBN 978-1-59059-814-6.
  14. ^ Artem Chebotko und Shiyong Lu, "Abfragen des semantischen Netzes: Ein effizienter Ansatz mit relationalen Datenbanken", Lap Lambert Academic Publishing, ISBN978-3-8383-0264-5, 2009.
  15. ^ "Auf dem Weg zum semantischen Web: Collaborative Tag Vorschläge" (PDF).
  16. ^ Specia, Lucia; Motta, Enrico (2007). "Leute in das semantische Web integrieren". Das semantische Web: Forschung und Anwendungen. Springer: 624–639. doi:10.1007/978-3-540-72667-8_44.
  17. ^ "Überbrückung der Lücke zwischen den Menschen und dem semantischen Web: Ein Erfahrungsbericht" (PDF).
  18. ^ Nicholson, Josh M.; Mordaunt, Milo; Lopez, Patrice; Uppala, Ashish; Rosati, Domenic; Rodrigues, Neves P.; Grabitz, Peter; Rife, Sean C. (5. November 2021). "Scite: Ein intelligenter Zitierindex, der den Kontext von Zitaten anzeigt und ihre Absicht mit Deep Learning klassifiziert". Quantitative Wissenschaftsstudien. 2 (3): 882–898. doi:10.1162/qss_a_00146.
  19. ^ Singh Chawla, Dalmeet (24. Januar 2022). "Massive offene Index von wissenschaftlichen Papieren startet". Natur. doi:10.1038/d41586-022-00138-y. Abgerufen 14. Februar 2022.
  20. ^ "Openalex: Die vielversprechende Alternative zu Microsoft Academic Graph". Singapore Management University (SMU). Abgerufen 14. Februar 2022.
  21. ^ "Openalex -Dokumentation". Abgerufen 18. Februar 2022.
  22. ^ Shannon, Victoria (23. Mai 2006). "Ein 'revolutionärer' Web". Internationaler Herald Tribune. Abgerufen 26. Juni 2006.
  23. ^ Sharma, Akhilesh. "Einführung des Konzepts von Web 3.0". Optimieren und Trick. Abgerufen 10. Januar 2017.
  24. ^ "W3C Unsicherheitsredening für das World Wide Web". www.w3.org. Abgerufen 2021-05-14.
  25. ^ "Unsicherheitsbegründung für das World Wide Web". W3.org. Abgerufen 20. Dezember 2018.
  26. ^ Lukasiewicz, Thomas; Umberto Straccia (2008). "Verwalten von Unsicherheit und Unbestimmtheit in der Beschreibung Logik für das semantische Web" (PDF). Websemantik: Wissenschaft, Dienste und Agenten im World Wide Web. 6 (4): 291–308. doi:10.1016/j.websem.2008.04.001.
  27. ^ "Semantische Webstandards". W3.org. Abgerufen 14. April 2018.
  28. ^ "Owl Web Ontology Sprachübersicht". World Wide Web Consortium (W3C). 10. Februar 2004. Abgerufen 26. November, 2011.
  29. ^ "Ressourcenbeschreibung Framework (RDF)". World Wide Web Konsortium.
  30. ^ Allemang, Dean; Hendler, James; Gandon, Fabien (3. August 2020). Semantisches Web für den arbeitenden Ontologen: Effektive Modellierung für verknüpfte Daten, RDFs und Eule (Dritter Aufl.). [New York, NY, USA]: ACM -Bücher; 3. Auflage. ISBN 978-1450376143.
  31. ^ "ConverterTordf - W3C Wiki". W3.org. Abgerufen 20. Dezember 2018.
  32. ^ Sikos, Leslie F. (2015). Beherrschen strukturierte Daten im semantischen Web: Von HTML5 -Mikrodaten zu verknüpften offenen Daten. Apress. p. 23. ISBN 978-1-4842-1049-9.
  33. ^ Zhang, Chuanrong; Zhao, Tian; Li, Weidong (2015). Geospatial Semantic Web. Springer International Publishing: Impressum: Springer. ISBN 978-3-319-17801-1.
  34. ^ Omar Alonso und Hugo Zaragoza. 2008. Semantische Anmerkungen im Informationsabruf ausnutzen: Esair '08. Sigir Forum 42, 1 (Juni 2008), 55–58. doi:10.1145/1394251.1394262
  35. ^ Jaap Kamps, Jussi Karlgrenund Ralf Schenkel. 2011. Bericht über den dritten Workshop zur Nutzung semantischer Anmerkungen im Informationsabruf (Esair). Sigir Forum 45, 1 (Mai 2011), 33–41. doi:10.1145/1988852.1988858
  36. ^ Jaap Kamps, Jussi KarlgrenPeter Mika und Vanessa Murdock. 2012. Fünfter Workshop zur Nutzung semantischer Anmerkungen im Informationsabruf: Esair '12). In Proceedings der 21. ACM International Conference on Information and Knowledge Management (CIKM '12). ACM, New York, NY, USA, 2772–2773. doi:10.1145/2396761.2398761
  37. ^ Omar Alonso, Jaap Kamps und Jussi Karlgren. 2015. Bericht über den siebten Workshop zur Nutzung semantischer Anmerkungen im Informationsabruf (Esair '14). Sigir Forum 49, 1 (Juni 2015), 27–34. doi:10.1145/2795403.2795412
  38. ^ Kuriakose, John (September 2009). "Verständnis und Übernahme der semantischen Web -Technologie". Cutter It Journal. Cutter Information Corp. 22 (9): 10–18.
  39. ^ a b c Marshall, Catherine C.; Shipman, Frank M. (2003). Welches semantische Web? (PDF). Proc. ACM Conf. auf Hypertext und Hypermedia. S. 57–66.
  40. ^ a b Ivan Herman (2007). Zustand des semantischen Netzes (PDF). Semantische Tage 2007. Abgerufen 26. Juli, 2007.
  41. ^ Gärdenfors, Peter (2004). Wie man das semantische Web semantischer macht. Formale Ontologie in Informationssystemen: Verfahren der dritten internationalen Konferenz (FOIS-2004). IOS Press. S. 17–34.
  42. ^ Honkela, Timo; Könnönen, Ville; Lindh-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). "Simulation von Prozessen zur Bildung und Kommunikation von Konzept". Journal of Economic Methodology. 15 (3): 245–259. doi:10.1080/13501780802321350. S2CID 16994027.
  43. ^ "Richtlinienbewusstes Webprojekt". Policyawareweb.org. Abgerufen 2013-06-14.
  44. ^ Corby, Olivier; Dieng-Kuntz, Rose; Zucker, Catherine Faron; Gandon, Fabien (2006). "Durchsuchen des semantischen Webs: ungefähre Abfrageverarbeitung basierend auf Ontologien". IEEE Intelligente Systeme. 21: 20–27. doi:10.1109/MIS.2006.16. S2CID 11488848.
  45. ^ Gandon, Fabien (7. November 2002). Verteilte künstliche Intelligenz und Wissensmanagement: Ontologien und Multi-Agent-Systeme für ein semantisches Unternehmensnetz (Phdthesis). Université Nizza Sophia Antipolis.
  46. ^ Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). "Auf dem Weg zu einem semantischen Webansatz für Unternehmen bei der Gestaltung von Lernsystemen: Überprüfung des Projekts Solutioins -Projekt" (PDF). Internationaler Workshop zu Anwendungen semantischer Webtechnologien für E-Learning. Amsterdam, Holland. S. 73–76.
  47. ^ "Corporate Semantic Web - Home". Corporate-Semantic-Web.de. Abgerufen 14. April 2018.
  48. ^ Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). "Semantische Anreicherung durch Nicht-Experten: Verwendbarkeit von manuellen Annotationstools" (PDF). ISWC'12 - Verfahren der 11. Internationalen Konferenz über das semantische Web. Boston, USA. S. 165–181.
  49. ^ Mathieson, S. A. (6. April 2006). "Verbreiten Sie das Wort und schließen Sie es mit". Der Wächter. Abgerufen 14. April 2018.
  50. ^ Spivack, Nova (18. September 2007). "The Semantic Web, Collective Intelligence und Hyperdata". novaspivack.typepad.com/nova_spivacks_weblog [Dieser Blog ist auf novaspivack.com übergegangen.. Abgerufen 14. April 2018.

Weitere Lektüre

Externe Links