Bin im Jakoblog etwas ins Grübeln gekommen. Jakobs Beitrag "
Was ist Semantisches Tagging?" spricht hier vom Konzept des Semantic Tagging in Abgrenzung zum Social Tagging. Zwei Begriffe, die ich genauer unter die Lupe nehmen möchte.
Mein Kommentar zu Jakobs Posting war:
"[...] ich würde meinen, dass Semantic Tagging eher auf die Semantik für Maschinen abzielt. Und zwar in der Weise, dass der ausgezeichnete Text für Maschinen eindeutig zuordenbar bzw. unterscheidbar und damit interoperabel wird. Das kann in einer Weise geschehen, die die Bedeutung für Menschen nicht unbedingt vorhält (ausgedrückt durch eine URI, hinter der kein Konzept beschrieben ist oder eine Katalogisierungskategorie).
Da das alles jedoch sehr kryptisch daher kommen kann, wurden solche Dinge wie Mikroformate entwickelt (erst für Menschen, dann für Maschinen).
Die Soziale Komponente (social tagging) kommt ja erst hinzu, wenn es darum geht einen Mehrwert in einer Community zu schaffen. Dies kann sowohl mit semantischer Anotation (microformats z.B. hcalendar wird publiziert, damit sich jeder den Termin in den Kalender speichern kann) oder nicht (maschinen)semantischer Annotation (Tags bei delicious).
Es bilden sich hier meiner Meinung Überlappungen, die eine Unterscheidung von Semantic und Social Tagging nur je nach Blickwinkel zulassen."
Bei meiner späteren Literaturrecherche war meine Sicht der Dinge jedoch nicht mehr so klar.
Susanne Ekeklint (scheinbar aus der Ecke der Sprachwissenschaft) spricht vom Semantic Tagging im Unterschied zum Syntactic Tagging.
"The difference between syntactic tagging and semantic tagging is that the categories that are used to mark the entities in the latter case are of a semantic kind. Semantics has to do with intensions and meanings. [...] By tradition there is a separation between the form side (syntax) and the content side (semantics) of a phrase and the intention of this is to make a distinction between what is being said to how it is being said."
Ekeklint definiert "entities" als Wörter, Sätze oder Diskurs (worunter auch Dokumente zu verstehen sind). So werden also Wörter, Sätze oder Dokumente Kategorien zugeordnet, die etwas darüber aussagen, worum es geht.
Ein Beispiel für ein sytaktisches Tagging könnte etwa so aussehen:
Tom geht zur Bank.
| | | |
S Pr Pp O
(S = Subjekt, Pr = Prädikat, Pp = Präposition, O = Objekt)
Dagegen ein Beispiel für semantisches Tagging
Tom geht zur Bank.
| | | |
M F A K/S
(M = Mensch, F = Fortbewegung, A = Annäherung K = Kreditinstitut oder S = Sitzgelegenheit)
OK! Dann ist das ja wohl auch Semantic Tagging:
Tom
Man könnte auch sagen, es ist Semantic Markup oder semantische Auszeichnung, da es die Mittel einer Markupsprache nutzt.
Und das hier ist kein semantisches, sondern ein syntaktisches Tagging / Markup:
Tom
Das hier aber schon als semantisches Tagging:
‹p class="Mensch"›Tom ‹/p›
Gut! Halten wir also fest: semantisches Markup ist semantisches Tagging mit Hilfe von Markupsprachen. So sind wohl also auch Mikroformate dem Semantic Tagging zuzuordnen.
Dann kommen allerdings Good, Kawas und Wilkinson (
Bridging the gap between social tagging and semantic annotation). Diese Herren sprechen nur noch von "semantic annotation" (also Anmerkung), wenn sie einem Zitat in MEDLINE Deskriptoren von MeSH zuordnen.
Man beachte, dass es in diesem Aufsatz darum geht, ganze Dokumente zu erschließen, nicht etwa einzelne Wörter oder Sätze.
"Semantic annotation means the association of a data entity with an element from a classification scheme. As opposed to free-text annotation, semantic annotation is amenable to interpretation that does not require natural language understanding and hence is easily amenable to machine processing." [S. 3]
Für die semantische Annotation sind also zwei Dinge wichtig:
- die Nutzung eines Klassifikationsschemas und
- die Möglichkeit einer maschinellen Prozessierbarkeit
Ist aber jetzt semantische Annotation gleich semantisches Tagging? Und warum wird das eine Annotieren und das andere Taggen genannt?
Good, Kawas und Wilkinson unterscheiden das professionelle semantische Annotieren durch "erfahrene" Annotierer und das unprofessionelle und inkostistente "social Tagging" durch Menschen aller Schichten und Bildungsstände. Dazu kommt, das der Begriff "Tagging" aus der Web 2.0 Bewegung gekommen ist, und laut der Meinung der Autoren mit den spezifischen Werkzeugen des Web 2.0 verbunden ist.
"The act of adding a resource to a social tagging collection is referred to as a 'tagging event' or simply as a 'tagging'."
Das Verschmelzen von "social tagging" und "semantic annotation" nennen die Autoren dann "social semantic annotation" und gleich darauf auch "semantic tagging" [S. 11], wenn von jedem Beliebigen aus Gründen des "information managements" und des "social networking" Informationseinheiten mit existierenden semantischen (maschineninterpretierbaren) Strukturen verbunden werden.
"[...] enables a new form of social semantic annotation in which annotations can be created by anyone, as in social tagging, but are constructed using terms from existing semantic structures, as in professional annotation." [S. 11]
Es ist zwar nicht Aufgabe der Autoren hier feine Unterschiede klar zu machen, aber es verwirrt mich vor allem, dass "semantic annotation" und "professional annotation" in keinster Weise vom Indizieren / Sacherschließen ("professional indexing" [S. 17]) getrennt werden.
Es dürfte wohl klar sein, dass der Grund warum ich dies hier schreibe, die scheinbar beliebige Verschmischung und uneinheitliche Nutzung der Begrifflichkeiten mancher Autoren, ist.
In einem weiteren Artikel von Kiyavitskaya, Zeni, Mich und Mylopoulus "
A Lightweight Approach to Semantic Tagging" wird die Sache schon klarer:
"Semantic tagging (or annotation) [...] is the annotation of each content word with a semantic category." Warum eigentlich nur Wörter?
Ich halte also fest:
- Semantic Annotation und Semantic Tagging ist das gleiche.
- Semantic Tagging / Annotation mit Hilfe von Markupsprachen heißt Semantic Markup.
- Semantic Tagging setzung die Nutzug eines Klassifikationsschemas voraus.
- Semantic Tagging setzt eine maschinelle Prozessierbarkeit voraus.
- Semantisch getaggt werden können Diskurs, Satz und Wort.
- Social Tagging hat das Ziel des "Inforationsmanagements" und des "Social Networkings"
- Social Tagging ist nicht unbedingt semantisch.
- Social Tagging kann semantisch sein --> social semantic tagging
Cheers!