Semantic Web: Implementierung von rNews-Metadaten nach schema.org
Seit vielen Jahren gibt es kein Vorbeikommen am Konzept des semantischen Web, wenn die Zukunft des World Wide Web verhandelt wird. Der große Durchbruch im Sinne einer weitreichenden Umsetzung lässt jedoch nach wie vor auf sich warten. Anhand eines Beispiels aus der Praxis von APA-OTS möchte ich einen möglichen Einsatz semantischer Metainformationen für Websites vorstellen:
Gemeinsam mit den Presseaussendungstexten, die über APA-OTS zur Verbreitung gelangen, werden verschiedene Meta-Informationen erfasst, die sich an internationalen Nachrichtenagenturstandards orientieren. Dazu gehören beispielsweise ein Versanddatum, eine Headline, eine Dateline, Keywords und ein für den Inhalt verantwortlicher Aussender.
Diese Informationen werden auf dem Portal www.ots.at mit jeder Presseaussendung angezeigt, die Web-Sprache HTML bietet jedoch per se nur sehr beschränkte Möglichkeiten, Textabschnitte entsprechend inhaltlicher Kategorien zu kennzeichnen. So kann beispielsweise eine Suchmaschine nur aus dem Zusammenhang und mittels Suchmuster erraten, welcher Teil des Quelltextes das Versanddatum einer Pressemitteilung oder deren Urheber enthält.
Das Konzept des semantischen Webs sieht vor, Webseiteninhalte um (in der Website-Darstellung nicht sichtbare) Zusatzinformationen in maschinenlesbarer Form anzureichern (hier in spitzen Klammern), wie dieses vereinfachte Beispiel veranschaulicht:
Presseaussendung von <Aussender> XY</Aussender>. <Ort> Wien</Ort> am <Datum> 1.1.2012</Datum>
Aus technischer Sicht existieren verschiedene Standards zur Implementierung semantischer Metadaten in Websites (RDFa, Microformats, Microdata), wobei unsere Wahl auf das einfach zu implementierende Format HTML 5 Microdata fiel. Das passende Vokabular liefert schema.org, eine gemeinsame Initiative der drei großen Suchmaschinenbetreiber google, bing (microsoft) und yahoo. Das in schema.org enthaltene Schema „NewsArticle“, das auf www.ots.at zum Einsatz kommt, geht wiederum auf rNews zurück, einen von der IPTC geschaffenen Standard zur strukturierten Erfassung von Nachrichten.
Abbildung: Screenshot einer Pressemitteilung auf www.ots.at. Die jeweils mit Metadaten versehenen Seitenbestandteile sind durch das entsprechende Property aus dem Schema „NewsArticle“ gekennzeichnet.
Warum rNews für www.ots.at?
Was ist nun der Nutzen der Implementierung von Metadaten? Im konkreten Fall von www.ots.at zielt der Schritt auf Suchmaschinenoptimierung. Während sich vorerst kein Einfluss auf den Rank in den Ergebnisseiten feststellen lässt, besteht die Hoffnung, dass sich beispielsweise die Voransicht einer Aussendung auf der Suchmaschinenergebnissseite durch die zusätzliche Information, die der Suchmaschine zugänglich gemacht wird, verbessert. Noch halten sich die Suchmaschinenbetreiber über Auswirkungen des Einsatzes von schema.org bedeckt, mit Hilfe des Rich Snippets Testing Tool lässt sich aber bereits überprüfen, welche semantischen Metadaten einer Website von google „verstanden“ werden.
Durch die Einigung der drei großen Suchmaschinen auf einen gemeinsamen Standard ist jedenfalls davon auszugehen, dass die Verbreitung des Einsatzes semantischer Metadaten in nächster Zeit stark zunehmen und einen fixen Platz in SEO-Strategien finden wird.
Kommentieren