Wie das Semantic Web das Persönliche Wissensmanagement revolutioniert

    29. Oktober 2004 von Dr. phil. Dipl.-Psych. Lars Ludwig

    Eine neue technische Entwicklung ist im Gange: das Semantic Web. Eine kurze Einführung in das Semantic Web wird gegeben, um die Tragweite und Richtung diese technischen Entwicklung verstehen und abschätzen zu können. Diese Entwicklung ist bereits im Begriff das Wissensmanagement zu revolutionieren. Und zwar auf dem Wege verteilter Wissenssysteme. Diese Wissenssysteme werden auf persönlichem Management von Wissen auf Basis von Subdokumenteneinheiten beruhen. Firmen, die diesen Trend früh aufnehmen, werden von dem Wissensvorsprung ihrer Mitarbeiter profitieren. Ein offeneres Verhältnis der Unternehmen zum Wisssen ihrer Mitarbeiter ist Voraussetzung, denn das zentralistische Wissensmanagement gilt vielen als gescheitert. Schließlich werden Anwendungsfelder und Low Hanging Fruits für den Praktiker aufgezeigt.

    Einführung in das Semantic Web

    Semantisches Web: Das Semantic Web [3] wird auch als die nächste Generation des Internets bezeichnet. Das Internet ist dokumentenbasiert. Es besteht aus einer Ansammlung statischer Dokumente und in Dokumente gepresster dynamischer Datenbanksichten. Die mangelnde Maschinenlesbarkeit des Internets macht es trotz der Reichhaltigkeit der im Internet verfügbaren Informationen schwierig, die gewünschte Information treffsicher aufzufinden. Maschinenlesbarkeit herstellen bedeutet nun, dass Texte mit Metadaten versehen werden, welche über sogenannte Ontologien zum Beispiel Suchprogrammen verständlich werden. Ontologien enthalten Konzepte, die in einer Konzepthierarchie angeordnet sind. "Automobil" zum Beispiel ist ein solches Konzept. Das Konzept charakterisiert andere Einheiten der Ontologie, zum Beispiel "Kleinwagen" und wird selbst von Konzepten subsumiert, etwa von dem Konzept "Fortbewegungsmittel".

    Semantische Suche: Der Vorteil der Nutzung einer Ontologie bei der Suche nach Informationen wird deutlich, wenn man sich einen einfachen Anwendungsfall ausmalt: gibt man in einer Suchmaschine "Automobil" ein, so wird man Dokumente nicht finden, welche nur "Kleinwagen" erwähnen. Semantische Suche [4] bezieht jedoch das in der Ontologie hinterlege Wissen ein und erweitert die Suche zweckmäßig um neue Begriffe. Manchmal ist aus dem Text heraus jedoch nicht ohne weiteres die Zugehörigkeit einer Wortfolge zu einem Konzept zu erkennen. Auch das sogenannte Natural Language Processsing stößt hier an seine Grenzen. Deshalb müssen die Passagen in Dokumenten mit den nötigen Angaben annotiert werden.

    Semantische Annotation: Solche Metadaten kennzeichnen das Vorkommen von Ontologie-Entitäten in Dokumenten. Die Forschung hat anfänglich das manuelle Annotieren erforscht. Besondere Annotationssprachen, zum Beispiel HTML-A [5], das auf HTML basiert, wurden erfunden. Doch zeigte sich bald, dass die semantische Annotation von Texten eine zeitaufwendige Angelegenheit ist. So erforderte das Annotieren von 5 Seiten in einem Fall im Mittel eine ganze Stunde [6]. Die Forschung und mit ihr eng verbundene Softwareunternehmen [7] konzentrierten sich deshalb auf das halbautomatische und vollautomatische Annotieren von Dokumenten. Zum Beispiel schuf die Firma Ontotext die KIM (Knowledge and Information Management)Platform [8] , welche HTML-Dokumente etwa automatisch annotieren kann und mit Hyperlinks auf die zugehörige Entität in der Ontologie verlinkt. So könnte man etwa aus einer Bezeichnung lernen, dass es sich dabei um einen Berg oder einen Fluss handelt. Es ist so, als ob Textauszüge mit Verweisen auf eine Enzyklopädie hinterlegt würden. Annotationen sind hier als Referenzen auf Einträge in der Ontologie zu versetehen. Dabei lassen sich diese Referenzen auch gebrauchen, um das Dokument als solches zu charakterisieren und Regeln gemäß zu kategorisieren. Zum Beispiel können Nachrichten so nach ihrem Inhalt sortiert werden.

    Grenzen der Semantischen Annotation: Speichertechnisch gesehen besteht das Internet aus Relationalen Datenbanken, welche aufeinander verweisen. Weit über 90 %, also der überwiegende Teil, des Internets bestehen aus dynamischen Datenbankinhalten. Datenbanken lassen sich allerdings nur schlecht semantisch annotieren [9]. Datensichten (SQL-Views) erlauben es nicht, dauerhafte Meta-Informationen in Form von Annotationen anzubringen. Das Entwicklungspotential des Semantischen Netzes wäre sogesehen auf den kleineren Teil des heutigen Internets beschränkt.

    Ontology Markup Languages: Allerdings baut das Semantic Web auf einer Reihe von Ontologiesprachen auf, insbesondere RDF (Resource Description Framwork) [10] und OWL (Web Ontology Language)[11]. Diese Ontologiesprachen sind wie Datenmodelle zu verstehen, also zum Beispiel durchaus einem Relationalen Datenbankmodell oder einem XML-Schema vergleichbar. Teils werden sogar sprachspezifische Datenbanken entwickelt, welche sich jedoch gegenüber den marktdominierenden Relationalen Datenbankmanagementsystemen erst noch beweisen müssen.

    Ontology Management: Ontologien lassen sich zwar prinzipiell per Hand wie Dokumente entwerfen, jedoch gibt es spezialisierte Anwendungen, die die Erstellung von Ontologien erleichtern [12]. Bislang dienten die Editoren von Ontologien vorwiegend zum Anlegen des Schemas der Ontologie, welches mit einem Datenmodell einer Datenbank vergleichbar ist, während die Befüllung, also das Erstellen von Ontologieeinträgen in Form von Instanzen ("Peter" ist eine Instanz des Konzeptes "Person" / ein Eintrag im Feld Person) nur eine untergeordnete Rolle zukam. Zur Annotation war nämlich das Schema in der Regel ausreichend.

    Nutzung von Ontologien im Wissensmanagement

    Semantische Dateien: Anstatt Dokumente zu annotieren, kann man auch direkt Informationen mit Hilfe eines Ontologie-Schemas in eine semantische Datei schreiben, vergleichbar der direkten Erstellung einer XML-Datei. Zum Beispiel sind FOAF (Friend of a Friend)-Files [13] solche Dateien im RDF-Format. Sie enthalten persönliche Informationen einer Person, insbesondere darüber, wen diese Person kennt. FOAF-files können zwischen einzelnen Personen ausgetauscht werden oder an Institutionen, also etwa Social Networking Portalen, weitergeleitet werden. Es gibt Anwendungen wie foaf-a-matic [14], mit denen sich FOAF-Files leicht erstellen lassen. Anstatt ein Dokument zu annotieren fällt hier der Prozess der Niederschrift der Informationen und ihre Strukturierung in eins.

    Aufgabenspezifische semantische Datenbanken: Weblogs, die auf RDF aufbauen, stellen gewissermaßen einfache, auf ein bestimmtes Anwendungsfeld, hier Personal Publishing, beschränkte semantische Datenbanken dar. Sie gehören ihrer Technologie nach bereits dem Semantischen Web zu, gehen praktisch jedoch kaum über eine gewöhnliche Relationale Datenbank hinaus, insofern sie keine besondere Flexibilität im Datenschema bieten, was Ontologiesprachen gegenüber jenen eigentlich praktisch auszeichnet. Wegweisend sind Versuche, die beschränkte Semantik von Einträgen in Weblogs durch semantische Relationen zu Konzepthierarchie und Instanzen einer Ontologie aufzuwerten [15].

    Dokumentenmanagement mit semantischen Datenbanken: Ganz ähnlich wird in vielen Projekten und ersten semantischen Wissensmanagement-Produkten versucht, Dokumente - anstatt Texteinträge in Weblogs oder Wikis - durch semantische Relationen zu Entitäten einer Ontologie zu beschreiben und damit die semantische Suche von Dokumenten zu ermöglichen. Dokumente werden hierbei selbst zur Entität der Ontologie, nämlich zumeist eine Instanz eines Dokumentenkonzeptes. Dem Charakter eines Ontologieschemas als dem eines Datenmodells gemäß, verfolgten zahlreiche semantische Wissensmanagementsysteme in den letzten Jahren diesen Ansatz [16]. Die Ontologie erfüllt hier wesentlich die Funktion eines - allerdings sehr mächtigen - Stichwortsystems. Interessensprofile der Nutzer, ausgedrückt wiederum in der betreffenden Ontologie selbst, erlauben somit das automatische Zuordnen von Dokumenten zu Personen aufgrund von semantischen Ähnlichkeitsmassen oder schlicht aufgrund von Überlappungen zwischen Dokumentenbeschreibung und Nutzerprofil. Zugegebenermaßen keine ganz neue Funktion im Dokumenten-basierten Wissensmanagement, jedoch weit mächtiger als bloße Stichwortsysteme.

    Verteiltes Wissensmanagement (Distributed Knowledge Management)

    Virtuellen Organisationen: Die bisher geschilderten semantischen Technologien und Lösungsansätze gingen alle von der zentralen Erstellung eines Ontologieschemas aus. Das Ontologieschema, wie jedes andere Datenmodell auch, beschreibt und beschränkt wesentlich die Ausdrucksfähigkeit des Nutzers im Abspeichern von Informationen. Es setzt sich in der Forschung seit kurzem die aus der Praxis gewonnene Einsicht durch, dass zentrale Schemata den Ansprüchen der heutigentags oft dezentralen oder virtuellen Organisationen nicht gerecht werden. Unterschiedliche Perspektiven und Arbeitsschwerpunkte erfordern besonders zugeschnittene Schemata. Vor diesem Hintergrund sucht man nach neuen Wegen, um eine verteilte Evolution von Ontologie-Schemata zu ermöglichen, ohne dass es an einer einheitlichen Grundlage fehlte [17].

    Persönliches Wissensmanagement: Eine nüchterne Betrachtung des Erfolges von betrieblichen Wissensmanagementsystemen zeigt, dass jegliches zentrale Wissensmanagementsystem von mangelnder Akzeptanz bedroht ist. Dies liegt wesentlich am Charakter des Wissens selbst: Wissen ist (anfänglich und zuletzt) immer persönliches Wissen. Persönliches Wissen ist jedoch mit persönlicher Anschauung und individuellem Kontext verknüpft. Das Bestreben, Wissen zu enteignen und zu vereinheitlichen ist schlichtweg kontraproduktiv. Es ruft Widerstände hervor, wenn der Einzelne sein Wissen in eine Ordnung pressen soll, die seiner Sicht der Dinge nicht gerecht wird. Unternehmen sollten deshalb persönliches Wissensmanagement ermöglichen, das dem Individuum die erforderliche Ausdrucksfähigkeit gestattet.

    Subdokumentenbasiertes Wissensmanagement: Jedem Datenbank-Architekten ist das Bemühen bekannt, mehrfache gleichsinnige Dateneinträge in einer Datenbank zu vermeiden, um die globale Aktualisierung von Inhalten zu ermöglichen. Anstatt gleiche Inhalte mehrfach zu produzieren, werden unterschiedliche Sichten/Views auf die Daten gestattet. Im praktischen Umgang mit Dokumenten, wo es auf Produktion eindrucksvoller Datenmengen ankommt, herrscht dagegen reges Kopieren und Reproduzieren von Dokumenten und Dokumententeilen. Wer kennt nicht die endlose Wiederverwendung von Präsentationsseiten und Textbausteinen! Jedoch, kommt es auf die Aktualisierung von Dokumenten an, stellt sich dieses Vorgehen als äußerst nachteilig heraus. Auch bei der Suche nach Informationen ist die häufige Reproduktion inhaltsgleicher Passagen in Dokumentensammlungen ein Nachteil. Zwar werden Suchmaschinen immer besser und weisen richtig eine Vielzahl von Dokumenten als relevant aus, jedoch weisen die Dokumente oft so große Schnittmengen auf, dass das Lesen einer ganzen Anzahl von Dokumenten in einer Vielzahl von Wiederholungen mündet, ohne dass noch die gesuchte Information schon erschöpfend oder genügend erfasst worden wäre. Inhaltswiederholungen in Dokumenten maskieren also relevante Information und entlarven Fortschritte in Suchalgorithmen als unzureichend zur Problemlösung. Eine radikale Lösung dieses Problems wird im so genannten Persönlichen Semantischen Subdokumenten Wissensmanagement angestrebt [18]. Anstatt ein Dokument im Nachhinein mit Metadaten anzureichern, wird Information in kleinen Informationsstücken, information chunks, gespeichert, die miteinander bedeutungsvoll assoziiert werden können. Die Kombination aus solchen Informationsstücken und ihre Sequenzierung ermöglicht dann die Erstellung unterschiedlicher Dokumentensichten. Diese frei assoziierbare Abspeicherung von Informationen entspricht weit mehr dem menschlichen Denken und Erinnern als Dokumente mit ihrer starren und aktivitätsgebundenen Informationsreihung.

    Persönliche Wissensrepräsentation und verteilte Wissenssysteme: Durch Persönliches Semantisches Subdokumentenbasiertes Wissensmanagement kann eine Repräsentation des Wissens einer Person erzielt werden. Diese Repräsentation ist sowohl maschinenlesbar, also semantischen Suchalgorithmen offen stehend, als auch menschenlesbar. Dies offeriert ungeahnte Möglichkeiten der Kommunikation und des Wissensaustauschs. So können z.B. Dokumentensichten, ausgetauscht zum Beispiel per E-Mail, gleichzeitig die darunter liegende Netzstruktur des Wissens enthalten und so bedeutungsvolle und inhaltsreiche Anknüpfungspunkte zur Integration in das persönliche Wissensnetz des Empfängers bieten. Benachrichtigungsfunktionen über neue "Dokumente" sind nicht länger an Stichwörter gebunden, sondern an Konzepte und relationierte Instanzen bedeutungsvoll geknüpft. Ein große Anzahl nützlicher Funktionen sind so denkbar: man stelle sich vor, in einem Dokument werden alle Informationsstücke, die man in anderem Zusammenhang schon gelesen hat, automatisch ausgeblendet, oder es werden solche Informationssequenzen gezielt vorgeschlagen, die beim Brückenschlag zu einem bestimmten Wissensbereich einem Leser zur Kenntnis noch fehlen. Die Möglichkeiten zur Effizienzsteigerung und höheren Effektivität in Wissenserwerb und Wissensstreuung sind vielfältig. Die ökonomischen Vorteile, welche sich Unternehmen und größere Wissensgesellschaften durch individuelle semantische Wissensrepräsentation erschließen können, lassen dieser Spielart des Wissensmanagement eine viel versprechende Zukunft verheißen. Allerdings geht es um einen radikalen Wandel mit Veränderung von Denk- und Schreibgewohnheiten, welcher anfänglich den gezielten Einsatz beschränkt auf Ebene professioneller Wissensarbeiter wie Unternehmensberater, Strategen, Marktforscher, etc. ratsam erscheinen lässt.

    Artificial Memory Prototyp: Bislang existiert bereits ein erster innovativer Prototyp für das semantische subdokumenten-basierte Wissensmanagement (siehe www.artificialmemory.net) und befindet sich in praktischer Erprobung durch Forscher. Der Autor entwickelt diesen Prototyp am Digital Enterprise Research Institute (DERI) in Galway, Irland, einem führenden Semantic Web Forschungsinstitut. Der Autor ist Mitglied des dortigen Knowledge Management Cluster, das sich auf Innovationsmanagement spezialisiert hat. Unternehmer, für deren Unternehmungen Wissensmanagement von zentraler Bedeutung ist und die von einer frühen Adaptation innovativer Technologie profitieren wollen, können sich beim Autor zwecks Teilnahme an Modellversuchen melden. Artificial Memory integriert Ontology Browser, Ontology Editor und Ontology Querying zu einem einheitlichen System, das die Eingabe und Verwaltung von Informationsstücken als Teil einer Ontologie in Echtzeit erlaubt. Hierbei kommt ein besonderes visuelles User-Interface zum Einsatz, das durch innovative Funktionalität den Umgang mit vernetzten Informationen stark vereinfacht und beschleunigt.

    Verteilte Wissenssysteme: Der Artificial Memory Prototyp wird zu einem verteilten Wissenssystem ausgebaut. Angesichts der Virtualisierung von Unternehmen und beschleunigter Prozessanpassungen, haben klassische Organisationsstrukturen immer geringeren Bestand. Dezentrale Wissenssichten anstatt zentraler Wissenssammlungen rücken in den Vordergrund. Semantische Technologien bieten die Grundlage zu vernetzten Wissenssystemen. Vollziehen Unternehmen den radikalen Schritt hin zum persönlichen subdokumenten-basierten Wissensmanagement, so eröffnen sich zahlreiche neue Chancen zur Effizienzsteigerung im Wissensmanagement und damit mittelbar zur Steigerung der Wertschöpfung durch Innovation. Die erforderlichen fundamentalen Umbrüche im Nutzerverhalten lassen es ratsam erscheinen, sich früh mit der neuen Technologie auseinanderzusetzen und Quick-Wins in wissensintensiven Arbeitsfeldern anzustreben. Das Semantische Netz offeriert ähnliche Chancen wie das Internet und hat das Zeug, die Wissensökonomie auf Basis subdokumenten-basierter Informationseinheiten entscheidend zu prägen.

    Fußnoten

    [1] Berners-Lee, T.: "Semantic Web" (2001) www.sciam.com/article.cfm
    [2] Bonifacio, M., Bouquet, P.: "Peer-Mediated Distributed Knowledge Management" (2003) eprints.biblio.unitn.it/archive/00000426/01/032.pdf
    [3] siehe auch www.w3.org/2001/sw/
    - Ein weiterer wichtiger Aspekt des Semantischen Netzes, nämlich Semantic Web Services, sollen hier nicht erläutert werden. [4] Guha, R., et. al.: "Semantische Suche" (2003) www2003.org/cdrom/papers/refereed/p779/ess.html
    [5] Decker, S., et. al.: "Ontobroker: Ontology based Access to Distributed and Semi-Structured Information" (1998) citeseer.ist.psu.edu/307370.html
    [6]Decker, S.: "Semantic Web Methods For Knowledge Management", Seite 132 (2002) www.ubka.uni-karlsruhe.de/cgi-bin/psview
    [7] Zum Beispiel: www.ontoprise.de oder www.ontotext.com
    [8] www.ontotext.com/kim/index.html
    [9] Siegfried Handschuh, Raphael Volz , Steffen Staab : "Annotation for the Deep Web" IEEE Intelligent Systems 18 (5): 42-48 (2003)
    [10] siehe www.w3.org/RDF/
    [11] siehe www.w3.org/TR/2004/REC-owl-features-20040210/
    [12]
    z.B. www.ontoprise.de/products/ontoedit , protege.semanticweb.or
    [13] siehe z.B. http://xmlns.com/foaf/0.1
    [14] http://www.ldodds.com/foaf/foaf-a-matic.html
    [15] BTakeda, H., Ohmukai, I.: "Semblog: Personal Publishing Platform with RSS and FOAF", Workshop Proceedings of the 1st FOAF Workshop, Galway, Ireland (2004) siehe http://www.w3.org/2001/sw/Europe/events/foaf-galway/papers
    [16]vergleiche z.B. Steffen S., Maedche A.: "Knowledge Portals - Ontologies at Work", AI Magazine, (June 2001)
    [17]Pinto, S., Staab, S., Sure, Y., Tempich, C.: "OntoEdit Empowering SWAP: a Case Study in Supporting DIstributed, Loosely-Controlled and evolvIng Engineering of oNTologies (DILIGENT).", 1st European Semantic Web Symposium (ESWS 2004), Heraklion, Crete, Greece. Springer, LNCS 3053, pp. 16-30 (May 2004)
    [18] Ludwig, L.: "Artificial Memory Prototype for Personal Semantic Subdocument Knowledge Management (PS-KM)", demonstration proposal, 3rd International Semantic Web Conference ISWC 2004, (November 2004)

Kommentare

Das Kommentarsystem ist zurzeit deaktiviert.



Themengruppen

Dieser Beitrag ist den folgenden Themengruppen zugeordnet