Wissenstransfer und Medienerschließung: Werkzeuge für die Integration von Multimedia-Inhalten in das Wissensmanagement

    10. Juni 2013 von Dr. Michael Eble, Sebastian Kirch

    Für Speicherung und Transfer von Wissen setzen Unternehmen neben Textdaten verstärkt auch audio-visuelle Daten ein. Beispiele dafür sind Schulungsvideos für Produktionsanlagen oder Podcasts zu Forschungsthemen. Damit stellt sich die Frage, welche Werkzeuge sich für die Integration von Multimedia-Inhalten in Systeme des Wissensmanagements eignen und wie solche Inhalte in Enterprise-Suchmaschinen eingebunden werden können. Der Beitrag skizziert diesen Ausgangspunkt und gibt eine Übersicht über Anbieter und Werkzeuge zur Erschließung von Bilddaten (z. B. aus Digitalisierungs-Projekten) sowie von audio-visuellen Daten. Er konzentriert sich auf Werkzeuge, die als Software as a Service genutzt werden können und listet Kriterien zur technischen Evaluation solcher Lösungen auf. Der Beitrag basiert auf Beratungs- und Entwicklungsprojekten zu automatischer Medienerschließung, Multimedia Indexing und Enterprise Search.

    Dieser Beitrag wurde im Open Journal of Knowledge Management, Ausgabe VII/2013 veröffentlicht.


    1. Einleitung und Problemaufriss

    Für Unternehmen der Pharma-, Chemie- und IKT-Branchen hat das über die Jahre in Forschung und Entwicklung geschaffene Wissen eine hohe Wettbewerbsrelevanz. Es kann einen wesentlichen Ausgangspunkt für zukünftige Forschungsprojekte und Produkte darstellen. Um die systematische Wiederverwertung dieses Wissens zu ermöglichen und zu verbessern, wird es über Aktivitäten des Wissensmanagements mittels verschiedener analoger und digitaler Medien gespeichert und weitergegeben. Ein Aspekt dessen sind Metadaten-Strategien, die definieren, zu welchem Zweck welche Metadaten zu welchen Daten erzeugt, gespeichert und genutzt werden. Dabei ist nicht zuletzt im Kontext stark verkürzter Innovations- und Produktlebenszyklen der unmittelbare Zugriff auf relevante F&E-Informationen und Ansprechpartner wesentlich. Hier spielen Enterprise-Suchmaschinen z. B. in Konzernen wie Siemens eine zentrale Rolle (Mörl, Heiss & Richter 2011; Stocker & Müller 2012).

    Solche unternehmensweiten Suchmaschinen stehen vor mehreren Herausforderungen (vgl. Eble & Kirch 2013). Dazu zählt aus technischer Sicht, a) heterogene Daten- und Metadatenformate aus b) verschiedenen und dezentralen Datenquellen zu indexieren und dabei c) bestehende Rechte- und Rollenkonzepte in entsprechend individuellen Suchergebnissen zugänglich zu machen. Im Fall der heterogenen Daten- und Metadatenformate finden sich z. B. Dateien aus Microsoft-Office-Anwendungen neben technischen CAD-Zeichnungen oder Formaten mit chemischen Molekül-Strukturen. Im Fall der Datenquellen sind neben Dateisystemen auch aktuelle und „historische“ Datenbanken zu integrieren und gleichzeitig müssen die Rechte- und Rollen anhand von Organisationseinheiten oder Funktionen auf die Ergebnisdarstellung angewendet werden.

    Hinzu kommen verstärkt zusätzliche Formate und Quellen: Aus Digitalisierungs-Projekten liegen als Bild- und/oder Textdaten z. B. Patentakten vergangener Jahrzehnte oder Forschungsdokumentationen aus Unternehmensarchiven vor. Ebenso werden zunehmend audio-visuelle Formate und Medien für die Speicherung von Wissen eingesetzt – z. B. Schulungsvideos für Produktionsanlagen oder Podcasts zu Forschungsthemen. Um auch solche multimedialen Daten im Wissenstransfer einzusetzen, ist ihre strukturelle und inhaltliche Erschließung erforderlich: Durch die strukturelle Erschließung werden Digitalisate in einzelne Seiten sowie in deren Text- und Bildinhalte segmentiert (OLR: Optical Layout Recognition), audio-visuelle Daten werden nach Szenen, Sprechern und Aussagen unterteilt (Speaker Diarisation). Durch die inhaltliche Erschließung werden Bilddaten in durchsuchbare Textdaten umgewandelt (OCR: Optical Character Recognition), gesprochene Sprache wird ebenfalls in Textdaten transformiert (ASR: Automatic Speech Recognition).

    2. Anbieter, Werkzeuge und Evaluationskriterien

    Inzwischen existiert eine ganze Reihe von Werkzeugen, um Technologien der Medienerschließung in die eigene Enterprise Search bzw. in bestehende Umgebungen wie z. B. Microsoft SharePoint einzubinden. Im Zuge der Verbreitung von Software as a Service stehen solche Werkzeuge als Cloud-Lösungen zur Verfügung. Das eignet sich insbesondere zur Evaluation im Rahmen der Grob- und Feinkonzeption einer Integration von Multimedia-Inhalten in Systeme des Wissensmanagements. So besteht die Möglichkeit, Pilot-Anwendungen zu entwickeln und mit internen Nutzern der relevanten Organisationseinheiten zu testen. Die nachfolgenden Tabellen geben einen Überblick über Anbieter und Werkzeuge a) zur Erschließung von Digitalisaten und anderen Bilddaten sowie b) zur Erschließung von Audio- und Videodaten. Die Tabellen sind eine aktualisierte Version der Übersichten aus Eble & Kirch (2012b) und basieren auf Angaben der Anbieter.

    Tabelle 1: Anbieter und Werkzeuge zur Erschließung von Digitalisaten/Bilddaten.
    Quelle: Eble & Kirch 2012b

    Anbieter
    Produkt

    Leistungen des Werkzeugs

    Unterstützte Datentypen

    Unterstützte Sprachen

    1

    Abbyy

     

    Cloud OCR SDK

    Automatische Texterkennung (OCR), um Digitalisate durchsuchbar zu machen; Bereitstellung über Web-Schnittstellen (APIs) in einem mengenbasierten Abrechnungsmodell

    Digitalisate von Dokumenten als Bilddaten (Scans von Zeitungen, Patentakten etc.; Fotos von Dokumenten) als TIFF, PDF oder in anderen Formaten

    198 Sprachen (Deutsch, Englisch, Französisch, Spanisch u. a.)

    2

    Kooaba

     

    Technology Plattform

    Automatische Erkennung von Mustern, um Links zwischen Bildinhalten von Dokumenten und verwandten Inhalten herzustellen; Bereitstellung über Web-Schnittstellen (APIs) in einem mengenbasierten Abrechnungsmodell

    Sprachen-unabhängig

    3

    Nuance

     

    OmniPage Cloud Service

    Automatische Texterkennung (OCR), um Digitalisate durchsuchbar zu machen; Bereitstellung über Web-Schnittstellen (APIs); derzeit keine Preis- und Abrechnungsangaben

    127 Sprachen (Deutsch, Eng-lisch, Franzö-sisch, Spanisch u. a.)

    5

    Smart Mobile Software

     

    Online OCR API

    Automatische Texterkennung (OCR), um Digitalisate durchsuchbar zu machen; zielt offenbar auf Entwickler von mobilen Anwendungen (Apps); Bereitstellung; Bereitstellung über Web-Schnittstellen (APIs) in einem mengenbasierten Abrechnungsmodell

    38 Sprachen (Arabisch, Bulga-risch, Chinesisch, Deutsch, Englisch u. a.)

    6

    WiseTrend

     

    OCR Cloud 2.0

    Automatische Texterkennung (OCR), um Digitalisate durchsuchbar zu machen; zielt auf Entwickler von mobilen Anwendungen (Apps); Bereitstellung über Web-Schnittstellen (APIs) in einem mengenbasierten Abrechnungsmodell

    Über 200 Sprachen (Lateinische Schriften, Kyrillische Schriften, Chinesisch etc.)

     

     

    Tabelle 2: Anbieter und Werkzeuge zur Erschließung von Audio- und Videodaten (gesprochene Sprache),
    Quelle: Eble & Kirch 2012b

    Anbieter
    Produkt

    Leistungen des Werkzeugs

    Unterstützte Datentypen

    Unterstützte Sprachen

    1

    3Play Media

     

    Transcription Service

    Kombination von automatischen und manuellen Verfahren, um gesprochene Videoinhalte in zeitsynchrone Text-inhalte umzuwandeln; u. a. für Untertitel; Bereitstellung über Web-Schnittstellen (APIs)

    Digitale Audio-Video-Daten mit gesprochener Sprache (z. B. Nachrichten-Sendungen, Dokumentationen, Reportagen oder Podcasts)

    Englisch, Französisch, Spanisch

    2

    Greenbutton

     

    InCus

    Bereitstellen von automatischen Verfahren über Web-Schnittstellen (API), um gesprochene Videoinhalte in zeitsynchrone Textinhalte umzuwan-deln; u. a. zur Suchmaschinenopti-mierung (Video-SEO) und für Untertitel

    Englisch

    3

    Ramp

     

    MediaCloud

    Bereitstellen von automatischen Verfahren auf einer Web-Service-Plattform, um  z. B. Multimedia Indexing innerhalb von Microsoft SharePoint zu ermöglichen

    Englisch

    4

    SpeakerText

     

    API & Captionbox

    Kombination von automatischen und manuellem Verfahren, um gesprochene Videoinhalte in zeitsynchrone Textinhalte umzuwandeln

    Englisch

    5

    VeeSeo

     

    SaaS API

    Automatische Verfahren, um gesproche-ne Videoinhalte in zeitsynchrone Textinhalte umzuwandeln; sprecher-unabhängige Spracherkennung und semantische Anreicherung; Bereit-stellung über Web-Schnittstellen (APIs)

    Deutsch

     

    Zur Evaluation solcher Systeme aus der technischen Sicht kann entlang einer vereinfachten Wertkette der Medienerschließung (Erfassen – Erschließen – Bereitstellen) vorgegangen werden. Eine Schema dazu ist in der nachstehenden Tabelle abgebildet (vgl. Eble & Kirch 2012a). Ergänzend ist zu prüfen, inwieweit die Werkzeuge neben Volltextdaten auch identifizierende, beschreibende, struktur- und relationsbezogene sowie administrative und technische Metadaten erzeugen können.

    Tabelle 3: Kriterien zur technischen Evaluation von SaaS-Lösungen zur Medienerschließung Quelle: Eble & Kirch 2012a

    Erfassen

    Erschließen

    Bereitstellen

    Schnitt-
    stellen

        Aktiv

    • Web-Service
    • Crawler
    • CMS-Adapter

    Passiv

    • FTP
    • NFS
    • GUI
    • Datenträger   

    Aktiv

    • Web-Service
    • CMS-Adapter

    Passiv

    • FTP
    • NFS
    • GUI
    • Datenträger

    Ort

    • Intranet
    • Private Cloud
    • Partner Cloud
    • Public Cloud
    • Hybrid Cloud
    • Private Cloud
    • Partner Cloud
    • Public Cloud
    • Hybrid Cloud   
    • Intranet
    • Private Cloud
    • Partner Cloud
    • Public Cloud
    • Hybrid Cloud

    Dauer

    • Einfache Echtzeit
    • Zweifache Echtzeit
    • Dreifache Echtzeit
    • 24 Stunden
    • 48 Stunden
    • Individuell

    Eigenschaften

    Komplexität

    • Auflösung
    • Medientypen

    Umfang

    • Volumenpaket
    • Individuell   

    Umfang

    • Einzelne Dienste
    • Fertige Workflows
    • Eigene Kombination

    Art und Weise

    • Nur automatisch
    • Nur manuell
    • Beides ergänzend

    Abrechnungsmodalität

    • Pre paid
    • Post paid

    Abrechnungszeitraum

    • Pro Erschließung
    • Monatlich
    • Ab einem bestimmten Betrag

     

    3. Fazit und Ausblick

    Mit der Nutzung solcher Werkzeuge sind im Hinblick auf multimediale Inhalte mehrere Chancen verknüpft: In technischer Hinsicht können verschiedene Werkzeuge kurzfristig und bedarfsgerecht evaluiert werden, ohne zur Projektdurchführung selbst Hardware- und Software-Infrastrukturen lokal aufbauen und betreiben zu müssen. Damit können Pilot-Anwendungen den Fachabteilungen als interne Kunden dann schneller zur Verfügung gestellt werden, wenn Werkzeuge und Daten über Schnittstellen (APIs) in bestehende Anwendungen integriert werden. Die Werkzeuge verschiedener Anbieter können dann über ein internes Test-Datenset miteinander verglichen werden. Diesen Chancen stehen mehrere nicht zu unterschätzende Risiken gegenüber: Der Markt für Medienerschließung via Cloud Computing befindet sich in einer frühen Phase und es bestehen Unsicherheiten bezüglich der Leistungsfähigkeit der Angebote und Sicherheit bei der Datenspeicherung und -verarbeitung sowie bezogen auf die Interoperabilität mit bestehenden Anwendungen. Nicht zuletzt liegen gegenwärtig nur vereinzelt Anwenderberichte und dokumentierte Szenarien vor. (vgl. Eble & Kirch 2012a)

    In der weiteren Entwicklung ist mit Werkzeugen zu rechnen, die eine Verschränkung von automatischer und manueller Medienerschließung für Multimedia-Inhalte ermöglichen: Die Notwendigkeit bzw. der Nutzen einer solchen Verschränkung resultiert daraus, dass einerseits große Datenbestände (z. B. aus Digitalisierungs-Projekten) mit rein manueller Arbeit aufgrund zu hoher Aufwände nicht erschlossen werden können. Andererseits müssen automatische Verfahren teilweise trainiert werden und können nicht immer vollständig zufriedenstellende Ergebnisse liefern. Werkzeuge für die integrierte Medienerschließung, also für die Kombination von automatischen und manuellen Verfahren, können die Anforderungen an Quantität und Qualität, an Aufwand und Nutzen in Einklang bringen. (11.347 Zeichen insg.)

    4. Quellen

    Eble, Michael & Kirch, Sebastian (2012a):Metadaten aus der Cloud: Erschließung von Medienarchiven über Diensteplattformen und Software as a Service. In: Info 7 27 (2012), Nr. 2, S. 57-62.

    Eble, Michael & Kirch, Sebastian (2012b): Metadaten aus der Cloud: Technologien und Anwendungsfälle der Medienerschließung mittels Software as a Service. In: Bernhard Mittermaier (Hrsg.): Vernetztes Wissen - Daten, Menschen, Systeme. Proceedings zur WissKom 2012 – 6. Konferenz der Zentralbibliothek Forschungszentrum Jülich, S. 135-147.

    Eble, Michael & Kirch, Sebastian (2013): Enterprise Search im Wissensmanagement: Herausforderungen für Suchmaschinen in forschungsbasierten Konzernen. Vortrag auf der IFIM-Tagung „Suchmaschinen – die neuen ‚Bottlenecks‘ des Internetzeitalters?“ am 07. Juni 2013 in Passau. [Konferenzband in Vorbereitung]

    Mörl, Susanne; Heiss, Michael & Richter, Alexander (2011): Siemens: Wissensvernetzung mit TechnoWeb 2.0. In: Back, Andrea; Koch, Michael; Schubert, Petra & Smolnik, Stefan (Hrsg.): Schriftenreihe zu Enterprise 2.0-Fallstudien, Nr. 09. München/St. Gallen/Koblenz/Frankfurt: Enterprise 2.0 Fallstudien-Netzwerk.

    Stocker, Alexander & Müller, Johannes (2012): Wissensmanagement mit References+ bei der Siemens-Division Building Technologies. In: Open Journal of Knowledge Management, Ausgabe V/2012, S. 21-26.

     

     

    [Standard] Namensnennung 3.0 Deutschland - Weitergabe unter gleichen Bedingungen 3.0 Deutschland
    Lizenziert unter einer Creative-Commmons Lizenz

Kommentare

Das Kommentarsystem ist zurzeit deaktiviert.



Themengruppen

Dieser Beitrag ist den folgenden Themengruppen zugeordnet

Schlagworte

Dieser Beitrag ist den folgenden Schlagworten zugeordnet