Lizenz für besseres Textverständnis

Max-Planck-Innovation vergibt Lizenz für Technologie zum maschinellen Verstehen von Texten

Das Unternehmen Ambiverse hat eine Software entwickelt, die auf Forschungen am Max-Planck-Institut für Informatik beruht und große Textmengen verstehen und analysieren kann. Wörter mit mehreren Bedeutungenkönnen so eindeutig interpretiert werden. Dies eröffnet Unternehmen den Zugang zu mehr relevanten Informationen im Internet und besseren Zugriff auf Informationen in eigenen Datenbeständen.

Daten bilden in unserer digitalisierten Welt immer häufiger die Basis für den Erfolg eines Unternehmens. Viele Unternehmen verfügen über eine große Menge an Daten und können jederzeit auf weltweit verfügbare Informationen im Internet zugreifen. Der Nutzen dieser Daten wird jedoch stark limitiert, da verfügbare Informationen maschinell nicht richtig oder nur unzureichend zugeordnet werden können.

Hierfür maßgeblich verantwortlich sind mehrdeutige oder variierende Begriffe, Namen, Orte, Firmen oder Ereignisse, die nicht eindeutig bestimmt werden können: Menschen können den Sinn der Aussage „nach Verletzung kein Neuer in Sicht“ anhand des Kontextes erschließen. Ein informierter Leser erkennt, dass es sich um Nationaltorhüter Manuel Neuer handelt, dessen Verletzung Probleme für seinen Verein und die deutsche Fußball-Nationalmannschaft mit sich bringt. Für Maschinen stellt diese Interpretation eine ungleich größere Herausforderung dar. Jedoch ist dieses Wissen essentiell für ein tiefergehendes Verständnis und die Nutzung von digitalen Inhalten.

Yago – Lexikon für Computer

Das Unternehmen Ambiverse, das u.a. von Wissenschaftlern Max-Planck-Instituts für Informatik in Saarbrücken gegründet wurde, hat eine intelligente Softwarelösung für die automatische und akkurate Erkennung und Auflösung von mehrdeutigen Wörtern und Phrasen in Texten entwickelt. Grundlage hierfür ist die am Institut entwickelte Wissensbasis Yago. Diese semantische Datenbank, die über mehr als zehn Millionen Entitäten (Namen, Organisationen, Städte, etc.) verfügt und u.a. auf Wikipedia basiert, stellt so etwas wie ein Lexikon für Maschinen dar. Die Software enthält einen Programmcode, der Wörter im Text auf bestimmte Entitäten in Yago abbildet und es auf diese Weise Computern erlaubt, Wörter akkurat und eindeutig zu interpretieren.

Möglich ist dies dadurch, dass in der Wissensbasis neben Entitäten (zum Beispiel: Manuel Neuer) auch Kategorien (hier Person, Fußballer) und Fakten (Verletzung) hinterlegt sind und miteinander kombiniert werden. Diese Kombination führt zu einer Genauigkeit der Zuordnung von über 80 Prozent und stellt laut IBM eine Referenzmethode dar. Um die Nutzung unternehmensinterner Daten zu optimieren bietet Ambiverse eine Programmschnittstelle zur Einbindung unternehmensspezifischer Datenbanken an.

Von der Grundlagenforschung zur Anwendung

„Unsere Cloud-basierte Technologie ermöglicht es individuelle, hochspezifische und auf das Unternehmen zugeschnittene Such- und Analysewerkzeuge für Nachrichtenarchive, Unternehmensdokumente, Produktreviews und vieles mehr zu erstellen – nicht nur in deutscher, sondern auch in englischer, spanischer und chinesischer Sprache. So werden selbst aus großen, unstrukturierten Textmengen Erkenntnisse gewonnen, die von Unternehmen genutzt werden können. Durch die kontinuierliche Erweiterung unserer Wissensbasis und unserer Technologie wollen wir erreichen, dass Texte uneingeschränkt von Maschinen verstanden werden und so auch Anfragen von höchster Komplexität beantwortet werden können“, so Johannes Hoffart, Geschäftsführer und Mitgründer der Ambiverse.

„Wir freuen uns, dass Ambiverse eine innovative Technologie aus dem Max-Planck-Institut für Informatik für die kommerzielle Nutzung in einem zukunftsträchtigen Umfeld weiterentwickelt und so der Wirtschaft zur Verfügung stellt. Die Mitarbeiter von Ambiverse verfügen über Erfahrungen in der Arbeitswelt von Firmen wie Google, SAP und Microsoft und bringen die Expertise mit, die notwendig ist, um der Technologie zum Markterfolg zu verhelfen“, sagt Bernd Ctortecka, Patent- und Lizenzmanager bei Max-Planck-Innovation, der Technologietransfer-Organisation der Max-Planck-Gesellschaft.

MB/HR

Weitere interessante Beiträge

Zur Redakteursansicht