Von Data Mining zu Trend Mining

Gute Nachricht für Wirtschaft und Wissenschaft: Neues Forschungsprojekt bei FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur erlaubt schnelleren und leichteren Zugang zu Innovationstrends bei Zukunftstechnologien durch Trend Mining in Patentinformationen.

Karlsruhe, Dezember 2013 – „Wissenschaft, Wirtschaft und Politik brauchen verlässliche Indikatoren dafür, was sich in der Forschung tut und wo sie hingeht. Diese Informationen stecken in Patentdatenbanken. FIZ Karlsruhe hat leistungsfähige Analysewerkzeuge für die Trendforschung mit Patentinformation entwickelt, die Landkarten der internationalen Forschung zeichnen“, erklärt Sabine Brünger-Weilandt, Direktorin und Geschäftsführerin von FIZ Karlsruhe. „Mit unserem neuen Forschungsprojekt „Trend Mining für die Wissenschaft“ bauen wir unser Know-how auf dem Gebiet der Daten- und speziell der Textanalyse konsequent weiter aus, um Wissenschaft und Wirtschaft noch besser bei geschäftskritischen Entscheidungen zu unterstützen.“

Neue Trends bzw. Entwicklungen in der Forschung rechtzeitig zu erkennen, das wird sowohl für die Industrie als auch die Wissenschaft zunehmend zur Existenzfrage. Es geht darum, Innovationstrends so früh wie möglich aufzuspüren, andernfalls verliert man im internationalen Wettbewerb sehr rasch seine Konkurrenzfähigkeit.
In dem neuen Forschungsprojekt „Trend Mining für die Wissenschaft“ sollen die Methoden des Text Minings erstmals auf die schwierige Textsorte Patenttexte angewendet werden. Das von der Leibniz Gemeinschaft im Wettbewerbsverfahren im Rahmen des sog. Paktes für Forschung und Innovation in der Förderlinie für besonders innovative Vorhaben geförderte Projekt hat eine Laufzeit von drei Jahren.

Patentinformationen liefern ein Spiegelbild der Innovations- und Leistungsfähigkeit von Unternehmen, Regionen und von ganzen Volkswirtschaften. Die Ergebnisse technischer und naturwissenschaftlicher Forschung werden häufig nur in Form von Patenten publiziert. Experten schätzen daher, dass ca. 70 bis 90 % des gesamten weltweit veröffentlichten technischen Wissens ausschließlich in Patentpublikationen dokumentiert ist: Das macht Patentschriften zu einer extrem wertvollen Informationsressource für die Forschung in Wissenschaft und Wirtschaft.

In dem jetzt gestarteten Leibniz-Projekt wollen die beteiligten Wissenschaftlerinnen und Wissenschaftler von FIZ Karlsruhe und der Universität Hildesheim neue Verfahren und Softwarewerkzeuge entwickeln, um aus den Inhalten von eigens dafür aufbereiteten Patentdokumenten (Volltexte, Patentklassifikationen und bibliografische Angaben) weitgehend automatisiert Rückschlüsse auf Innovationstrends ziehen zu können. Die Schwierigkeit dabei resultiert in erster Linie aus der Patentterminologie und den von der Alltagssprache abweichenden linguistischen Strukturen. Projektziel ist der Prototyp einer einfach zu verwendenden Software, die Wissenschaftler, Information Professionals und Patentexperten bei der Identifizierung von Innovationstrends unterstützt. Mit dieser Software, so die Hoffnung der Entwickler, lassen sich dann allein auf Basis einer Analyse verschiedener Textmerkmale in den Patentschriften sowie der Kombination der auf diese Weise extrahierten Daten mit weiteren Informationen (z. B. wissenschaftlichen Publikationen) Trends sichtbar machen. Das hier geplante Analysewerkzeug soll Innovationstrends einfacher, schneller und vollständiger als bisher nachweisen und zudem auch belegbare, d. h. anhand konkreter Daten nachvollziehbare Ergebnisse liefern. Die sehr hohe Zuverlässigkeit der Rechercheergebnisse und der zeitliche Informationsvorsprung, bedeuten für die potenziellen zukünftigen Anwender entscheidende Vorteile bei wettbewerbsrelevanten, geschäftskritischen Entscheidungen gegenüber Konkurrenten, die noch klassische Verfahren einsetzen.

Während in der breiten Öffentlichkeit der Begriff Data Mining erst seit relativ kurzer Zeit einen höheren Bekanntheitsgrad erlangt hat, arbeiten die Experten von FIZ Karlsruhe bereits seit fast 30 Jahren daran, Spezialwerkzeuge zu entwickeln, mit denen man aus Datenfluten wertvolle Informationen extrahieren kann. Trendanalysen mit Patentinformationen sind heute bereits möglich, allerdings sind sie sehr zeitaufwändig und erst dann aussagekräftig, wenn sich der Trend anhand steigender Patentanmeldungen zahlenmäßig identifizieren lässt. Und: Nur durch eine sorgfältige Aufbereitung von Patentinformationen wird die in den Daten enthaltene Information über Technik und Märkte gezielt und sinnvoll auswertbar. Inhalte (Content), System und Werkzeuge (Tools) müssen dabei perfekt aufeinander abgestimmt sein. Der von FIZ Karlsruhe betriebene Online-Service STN® International spielt dabei die zentrale Rolle. Dieser weltweit führende Online-Dienst auf dem Gebiet der Forschungs- und Patentinformation stellt eine einzigartige Kombination von Premium-Datenbanken zur Verfügung, auf deren Basis Innovationstrends abgeleitet werden können. Der Content von STN International umfasst derzeit ca. 150 Datenbanken mit etwa 1,5 Mrd. Dokumenten, und die inhaltliche Bandbreite reicht dabei von Patentschriften und Metadaten, wie z. B. Abstracts von wissenschaftlichen Veröffentlichungen bis hin zu Fakten wie chemischen Strukturen und Reaktionen sowie Gensequenzen.

Zur Analyse der recherchierten Patentinformationen werden spezielle Visualisierungen benötigt, wie sie etwa das Werkzeug STN AnaVist leistet. Mit STN AnaVist lassen sich große Treffermengen von bspw. mehreren tausend Treffern als „Patentlandschaften“ visuell darstellen und weiterführend auswerten. Die „Landschaft“ entsteht durch Zusammenführung (Clustering) inhaltlich ähnlicher Dokumente zu „Dokumenthügeln“. Eine solche Landschaft kann dann mit Hilfe von zahlreichen weiteren Analysetools interaktiv ausgewertet werden.

FIZ Karlsruhe ist seit mehr als 35 Jahren einer der erfolgreichsten Player im Informationssektor. Neben STN International entwickelt und betreibt das Leibniz-Institut für Informationsinfrastruktur weitere Datenbank-Services für Wissenschaft und Wirtschaft. Auf Basis der damit verbundenen Erfahrungen und Kompetenzen werden innovative e-Science-Lösungen für Wissenschaft und Forschung entwickelt, die einen weiteren Schwerpunkt des Produktportfolios bilden.

Weitere Informationen zum Thema Trendanalyse mit Patentinformationen (am Beispiel von Energiespeichertechnik) finden Sie hier und auf unserer Startseite www.fiz-karlsruhe.de. Auf unseren Projektseiten kann eine Kurzbeschreibung des Projekts abgerufen werden. Bildmaterial zum Thema „Patentlandschaft“ finden Sie hier auf unserer Website unter der Rubrik Pressefotos.

FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur (www.fiz-karlsruhe.de) ist eine gemeinnützige GmbH und die größte außeruniversitäre Informationsinfrastruktureinrichtung in Deutschland. FIZ Karlsruhe hat den öffentlichen Auftrag, Wissenschaft und Forschung – auch in der Wirtschaft – mit wissenschaftlicher Information zu versorgen und entsprechende Produkte und Dienstleistungen auf dem Gebiet der Informationsinfrastruktur zu entwickeln. Ziel ist die aktive Unterstützung der Innovationsförderung, durch Stärkung des Wissenstransfers im nationalen wie im internationalen Rahmen.

Die Geschäftsfelder sind
– STN International – der weltweit führende Online-Service für wissenschaftlich-technische Forschungs- und Patentinformation
– KnowEsis – innovative e-Science-Solutions zur disziplinunabhängigen Unterstützung des gesamten Forschungsprozesses (z. B. Forschungsdatenmanagement)
– Datenbanken und Informationsdienste – Datenbanken und Wissenschaftsportale in den Fachgebieten Mathematik und Informatik, Kristallographie und Chemie sowie Energie.

FIZ Karlsruhe ist Mitglied der Leibniz-Gemeinschaft, unter deren Dach sich über 80 Einrichtungen zusammengeschlossen haben, die Forschung betreiben und/oder wissenschaftliche Infrastrukturen bereitstellen.

Kontakt:
FIZ Karlsruhe
Robert Hauser
H-v-Helmholtz-Platz 1
76344 Eggenstein-Leopoldshafen
07247-808-513
robert.hauser@fiz-karlsruhe.de
http://www.fiz-karlsruhe.de