In den letzten Tagen ist eine Meldung durch die Presse gegangen (z.B. Der Standard, OÖ24), dass erstmals ein Algorithmus ein Buch geschrieben hat. Das unter dem Autorennamen “Beta Writer” bei Springer Nature erschienene Buch befasst sich mit Lithium-Ionen-Batterien, und kann von der Verlagsseite frei als PDF-Datei heruntergeladen werden. Was steckt hinter dem Verfahren, das von Forschern der Angewandten Computerlinguistik an der Frankfurter Goethe-Universität entwickelt wurde?
Wer war bei der Erstellung intelligent?
Die eigentliche intelligente Arbeit, die im Buch steckt, ist freilich von Menschen erledigt worden. Wurde der Titel doch aus wissenschaftlichen Arbeiten erzeugt, die auf der Plattform SpringerLink veröffentlicht, und zuvor wissenschaftlich begutachtet wurden. Daher stammt sowohl der kreative Anteil der Erstellung, als auch der, der Begutachtung und redaktionellen Überarbeitung aus menschlichen Gehirnen.
Der Algorithmus unterzog die Dateien der Publikationen einem ähnlichkeitsbasierten Clustering-Verfahren, um die Quelldokumente in zusammenhängende Kapitel und Abschnitte zu gliedern. Das Buch ist aber nicht nur eine gegliederte Aneinanderreihung der Ausgangsdokumente. Die einzelnen Dokumente wurden mit Techniken zum automatisierten Erstellen von Zusammenfassungen gekürzt, und mit Links zu den Quelldokumenten versehen. Darüber hinaus wurden selbstverständlich Inhaltsverzeichnisse und Referenzen automatisch erzeugt und eingefügt.
Ist das Ganze als unnütze technologische Spielerei zu sehen, oder nur für Sensationsmeldungen der Presse konzipiert worden, oder steckt ein tatsächlicher Nutzen darin?
Betrachtet man die Unmengen an Informationen, die im wissenschaftlichen aber auch anderen Bereichen immer schneller kreiert und publiziert werden, dann kann hinter solchen automatisierten Verfahren durchaus ein Nutzen gesehen werden. So ist es dadurch möglich Forschern schnell einen Überblick über ein Themengebiet zu verschaffen, der nur mit menschlichen Redakteuren nur schwer zu erreichen wäre. Neu ist diesmal auch nur das Erscheinen im traditionellen Buchformat, Softwarelösungen und Internetportale zur automatisierten Zusammenstellung und Aufbereitung von Textinformationen sind schon länger im Einsatz.