Automatisierte Texterstellung: Von Wetterberichten hin zu Literatur und Wissenschaft

Automatisch generierte Texte von handgeschriebenen unterscheiden? In manchen Bereichen geht das schon lange nicht mehr, in anderen scheint das bisher undenkbar. Die Software für automatisierte Texterstellung wird immer besser und komplexer, Bots sind auf dem Vormarsch und Roboterjournalismus entsteht. Dass Wetterberichte, Sportberichterstattung oder auch Finanznachrichten von Maschinen geschrieben werden können, ist vielen mittlerweile klar und einleuchtend – immerhin basieren die Artikel aus zahlreichen Daten und immer ähnlichen Satzgerüsten. Doch lassen sich in Zukunft vielleicht auch ganze literarische Werke oder wissenschaftliche Publikationen von Bots generieren, ohne dass sie als Robotertexte zu erkennen sind? Und was bedeutet das dann für die Welt der Texte?

Wie funktioniert automatisierte Texterstellung?

Der Markt rund um die automatisierte Texterstellung wächst und die Auswahl an Software-Anbietern in diesem Bereich wird immer größer. Das Prinzip der Technologie ist jedoch bei allen Anbietern ähnlich. Die bereitgestellte Software ermöglicht es, auch ohne Programmierkenntnisse datenbasierte Texte maschinell zu erzeugen – schnell, unkompliziert und in großen Mengen.

Die Grundlage automatisierter Texterstellung bilden strukturierte Daten, aus denen die entsprechenden Inhalte generiert werden – je mehr Daten desto besser. Diese liegen häufig in Form einer Excel- oder csv-Datei vor und können dann nach dem Hochladen in der Software interpretiert, ausgewertet und weiterverarbeitet werden. Bevor das jedoch geschehen kann, muss man die Software trainieren und ihr verschiedene Satzgerüste, die Phrasierung, das Wording, den Stil und vor allem die Bedeutung der verschiedenen Datenelemente beibringen. Zu Beginn legt man damit fest, wie der Text am Ende aussehen soll – was er beinhaltet, seine stilistische Form und in welcher Reihenfolge die Informationen enthalten sein werden.

Alles startet also mit den Daten: Diese müssen gesammelt und strukturiert werden, damit man sie manuell oder via API in das Generierungstool laden kann. Danach beginnt das Training der Maschine und damit die Redaktion. Die Daten werden statistisch analysiert, wichtige Inhalte, die Formulierungen und die Textstruktur definiert sowie alle Regeln für den Text festgelegt. Je mehr unterschiedliche Formulierungen dabei erstellt werden, desto abwechslungs- und variantenreicher werden später auch die generierten Texte. Damit die Software die Daten auch entsprechend verarbeiten und interpretieren kann, bringt man ihr außerdem bei, welche Charakteristika die verschiedenen Datenelemente haben und wie sie miteinander in Beziehung stehen. So kann die Maschine später interessante und besondere Inhalte erkennen und entsprechend in die Texte einbauen.

Für die Generierung des Textes greift die Software auf die vorher definierten Regeln zurück, analysiert die Daten und verknüpft sie mit den erstellten Satzkonstruktionen und –varianten, die durch Zufall ausgewählt werden. Das garantiert möglichst abwechslungsreiche Texte. Diese werden dann entsprechend der festgelegten Storyline – der Satz-Reihenfolge – aneinandergefügt und mit grammatikalischen, semantischen und lexikalischen Informationen angereichert. Das Ergebnis ist ein menschlich klingender Text nach den eigenen Vorgaben. Im Anschluss kann der Beitrag direkt veröffentlich werden, entweder direkt und in Echtzeit über eine API oder manuell nach redaktioneller Prüfung.

Machine Learing ermöglicht es darüber hinaus, dass der Algorithmus der Software stetig mitlernt und sich so weiter verbessert. Dafür können beispielsweise bei generierten Texten das Leserverhalten und der Erfolg nach vorher definierten KPIs analysiert werden. Verbesserungen können dabei mittlerweile sogar in Echtzeit durch die Software umgesetzt werden.

Wo wird die Technologie aktuell erfolgreich eingesetzt?

In immer mehr Bereichen finden automatisiert generierte Texte Anwendung – ob im E-Commerce, in der Kundenkommunikation oder auch im Journalismus. Alle Texte, die auf strukturierten Daten basieren, eignen sich hier ganz besonders. Hier lassen sich sozusagen einfache Lückentexte erstellen, die dann mit den Daten aufgefüllt werden und durch verschiedene Variationsmöglichkeiten so vielfältig wie handgeschriebene Texte sind.

Unternehmen setzen die automatisiert generierten Texte vorrangig im E-Commerce ein. Produktbeschreibungen, die besonderen SEO-Kriterien entsprechen sollen, sind dafür prädestiniert. Bei Online-Händlern mit einem großen Sortiment ist es händisch fast nicht zu schaffen, für jeden Artikel einen ausführlichen, einzigartigen Produkttext zu erstellen – wie es aber für eine gute Platzierung in den Suchmaschinen nötig ist. Bots bieten hier die Lösung und schreiben den „Unique Content“ in Sekundenschnelle. Ebenso kann die Technologie offline, für beispielsweise Produkttexte in Katalogen, eingesetzt werden. Sogar Geschäftsberichte werden mittlerweile von Maschinen verfasst.

Ebenso lassen sich automatisiert erstellte Texte in der Kundenkommunikation verwenden. Das können beispielsweise von der Maschine geschriebenen Briefe oder Mails sein, die den Customer Service erleichtern und verbessern können. Außerdem werden auch immer häufiger Chat Bots eingesetzt, die ebenfalls über die Textgenerierungstools befüllt werden können.

Auch im Journalismus halten Bots nach und nach Einzug – Stichwort Roboterjournalismus. Zahlreiche Nachrichten eignen sich bestens für den Einsatz von automatisierter Texterstellung. Das können zum Beispiel Wetterberichte, Börsennews, Sport- oder Polizeiberichte sein. So setzt beispielweise die Berliner Morgenpost bei ihrem Feinstaub-Monitor Texte ein, die sich täglich automatisch aktualisieren. Die Stuttgarter Zeitung stellt ihren Lesern wiederum täglich für über 12.000 Städte der Region Wetterberichte online zur Verfügung – das wäre der Redaktion ohne maschinelle Hilfe gar nicht möglich. In den sozialen Medien lassen sich die Computer-Texte darüber hinaus in Form von News Bots oder für das Schreiben von Posting verwenden.

Weitere Einsatzmöglichkeiten können auch in ganz anderen Branchen entstehen. So lassen sich beispielsweise auch Patientenberichte im Krankenhaus auf Basis der Patientendaten leicht erstellen.

Zukunftsszenarien – Wo geht die Reise hin?

Aktuell sind es wie oben erwähnt vor allem Lückentexte, die durch strukturierte Daten ergänzt werden, die automatisiert generiert werden. Meist ist die automatisierte Texterstellung derzeit auch nur bei Texten wirtschaftlich sinnvoll, die reproduzierbar und damit auch skalierbar sind. Dennoch kann die Technologie theoretisch auch jetzt schon mehr als das und sie wird ständig weiter verbessert und erweitert. Künstliche Intelligenz und Machine Learning versprechen dabei großes Entwicklungspotenzial. So gelang es beispielsweise IBM mit dem Computerprogramm Watson bereits 2016 ein ganzes Magazin zu gestalten. Sind wir also schon so weit, dass Computer den Menschen das Schreiben vollkommen abnehmen können? Wohl kaum. Werden sie es irgendwann sein? Vielleicht.

Hätte vor einigen hundert Jahren jemand den Menschen erzählt, dass wir einmal mit Autos fahren oder mit Flugzeugen um die Welt fliegen werden, hätte uns keiner geglaubt. Ebenso wenn wir nur 30 Jahre zurückgehen: Kaum jemand hätte sich vorstellen können, was das Internet heute alles kann oder dass Smartphones entwickelt werden und zu unserem ständigen Begleiter werden. Zukunftsforscher halten daher zu Recht nichts von Unmöglichkeitsprognosen. Es geht also nicht darum, ob eine Innovation entwickelt wird, sondern es geht um das Wann. So unwahrscheinlich ist es also nicht, dass die computergenerierten Texte auch irgendwann die Literatur oder die Wissenschaft verändern – vor allem wenn man bedenkt, wie viele Unternehmen und Forscher, an der Weiterentwicklung der Technologie arbeiten. Welche Auswirkungen das dann hat, steht auf einem anderen Blatt.

Spielt man diese Szenarien weiter, hat die Technologie rund um die automatische Texterstellung enormes ökonomisches Potenzial und könnte mit einem kreativen, analytischen und intelligenten Algorithmus viele Branchen auf den Kopf stellen.

Chancen und Risiken: Was bedeutet das für die Welt der Texte?

Ob im Journalismus oder in der Unternehmenskommunikation – computergenerierte Texte verändern viele Arbeitsabläufe, erleichtern manche Dinge, bieten Mehrwert, sind aber auch Konkurrenz und können missbraucht werden. Die Technologie mit ihrem möglichen Entwicklungspotenzial bietet richtig eingesetzt enormes Potenzial, bringt aber auch Risiken mit sich, die es zu beachten gilt.

So sind mit der automatisierten Textgenerierung ganz neue Contentstrategien möglich. Inhalte können beispielsweise, wie oben angesprochene Beispiel der Berliner Morgenpost zeigt, regelmäßig automatisch aktualisiert werden – ganz ohne das Zutun eines Menschen. Möglich ist es darüber hinaus, ohne viel Aufwand individuellen Content für jeden Nutzer generieren zu lassen. Und auch Texte, die on demand benötigt werden, können in Echtzeit erstellt werden und so beispielsweise in Chat Bots eingesetzt werden. Damit nehmen Bots Menschen häufig Arbeit ab, schaffen jedoch auch neue Möglichkeiten der Redaktion, die händisch gar nicht zu stemmen wären, wie beispielsweise das Wetterangebot der Stuttgarter Zeitung.

Durch die Technologie haben Redakteure und Mitarbeiter von Unternehmen mehr Zeit für andere Themen, können sich beispielsweise Zeit für ausführlichere Recherchen nehmen. Dabei kommt gerade im Journalismus häufig das Angstargument auf, Bots könnten die menschlichen Redakteure ersetzen. Derzeit sieht es jedoch nicht danach aus. Die Technik ist nicht soweit, dass sie eine investigative Recherche, eine Reportage, ein Interview, eine Einordnung oder einen Kommentar selbstständig umsetzen könnte – und wenn es irgendwann soweit ist, muss man sich die Frage stellen, ob es sinnvoll ist. Bisher sind sich Experten daher einig, dass die vom Computer erstellten Artikel nur eine Ergänzung des Angebots einer Medienmarke sein können.

In den falschen Händen kann die automatisierte Texterstellung jedoch auch zum Problem werden. Bereits jetzt sind beispielsweise „Fake News“ in aller Munde und ein großes Problem im Netz. Werden diese dann auch noch sekundenschnell mit dem Computer generiert, kann die Zahl der Falschmeldungen schnell ins unermessliche steigen. Lösungen gibt es hier – außer dem zeitnahen Löschen – bisher nicht.

Alles in allem macht es sicher Sinn, dass sich Unternehmen und Medien von Bots unter die Arme greifen lassen. Gerade in Bereichen mit großen Mengen an reproduzierbaren und skalierbaren Texten, die auf strukturierten Daten basieren. Dabei haben sie einige Vorteile gegenüber menschlichen Autoren: Sie sind günstiger, effizienter und machen keine Fehler. Richtig eingesetzt bieten sie darüber hinaus einen großen Mehrwert für die Leser, die den Bots bisher auch nicht abgeneigt gegenüber treten – viele erkennen die automatisiert generierten Texte erst gar nicht als solche. Eine Studie der LMU München kam zudem zu dem Ergebnis, dass Leser handgeschriebene Artikel zwar lieber konsumieren, den computergeschriebenen allerdings mehr Glaubwürdigkeit zugeschrieben wird.

Wie oben angedeutet ist eine stetige Weiterentwicklung der Technologie keinesfalls unwahrscheinlich, sodass der Algorithmus irgendwann bereit ist, auch in der Literatur oder sogar bei wissenschaftlichen Publikationen eingesetzt werden könnte. Dabei ist es ratsam, mögliche Einsatzgebiete mit ihren Risiken gut zu durchdenken und immer die Sinnhaftigkeit im Blick zu behalten.

 

Literaturverzeichnis

Graefe, A. (2016). Guide to Automated Journalism. Columbia University Academic Commons,

https://doi.org/10.7916/D80G3XDJ.

Graefe, A., Haim, M., Haarmann, B. & Brosius, H.-B. (2016). Readers’ perception of computer-generated

news: Credibility, expertise, and readability. LMU München, https://doi.org/10.1177/1464884916641269

Reichelt, P. (2017): Einführung in den Roboterjournalismus. Bedrohung oder Chance? Baden Baden:

Tectum Verlag.

Weitere Quellen:

AX Semantics (2017). Homepage. Abgerufen am 6. Januar 2018 von https://www.ax-semantics.com/de

Deutscher Journalisten-Verband (13. Oktober 2016). Roboter-Journalismus. Wenn Computer Texte liefern.

Abgerufen am 6. Januar von https://www.djv.de/startseite/service/news-kalender/detail/aktuelles/article/wenn-computer-texte-liefern.html

Flessner, B. (31. März 2016). Wenn Algorithmen Dichter werden. Neue Züricher Zeitung. Abgerufen am 6.

Januar 2018 von https://www.nzz.ch/feuilleton/schauplatz/kommt-die-zeit-der-computergenerierten-literatur-wenn-algorithmen-dichter-werden-ld.10562

Meier, C. (11. Mai 2017). Knackt künstliche Intelligenz die Magie der Sprache? Die Welt. Abgerufen am 6.

Januar 2018 von https://www.welt.de/kultur/article164449418/Knackt-kuenstliche-Intelligenz-die-Magie-der-Sprache.html

Retresco (2018). Homepage. Abgerufen am 6. Januar 2018 von https://www.retresco.de/

Ulanoff, L. (2. Juli 2014). Need to write 5 million stories a week? Robot reporters to the rescue. Mashable.

Abgerufen am 6. Januar 2018 von: http://Mashable.Com/2014/07/01/Robot-Reporters-Add-Data-To-The-Five-Ws/

Universität München(28. April 2016). Wenn Algorithmen schreiben. Abgerufen am 6. Januar 2018 von

https://www.uni-muenchen.de/forschung/news/2016/graefe_studiejournalismus.html