Mensch und Maschine

Künstliche Intelligenz auf dem Vormarsch in der Wissensarbeit

Digitalisierung hat Mediennutzung und Medienproduktion geprägt. Offensichtlich. Jetzt beginnt Künstliche Intelligenz, KI, die Medienarbeit und das Medienschaffen zu verändern. In der öffentlichen Diskussion und im politischen Diskurs überwiegt oft die angenommene Konkurrenz von Mensch und Maschine. Das kann manchmal dazu führen, eine Bestandsgarantie für Fließbandtätigkeiten in der Produktion, aber auch in der Wissensarbeit zu fordern, wobei wir doch viel interessantere Ergebnisse erzielen, wenn wir die maschinellen Vorteile mit den menschlichen Begabungen verbinden. So ist das auch mit der Nutzung von KI für Journalistinnen und Journalisten.

Mensch und Maschine sind keine Konkurrenten, sie stehen nicht auf gegenüberliegenden Seiten. Sie sind Komplementäre und arbeiten im gleichen Team. Matthias Horx trifft einen interessanten Punkt, wenn er vom „humanen Minderwertigkeitskomplex” spricht, der den Blick verstellt für unsere eigentlichen Fähigkeiten. Unsere emotionale Intelligenz erschließt uns das Gegenüber, die soziale Intelligenz die Gruppe und mit unseren sensomotorischen Fähigkeiten ertasten und gestalten wir die dingliche Welt. In diesen Dimensionen der Intelligenz haben Menschen eine erstaunlich überlegene Meisterschaft. Wir sind zu Recht stolz, aber oft auch einseitig fokussiert auf unsere kognitiven Erfolge. Auf die Analyse, die faktische Weltdurchdringung und die stetig wachsende Erkenntnistiefe. Die smarte Analyse großer Datenräume in extrem kurzer Zeit ist allerdings nicht die größte menschliche Begabung, sondern die Domäne der Maschine. Deshalb ist das eigentliche Thema nicht Verdrängungswettbewerb, sondern Mensch-Maschine-Kollaboration – nicht nur in der industriellen Produktion, sondern auch in der kreativen Wissensarbeit.

KI im Alltag

Foto: 123rf

Wir finden heute KI-Ergebnisse in vielen alltäglichen Anwendungen. In der Waschmaschine, um mit weniger Wasser besser zu waschen. In biometrischen Systemen, die die Stimme oder den Fingerabdruck erkennen. Im Einpark- und Spurhalteassistenten und in den meisten Hilfen, die das Fahren sicherer machen, und natürlich in allen Systemen, die das automatisierte und experimentell das autonome Fahren ermöglichen werden. In fahrerlosen Transportsystemen für die Logistik, in jedem Rasenmäh- oder Staubsaugerroboter. In jeder Handschrifterkennung, jedem OCR-System, in der Adresserkennung, um bei der Post die Briefe schneller zu sortieren. In dem Spam-Filter, der nicht nur auf Schlüsselwörter reagiert, sondern vom Benutzer trainiert wird und so tatsächlich Werbung von Wichtigem unterscheiden kann. In der forensischen Textanalyse, die den Anwälten und Staatsanwälten hilft, die Widersprüche zu finden, auf die kein Mensch jemals gekommen wäre. Und auch in jedem Marsroboter.

Das Konzept des KI-Werkzeugs ist natürlich deutlich weniger spektakulär als die unselige Vorstellung der seelenlosen „KI” als halb-personales Maschinenwesen in Hollywood-Blockbustern. KI-Ergebnisse in Werkzeugen machen diese besser, nützlicher und damit den Menschen handlungsfähiger. Allerdings haben die aufwändigeren Wissenswerkzeuge oft noch einen prototypischen Charakter, aber angesichts der rasanten Entwicklung der letzten 10 Jahre ist Optimismus angebracht. Den Reporter unterstützt KI nicht nur mit dem Navigationssystem bei der Zielfindung, daran hat man sich nun wirklich gewöhnt, sondern mittlerweile auch mit immer besser werdender Sprachtechnologie. Mit Diktiersystemen, die man ortsunabhängig nutzen kann, um die aktuellen Ideen nicht auf ein Band, sondern direkt in den Computer bzw. ins Smartphone zu sprechen – noch nicht fehlerfrei, aber auch nicht mehr voller Fehler. Im nächsten Schritt wird der Wissensdialog im Auto möglich. Wissenschaftlich gesehen könnte man auch heute schon während der Fahrt mit Wikipedia sprechen. Jetzt müssen die technischen Abläufe und die Schnittstellen im Auto noch so standardisiert werden, dass man den Blick auf der Straße und die Hände am Steuer lassen kann. Was könnte das bringen? Die Beantwortung von Wissensfragen zu faktischen Zusammenhängen oder zu aktuellen Geschehnissen oder den Zugriff auf statistische Information. Man könnte noch während der Fahrt am Faktencheck arbeiten. Könnte seine ersten Eindrücke, Schlussfolgerungen und Gedanken diktieren und im Nachgang den Text fertig stellen. Das macht die Produktion effizienter und die Qualität besser, denn oft hat man nach einem Termin Geistesblitze, die sich verflüchtigen, wenn man sie nicht unmittelbar festhält.

Spracherkennung hat Grenzen. Die automatisierte Transkription eines Interviews ist deutlich komplexer und erfordert von den Teilnehmern bei dem Gespräch mehr Disziplin. Und wie bei jedem anderen Werkzeug auch, muss man sich auf die Handhabung einlassen. Das schriftliche Ergebnis liegt zwar schneller vor. Aber der Spracherkenner liefert nicht das fertige Interview, nur eine Rohversion, die der Journalist zu einem Interview weiter verarbeiten muss. Während er die Aufnahme hört, kann sich der Redakteur mit dem Rohtext vor Augen aber besser auf die satzmelodischen Feinheiten konzentrieren und wird weniger oft unterbrochen, weil er das Gespräch nicht mehr mühsam verschriftlichen muss. Spracherkennung hilft, näher an den Inhalten zu bleiben.

Roboterjournalismus

KI liefert Komponenten und Wissenswerkzeuge. Digitale Kuratierung unterstützt bei Auswertung und Aufbereitung. Dabei geht es um Sprach- und Wissenstechnologien, die die effiziente Verarbeitung, Erstellung und Verteilung von Medieninhalten in mehreren Dimensionen und Workflows unterstützen können. Informationsextraktion hilft bei der Recherche. Relationsextraktion beschleunigt die Datenerschließung. Der Faktencheck wird nicht automatisiert, aber er bekommt mit weniger Aufwand eine breitere Basis. Das Zusammenfassen von Texten hilft Autor_innen und Leser_innen, die Relevanz von Inhalten schneller beurteilen zu können. Das automatische Glossar kann die Verwendung von Begriffen für sich, aber auch die in der Redaktion verwendete Terminologie harmonisieren. Das automatische Hyperlinking verbindet Texte mit Quellen und Begriffe mit Beispielen. Die automatische Analyse von Zeitausdrücken in einem Dokument kann helfen, die Chronologie der Ereignisse auf einen kompakten Zeitstrahl zu übertragen. Die automatische Erzeugung von Tabellen aus Fließtext kann das Verständnis der enthaltenen Daten durch eine übersichtliche Darstellung der Kernfakten erleichtern. Und Sprachtechnologie hilft, Sprachgrenzen durchlässiger zu machen. Selbstverständlich ist die Maschinelle Übersetzung noch nicht perfekt, aber sie ermöglicht einen relevanten ersten Eindruck.

Natürlich kann man die Textproduktion teil- oder vollautomatisieren. Roboterjournalismus ist die maschinelle Erzeugung natürlichsprachlicher Texte aus Datenbanken und je strukturierter die Information, desto höher ist die Chance, die Erstellung von Artikeln zu automatisieren. Manche Themen eigenen sich besonders: Sport, Wetter, Börse. So könnte man aus meteorologischen Daten maschinell hyperlokale Wetterberichte erzeugen, aus aktuellen Börsendaten Echtzeit-Artikel über einzelne Aktien oder eben lokale Sportberichte. Die Ansammlung von faktischen Informationen ist hoch, die Texte sind weitgehend standardisiert, die Lesegewohnheiten bzw. -erwartungen sind bekannt. Im Ergebnis wird man mehr Leser_innen haben. Roboterjournalismus verursacht kaum Grenzkosten und kann zur Demokratisierung von Berichterstattung beitragen, kann neue publizistische Räume eröffnen, denn plötzlich erscheinen Online-Artikel über lokale Bezirksligaspiele. Das interessiert Spieler und Eltern. Aber aus nachvollziehbaren Kostengründen hätte kein Medium über diese Begegnungen berichtet. Roboterjournalismus kann neue Lesergruppen erschließen, ohne Journalist_innen Arbeit wegzunehmen.

Reinhard Karger, Deutsches Forschungszentrum für künstliche Intelligenz
Foto: Jan-Timo Schaube

KI-Werkzeuge beschränken sich nicht nur auf Sprache. Fotograf_innen profitieren vom intelligenten Autofokus, der auf die Gesichter scharf stellt und nicht auf den Hintergrund zwischen den beiden Hauptpersonen. Deshalb können heute viele Laien Fotos machen, die korrekt belichtet sind. Aber Fotos sind nicht primär scharf, sondern zuallererst zeigen sie ein Motiv und es ist verblüffend, wie groß der Unterschied im Ergebnis ist bei einem geschulten und einem nicht geschulten Auge. Mit dem Resultat, dass bei dem Profi das Foto eine Bildaussage hat. Bei dem Prosumer stimmt zwar die Ausrüstung, aber trotzdem konterkariert der Feuerlöscher, der WC-Hinweis oder das Notausgangsschild im Hintergrund den friedlichen Händedruck der Protagonisten. KI kann aber auch helfen, in sehr großen Bildserien die Auswahl zu beschleunigen, bzw. die Menge der Motivkandidaten so zu verringern, dass der Fotograf schneller das eine Foto identifiziert, mit dem er wirklich zufrieden ist.

Bilder mit Wörtern finden

Der Bildjournalist findet bei seiner Motivsuche immer öfter die passenden Fotos in automatisch verschlagworteten Bilddatenbanken. Die Schlagworte passen nicht perfekt, aber die Ergebnisse der Bildverarbeitung werden besser. Die extremen Fortschritte der letzten Jahre in der Mustererkennung liegen vor allem an der Verwendung von Neuronalen Netzen und Deep Learning. Künstliche Neuronale Netze bestehen natürlich nicht aus biologischen Neuronen, sondern sind im Wesentlichen mehrfach geschichtete Lagen von sehr vielen vernetzten gewichteten Automaten.

In unserem Deep Learning Kompetenzzentrum arbeiten wir an Sentiment-Analyse, an der Erkennung des Gemütszustands. So kann man in Bildarchiven nicht nur Fotos von Objekten finden, „Hund”, „Auto”, „Kind”, sondern auch Adjektiv-Nomen-Paare, also „kleiner Hund”, „sauberes Auto” oder „glückliches Kind”. Sentiment-Analyse für Texte wird eingesetzt für Social Media Monitoring und erleichtert die Entdeckung nicht nur von Trends, sondern auch von speziellen Einzelfundstücken. Durch die Kombination von visueller und textueller Analyse lassen sich Tweets oder Posts mit Text-Bild Scheren identifizieren. So findet man leichter Beispiele, bei denen das Geschriebene nicht dem Gezeigten entspricht und das Gemeinte möglicherweise eine Nachricht ist.

Mögliches und Wünschbares

Der Musikredakteur wird auch heute schon bei der Erstellung von Playlisten unterstützt. Aber KI kann die Ergebnisse besser machen. Man wird Klänge auch automatisch erzeugen und das Ergebnis ist vielleicht nicht Musik, aber „Audials” vergleichbar zu „Visuals”. Natürlich könnte man den Nachrichtensprecher durch einen virtuellen Präsentationsagenten ersetzen. Die Sprachsynthese, die künstliche Stimme, ist mittlerweile verständlich. Aber sie klingt nicht natürlich. Und eignet sich im Radio für die automatisierte Ansage von Wasserstandsmeldungen oder den Tidenhub, für den lokalen Wetterbericht. Der TV-Zuschauer würde die Nachricht hören und sehen, aber die Welt nicht mehr verstehen. Die künstliche Mimik eines virtuellen oder robotischen Sprechers ist mit weitem Abstand nicht mit der menschlichen vergleichbar. Der größte Unterschied sind aber letztendlich die Augen. Nachrichtensprecherinnen und Nachrichtensprecher haben natürlich ein eher neutrales Auftreten, sind aber dennoch empathisch, weil Menschen empathisch sind. Virtuelle oder robotische Charaktere können nie wirklich empathisch sein und auch ihre „Emotionen” sind nur simuliert und nicht gelebt. Das mag für Computerspiele oder Trainingszwecke durchaus ausreichen, aber nicht mehr für die Meldungen zu den Geschehnissen in der Welt, bei denen es gerade darauf ankommt, dass die Anteilnahme, vielleicht nur zurückgenommen sichtbar, aber dennoch sehr real ist. Berichterstattung ist eben nicht nur faktisch, sondern atmosphärisch. Maschinen sind sehr gut mit Fakten und sehr schlecht bei Atmosphäre. Der Kommentar ordnet ein, schaut in die Kamera und der Zuschauer hört die Gedanken, sieht die Reaktion dieses Menschen und kann sich daran reiben oder zustimmen. Man sieht die Lage – vielleicht auch mit den Augen des Journalisten.

KI kann mit konkreten Werkzeugen Medienschaffende konkret unterstützen. Aber diese Werkzeuge werden in der Regel nicht speziell für Journalisten entwickelt. Es sind Wissenswerkzeuge für Wissensarbeit. Im Erfolgsfall unterstützen sie den Journalisten effizient, erhöhen Produktivität und Qualität. Jedoch ersetzen sie nicht seine Kreativität. Wie müssten diese Werkzeuge ausgestaltet sein, damit sie sich optimal für die journalistische Arbeit und den Redaktionsalltag eignen? Die Wissenschaft ist auskunftsfähig und dialogbereit. Lassen Sie uns reden!


Über den Autor

Reinhard Karger (1961), M.A., hat in Wuppertal theoretische Linguistik studiert (mit Schwerpunkt Syntax). Ab 1991 war er Assistent am Lehrstuhl Computerlin­guistik der Universität des Saarlandes, bevor er 1993 zum Deutschen Forschungszentrum für Künstliche Intelligenz, DFKI, in Saarbrücken wechselte, für das er bis heute arbeitet, seit 2011 als Unternehmenssprecher.


Quellen

http://dl.dfki.de

http://www.sentibank.org

http://digitale-kuratie­rung.de

http://smartdataforum.de

Reinhard Karger referierte auf dem 30. Journalistentag der ver.di-Medienschaffenden 2017 in Berlin über „Roboterjournalismus und Datensicherheit!”

 

 

nach oben

Weitere aktuelle Beiträge

Die Zukunft der Filmförderung

In der morgigen Plenarsitzung des Bundestages wird über die Zukunft der deutschen Filmwirtschaft entschieden, der vom Bundestagsausschuss für Kultur und Medien beschlossene Gesetzentwurf zum Filmfördergesetz (FFG) steht zur Abstimmung auf der Tagesordnung. ver.di begrüßt eine Reform der Filmförderung, denn in Zukunft müssen Filmproduktionen Tarif- und Urheber-Vergütungen verbindlich einhalten.
mehr »

Rundfunkreform mit vielen Fragezeichen

Bis zuletzt hatten die öffentlich-rechtlichen Anstalten auf ein Ende der Blockade einer Beitragserhöhung durch die Ministerpräsidenten der Länder gehofft. Die Verweigerungshaltung der Politik ließ ihnen am Ende keine Wahl: Am 19. November kündigten ARD und ZDF eine Klage beim Bundesverfassungsgericht an, um ihren Anspruch auf die von der Kommission zur Ermittlung des Finanzbedarfs (KEF) errechnete Empfehlung einer Beitragserhöhung um 58 Cent auf 18,94 Euro monatlich durchzusetzen.
mehr »

Audiodeskription: Die KI liest vor

Die Hälfte der öffentlich-rechtlichen Sender verwendet inzwischen auch synthetische oder mit Künstlicher Intelligenz (KI) generierte Stimmen, um für Fernsehformate Audiodeskriptionen zu erstellen. Das ergibt sich aus Nachfragen von M bei den neun ARD-Landesrundfunkanstalten und beim ZDF. Neben professionellen Sprecher*innen setzen der MDR, WDR, NDR, Radio Bremen und das ZDF auch auf synthetische oder KI-Stimmen für die akustische Bildbeschreibung.
mehr »

Gendergerechtigkeit per KI überprüfen

Ein Gender-Analyse-Tool der Technischen Universität München zeigt, wie Frauen medial ausgeklammert werden. Das Ziel vom  Gender Equality Tech Tool – GETT  ist es, die Sichtbarkeit von Frauen in der Berichterstattung bewusst zu fördern. Mit GETT kann über eine Kombination aus klassischen Algorithmen und Open-Source-KI-Modellen nachgeprüft werden, wie oft Frauen im Vergleich zu Männern in den Medien genannt und wie sie dargestellt werden.
mehr »