Recherchieren mit Maschinen

#krassmedial: Journalist Peter-Welchering vermittelte seine Expertise über das Recherchieren mit KI Foto: Charles Yunck

Nie mehr Angst vor dem leeren Blatt. Wie KI-Tools die journalistische Recherche und Themenfindung unterstützen können, stellte der Journalist Peter Welchering in seinem Workshop „KI recherchier das mal!“ vor. Auch die Funktionsweise von neuronalen Netzen und Fragen nach der Kontrolle von KI-Tools und deren Integration kamen zur Sprache.

Zum Einstieg in seinen Workshop griff Welchering ein prominentes Beispiel für mangelnde Recherche und die Nutzung eines eher schlechten Übersetzungstools auf. Der US-Journalist Seymour Hersh berichtete über die mutmaßliche Urheberschaft der im September 2022 erfolgten Explosionen an den Gaspipelines Nord Stream 1 und 2. Ein Faktenfinder der Tagesschau warf ihm in dem Beitrag vom Februar 2023 Unstimmigkeiten vor. Der Vorwurf beruhte jedoch auf einem einfachen Übersetzungsfehler. Offenbar war ein unausgereiftes Übersetzungstool benutzt worden, das das englische Verb plant („platzieren“) in der deutschen Übersetzung fälschlicherweise als Nomen („Pflanze“) interpretierte und so zu unsinnigen Spekulationen über „pflanzenförmigen“ Sprengstoff führte. In diesem Fall hätte also ein Blick in den englischen Originaltext genügt. Welcherings simpler Tipp: „Einfach den Link anklicken, der als Quelle genannt wird“. Denn oft liege der Fehler gar nicht bei der KI, sondern beim anwendenden Menschen.

Das Beispiel zeigte jedoch auch, dass man sich lieber auf ausgereiftere Übersetzungstools verlassen sollte als etwa auf Google Translate. Es arbeitet zwar bereits mit neuronalen Netzen, Tools wie DeepL erzielen aber bessere Ergebnisse mit dem Einsatz sogenannter Transformer. Dabei werden bestimmte Werte im neuronalen Netz verstärkt, nur was gewichtet wird, wird dann auch weiterverarbeitet. Dank Domänenwissens können Worte passender vervollständigt und bessere Ergebnisse geliefert werden. Weitere Beispiele für Übersetzungstools sind trint, promt.one, Microsoft Translator oder Yandex. Letzteres liefere zwar gute Ergebnisse, das Unternehmen hat seinen Hauptsitz allerdings in Moskau. Man müsse sich darauf einstellen, dass bestimmte Begriffe regierungskonform übersetzt werden. Aus dem Wort für „Krieg“ wird dann etwa „Spezialoperation“, wenn es um den derzeitigen Krieg in der Ukraine geht.

Für die Reverse bzw. Rückwärtsbildersuche könne man unter anderem die Tools TinEye, Google, Yandex und RootAbout nutzen. Letzteres empfehle sich vor allem für die Suche in sozialen Netzwerken. Bilder zu Recherchezwecken verändern, aber auch neue erstellen lassen sich zum Beispiel mit Artbreeder.

Generell gibt es für die Recherche zahlreiche bessere Suchmaschinen als Google. Die 2009 lancierte semantische Suchmaschine WolframAlpha kann Fragen beantworten. Ihre Datenbasis bezieht sie von akademischen und kommerziellen Webseiten. Die Wissenschaftssuchmaschine Consensus ist evidenzbasiert und kann auch im Journalismus genutzt werden. Die Quellen sind von Menschen überprüft. Mit Quellenreferenzierung in verschiedenen Wissensdomänen arbeitet auch IntelligenceX, eine Suchmaschine und ein Datenarchiv, das nur Fakten aus der eigenen Datenbank nutzt und selbst von IT-Forensiker*innen verwendet wird. Perplexity ist ein Chatbot mit Quellenreferenzierung. Mit Vorsicht zu genießen sei hingegen die Microsoft-Suchmaschine Bing, die einen Vertrag mit Open AI hat. Man versuche sich dort in Quellenreferenzierung, Quellen würden aber nicht überprüft. Bei anderen bekannten Chatbots wie Googles Bard und ChatGPT von Open AI fehle die Quellenreferenzierung noch.

SciSpace von Typeset kann wissenschaftliche PDFs durchsuchen und sogar Fachbegriffe erläutern. AskYourPDF kann ebenfalls für die Suche in PDFs genutzt werden. Mit Pinpoint lassen sich zudem Audio-Dateien durchsuchen, allerdings gehen die Daten an Google. Automated Insights ist sogar für die Suche im Archiv auf der eigenen Festplatte einsetzbar, Narrativa und United Robots ebenso; letzteres dient auch der Texterstellung. Syllabs wiederum kann Zusammenfassungen aus Studien erstellen, sei Welchering zufolge aber nicht immer vertrauenswürdig.

Um zu wissen, welche Themen gerade hohe Relevanz haben, könne man zum Beispiel Dataminr nutzen, allerdings sei die ausgegebene Gewichtung nicht immer nachvollziehbar. So reiche es etwa, wenn nur wenige Personen ausgiebig über ein Thema chatten. Mit Glasp lassen sich Texte auf Webseiten markieren und Clustern zuordnen.  Bewusst sollte man sich dessen sein, wie diese Tools funktionieren. Sprache etwa wird in Zahlen umgewandelt, jedes Wort bekommt im semantischen Raum eine bestimmte Stelle zugewiesen, die schließlich durch einen Vektor abgebildet wird. Je nach Aufmerksamkeit können Vektoren einen höheren Wert erhalten. Wichtige Fragen sind, mit welchen Daten die KI-Programme trainiert werden, auf welche Archive sie zurückgreifen dürfen, wer die Bedeutung einzelner Worte bzw. Daten festlegt und wie bestimmte Entscheidungspfade durch Verstärkung festgelegt werden. Welchering wies zudem darauf hin, dass ein Problem darstelle, wie die KI-Tools jeweils in Schnittstellen integriert werden sollen, welche Datenformate standardisiert werden und welche nicht. Da bedürfe es einer Regulierung.

Abschließend warf Welchering die Frage auf, ob Tutor-Chatbots, die derzeit an Universitäten entwickelt werden, auch als Geschäftsmodell für den Fachjournalismus dienen könnten.

Hier ein „Werkzeugkasten“ mit allen in diesem Fokus genannten Tools und deren Links.

 

 

nach oben

Weitere aktuelle Beiträge

Die Zukunft der Filmförderung

In der morgigen Plenarsitzung des Bundestages wird über die Zukunft der deutschen Filmwirtschaft entschieden, der vom Bundestagsausschuss für Kultur und Medien beschlossene Gesetzentwurf zum Filmfördergesetz (FFG) steht zur Abstimmung auf der Tagesordnung. ver.di begrüßt eine Reform der Filmförderung, denn in Zukunft müssen Filmproduktionen Tarif- und Urheber-Vergütungen verbindlich einhalten.
mehr »

Rundfunkreform mit vielen Fragezeichen

Bis zuletzt hatten die öffentlich-rechtlichen Anstalten auf ein Ende der Blockade einer Beitragserhöhung durch die Ministerpräsidenten der Länder gehofft. Die Verweigerungshaltung der Politik ließ ihnen am Ende keine Wahl: Am 19. November kündigten ARD und ZDF eine Klage beim Bundesverfassungsgericht an, um ihren Anspruch auf die von der Kommission zur Ermittlung des Finanzbedarfs (KEF) errechnete Empfehlung einer Beitragserhöhung um 58 Cent auf 18,94 Euro monatlich durchzusetzen.
mehr »

Audiodeskription: Die KI liest vor

Die Hälfte der öffentlich-rechtlichen Sender verwendet inzwischen auch synthetische oder mit Künstlicher Intelligenz (KI) generierte Stimmen, um für Fernsehformate Audiodeskriptionen zu erstellen. Das ergibt sich aus Nachfragen von M bei den neun ARD-Landesrundfunkanstalten und beim ZDF. Neben professionellen Sprecher*innen setzen der MDR, WDR, NDR, Radio Bremen und das ZDF auch auf synthetische oder KI-Stimmen für die akustische Bildbeschreibung.
mehr »

Gendergerechtigkeit per KI überprüfen

Ein Gender-Analyse-Tool der Technischen Universität München zeigt, wie Frauen medial ausgeklammert werden. Das Ziel vom  Gender Equality Tech Tool – GETT  ist es, die Sichtbarkeit von Frauen in der Berichterstattung bewusst zu fördern. Mit GETT kann über eine Kombination aus klassischen Algorithmen und Open-Source-KI-Modellen nachgeprüft werden, wie oft Frauen im Vergleich zu Männern in den Medien genannt und wie sie dargestellt werden.
mehr »