Recherchieren mit Maschinen

#krassmedial: Journalist Peter-Welchering vermittelte seine Expertise über das Recherchieren mit KI Foto: Charles Yunck

Nie mehr Angst vor dem leeren Blatt. Wie KI-Tools die journalistische Recherche und Themenfindung unterstützen können, stellte der Journalist Peter Welchering in seinem Workshop „KI recherchier das mal!“ vor. Auch die Funktionsweise von neuronalen Netzen und Fragen nach der Kontrolle von KI-Tools und deren Integration kamen zur Sprache.

Zum Einstieg in seinen Workshop griff Welchering ein prominentes Beispiel für mangelnde Recherche und die Nutzung eines eher schlechten Übersetzungstools auf. Der US-Journalist Seymour Hersh berichtete über die mutmaßliche Urheberschaft der im September 2022 erfolgten Explosionen an den Gaspipelines Nord Stream 1 und 2. Ein Faktenfinder der Tagesschau warf ihm in dem Beitrag vom Februar 2023 Unstimmigkeiten vor. Der Vorwurf beruhte jedoch auf einem einfachen Übersetzungsfehler. Offenbar war ein unausgereiftes Übersetzungstool benutzt worden, das das englische Verb plant („platzieren“) in der deutschen Übersetzung fälschlicherweise als Nomen („Pflanze“) interpretierte und so zu unsinnigen Spekulationen über „pflanzenförmigen“ Sprengstoff führte. In diesem Fall hätte also ein Blick in den englischen Originaltext genügt. Welcherings simpler Tipp: „Einfach den Link anklicken, der als Quelle genannt wird“. Denn oft liege der Fehler gar nicht bei der KI, sondern beim anwendenden Menschen.

Das Beispiel zeigte jedoch auch, dass man sich lieber auf ausgereiftere Übersetzungstools verlassen sollte als etwa auf Google Translate. Es arbeitet zwar bereits mit neuronalen Netzen, Tools wie DeepL erzielen aber bessere Ergebnisse mit dem Einsatz sogenannter Transformer. Dabei werden bestimmte Werte im neuronalen Netz verstärkt, nur was gewichtet wird, wird dann auch weiterverarbeitet. Dank Domänenwissens können Worte passender vervollständigt und bessere Ergebnisse geliefert werden. Weitere Beispiele für Übersetzungstools sind trint, promt.one, Microsoft Translator oder Yandex. Letzteres liefere zwar gute Ergebnisse, das Unternehmen hat seinen Hauptsitz allerdings in Moskau. Man müsse sich darauf einstellen, dass bestimmte Begriffe regierungskonform übersetzt werden. Aus dem Wort für „Krieg“ wird dann etwa „Spezialoperation“, wenn es um den derzeitigen Krieg in der Ukraine geht.

Für die Reverse bzw. Rückwärtsbildersuche könne man unter anderem die Tools TinEye, Google, Yandex und RootAbout nutzen. Letzteres empfehle sich vor allem für die Suche in sozialen Netzwerken. Bilder zu Recherchezwecken verändern, aber auch neue erstellen lassen sich zum Beispiel mit Artbreeder.

Generell gibt es für die Recherche zahlreiche bessere Suchmaschinen als Google. Die 2009 lancierte semantische Suchmaschine WolframAlpha kann Fragen beantworten. Ihre Datenbasis bezieht sie von akademischen und kommerziellen Webseiten. Die Wissenschaftssuchmaschine Consensus ist evidenzbasiert und kann auch im Journalismus genutzt werden. Die Quellen sind von Menschen überprüft. Mit Quellenreferenzierung in verschiedenen Wissensdomänen arbeitet auch IntelligenceX, eine Suchmaschine und ein Datenarchiv, das nur Fakten aus der eigenen Datenbank nutzt und selbst von IT-Forensiker*innen verwendet wird. Perplexity ist ein Chatbot mit Quellenreferenzierung. Mit Vorsicht zu genießen sei hingegen die Microsoft-Suchmaschine Bing, die einen Vertrag mit Open AI hat. Man versuche sich dort in Quellenreferenzierung, Quellen würden aber nicht überprüft. Bei anderen bekannten Chatbots wie Googles Bard und ChatGPT von Open AI fehle die Quellenreferenzierung noch.

SciSpace von Typeset kann wissenschaftliche PDFs durchsuchen und sogar Fachbegriffe erläutern. AskYourPDF kann ebenfalls für die Suche in PDFs genutzt werden. Mit Pinpoint lassen sich zudem Audio-Dateien durchsuchen, allerdings gehen die Daten an Google. Automated Insights ist sogar für die Suche im Archiv auf der eigenen Festplatte einsetzbar, Narrativa und United Robots ebenso; letzteres dient auch der Texterstellung. Syllabs wiederum kann Zusammenfassungen aus Studien erstellen, sei Welchering zufolge aber nicht immer vertrauenswürdig.

Um zu wissen, welche Themen gerade hohe Relevanz haben, könne man zum Beispiel Dataminr nutzen, allerdings sei die ausgegebene Gewichtung nicht immer nachvollziehbar. So reiche es etwa, wenn nur wenige Personen ausgiebig über ein Thema chatten. Mit Glasp lassen sich Texte auf Webseiten markieren und Clustern zuordnen.  Bewusst sollte man sich dessen sein, wie diese Tools funktionieren. Sprache etwa wird in Zahlen umgewandelt, jedes Wort bekommt im semantischen Raum eine bestimmte Stelle zugewiesen, die schließlich durch einen Vektor abgebildet wird. Je nach Aufmerksamkeit können Vektoren einen höheren Wert erhalten. Wichtige Fragen sind, mit welchen Daten die KI-Programme trainiert werden, auf welche Archive sie zurückgreifen dürfen, wer die Bedeutung einzelner Worte bzw. Daten festlegt und wie bestimmte Entscheidungspfade durch Verstärkung festgelegt werden. Welchering wies zudem darauf hin, dass ein Problem darstelle, wie die KI-Tools jeweils in Schnittstellen integriert werden sollen, welche Datenformate standardisiert werden und welche nicht. Da bedürfe es einer Regulierung.

Abschließend warf Welchering die Frage auf, ob Tutor-Chatbots, die derzeit an Universitäten entwickelt werden, auch als Geschäftsmodell für den Fachjournalismus dienen könnten.

Hier ein „Werkzeugkasten“ mit allen in diesem Fokus genannten Tools und deren Links.

 

 

nach oben

Weitere aktuelle Beiträge

Nicaraguas bedrohte Medien

Die Diktatur des nicaraguanischen Präsidentenpaars Daniel Ortega und Rocio Murillo hat in den letzten Jahren immer mehr Journalist*innen ins Exil getrieben. Unter erschwerten Bedingungen berichten Menschen wie Lucía Pineda vom Nachrichtenkanal "100% Noticias" oder Wendy Quintero nun aus dem Ausland. Für diese Arbeit nehmen sie stellvertretend für viele andere am 26. November 2024 den Menschenrechtspreis der Friedrich-Ebert-Stiftung entgegen.
mehr »

KI beinflusst Vielfalt in den Medien

Künstliche Intelligenz kann journalistische Texte in verschiedene Sprachen übersetzen und damit viel mehr Nutzer*innen ansprechen. Gleichzeitig kann sie aber auch Stereotype, die in diesen Texten enthalten sind, verfestigen. Gefahren und Chancen von KI-Anwendungen im Journalismus standen im Fokus der diesjährigen NxMedienkonferenz der Neuen deutschen Medienmacher*innen (NdM), die sich für mehr Vielfalt in den Medien einsetzen.
mehr »

ARD: Durchbruch in Tarifrunde

In dem seit Januar andauernden Tarifkonflikt in ARD-Rundfunkanstalten gibt es erste Verhandlungsergebnisse. Zum Wochenende hin konnte am Freitag (15. November) ein Ergebnis im SWR erreicht werden. Für ver.di ist das ausschlaggebende Ergebnis, dass neben sechs Prozent Tariferhöhungen in zwei Stufen über eine Laufzeit von 25 Monaten auch eine für mittlere und niedrige Tarifgruppen stärker wirkende jährliche Sonderzahlung so stark erhöht wurde, dass es nachhaltige Tarifsteigerungen zwischen sechs und über zehn Prozent gibt.
mehr »

Fakten for Future

Menschen jeden Alters machen sich Sorgen um die Zukunft unseres Planeten. Carla Reemtsma ist Klimaschutzaktivistin und Mitorganisatorin des Schulstreiks Fridays for Future („Klimastreik“) in Deutschland. Als Sprecherin vertritt sie die Bewegung auch in der medialen Öffentlichkeit. Wir sprachen mit ihr über Kommunikationsstrategien, Aktivismus und guten Journalismus.
mehr »