Recherchieren mit Maschinen

#krassmedial: Journalist Peter-Welchering vermittelte seine Expertise über das Recherchieren mit KI Foto: Charles Yunck

Nie mehr Angst vor dem leeren Blatt. Wie KI-Tools die journalistische Recherche und Themenfindung unterstützen können, stellte der Journalist Peter Welchering in seinem Workshop „KI recherchier das mal!“ vor. Auch die Funktionsweise von neuronalen Netzen und Fragen nach der Kontrolle von KI-Tools und deren Integration kamen zur Sprache.

Zum Einstieg in seinen Workshop griff Welchering ein prominentes Beispiel für mangelnde Recherche und die Nutzung eines eher schlechten Übersetzungstools auf. Der US-Journalist Seymour Hersh berichtete über die mutmaßliche Urheberschaft der im September 2022 erfolgten Explosionen an den Gaspipelines Nord Stream 1 und 2. Ein Faktenfinder der Tagesschau warf ihm in dem Beitrag vom Februar 2023 Unstimmigkeiten vor. Der Vorwurf beruhte jedoch auf einem einfachen Übersetzungsfehler. Offenbar war ein unausgereiftes Übersetzungstool benutzt worden, das das englische Verb plant („platzieren“) in der deutschen Übersetzung fälschlicherweise als Nomen („Pflanze“) interpretierte und so zu unsinnigen Spekulationen über „pflanzenförmigen“ Sprengstoff führte. In diesem Fall hätte also ein Blick in den englischen Originaltext genügt. Welcherings simpler Tipp: „Einfach den Link anklicken, der als Quelle genannt wird“. Denn oft liege der Fehler gar nicht bei der KI, sondern beim anwendenden Menschen.

Das Beispiel zeigte jedoch auch, dass man sich lieber auf ausgereiftere Übersetzungstools verlassen sollte als etwa auf Google Translate. Es arbeitet zwar bereits mit neuronalen Netzen, Tools wie DeepL erzielen aber bessere Ergebnisse mit dem Einsatz sogenannter Transformer. Dabei werden bestimmte Werte im neuronalen Netz verstärkt, nur was gewichtet wird, wird dann auch weiterverarbeitet. Dank Domänenwissens können Worte passender vervollständigt und bessere Ergebnisse geliefert werden. Weitere Beispiele für Übersetzungstools sind trint, promt.one, Microsoft Translator oder Yandex. Letzteres liefere zwar gute Ergebnisse, das Unternehmen hat seinen Hauptsitz allerdings in Moskau. Man müsse sich darauf einstellen, dass bestimmte Begriffe regierungskonform übersetzt werden. Aus dem Wort für „Krieg“ wird dann etwa „Spezialoperation“, wenn es um den derzeitigen Krieg in der Ukraine geht.

Für die Reverse bzw. Rückwärtsbildersuche könne man unter anderem die Tools TinEye, Google, Yandex und RootAbout nutzen. Letzteres empfehle sich vor allem für die Suche in sozialen Netzwerken. Bilder zu Recherchezwecken verändern, aber auch neue erstellen lassen sich zum Beispiel mit Artbreeder.

Generell gibt es für die Recherche zahlreiche bessere Suchmaschinen als Google. Die 2009 lancierte semantische Suchmaschine WolframAlpha kann Fragen beantworten. Ihre Datenbasis bezieht sie von akademischen und kommerziellen Webseiten. Die Wissenschaftssuchmaschine Consensus ist evidenzbasiert und kann auch im Journalismus genutzt werden. Die Quellen sind von Menschen überprüft. Mit Quellenreferenzierung in verschiedenen Wissensdomänen arbeitet auch IntelligenceX, eine Suchmaschine und ein Datenarchiv, das nur Fakten aus der eigenen Datenbank nutzt und selbst von IT-Forensiker*innen verwendet wird. Perplexity ist ein Chatbot mit Quellenreferenzierung. Mit Vorsicht zu genießen sei hingegen die Microsoft-Suchmaschine Bing, die einen Vertrag mit Open AI hat. Man versuche sich dort in Quellenreferenzierung, Quellen würden aber nicht überprüft. Bei anderen bekannten Chatbots wie Googles Bard und ChatGPT von Open AI fehle die Quellenreferenzierung noch.

SciSpace von Typeset kann wissenschaftliche PDFs durchsuchen und sogar Fachbegriffe erläutern. AskYourPDF kann ebenfalls für die Suche in PDFs genutzt werden. Mit Pinpoint lassen sich zudem Audio-Dateien durchsuchen, allerdings gehen die Daten an Google. Automated Insights ist sogar für die Suche im Archiv auf der eigenen Festplatte einsetzbar, Narrativa und United Robots ebenso; letzteres dient auch der Texterstellung. Syllabs wiederum kann Zusammenfassungen aus Studien erstellen, sei Welchering zufolge aber nicht immer vertrauenswürdig.

Um zu wissen, welche Themen gerade hohe Relevanz haben, könne man zum Beispiel Dataminr nutzen, allerdings sei die ausgegebene Gewichtung nicht immer nachvollziehbar. So reiche es etwa, wenn nur wenige Personen ausgiebig über ein Thema chatten. Mit Glasp lassen sich Texte auf Webseiten markieren und Clustern zuordnen.  Bewusst sollte man sich dessen sein, wie diese Tools funktionieren. Sprache etwa wird in Zahlen umgewandelt, jedes Wort bekommt im semantischen Raum eine bestimmte Stelle zugewiesen, die schließlich durch einen Vektor abgebildet wird. Je nach Aufmerksamkeit können Vektoren einen höheren Wert erhalten. Wichtige Fragen sind, mit welchen Daten die KI-Programme trainiert werden, auf welche Archive sie zurückgreifen dürfen, wer die Bedeutung einzelner Worte bzw. Daten festlegt und wie bestimmte Entscheidungspfade durch Verstärkung festgelegt werden. Welchering wies zudem darauf hin, dass ein Problem darstelle, wie die KI-Tools jeweils in Schnittstellen integriert werden sollen, welche Datenformate standardisiert werden und welche nicht. Da bedürfe es einer Regulierung.

Abschließend warf Welchering die Frage auf, ob Tutor-Chatbots, die derzeit an Universitäten entwickelt werden, auch als Geschäftsmodell für den Fachjournalismus dienen könnten.

Hier ein „Werkzeugkasten“ mit allen in diesem Fokus genannten Tools und deren Links.

 

 

nach oben

Weitere aktuelle Beiträge

Big Tech verändert TV und Streaming

Bei den Video-Streaming-Plattformen verteidigte YouTube im Jahr 2025 erfolgreich seine Führungsposition und erreicht 72 Prozent der deutschen Bevölkerung ab 14 Jahren. Die öffentlich-rechtlichen Streaming-Netzwerke von ARD, ZDF, Arte und 3sat kommen auf über 60 Prozent, dicht gefolgt von Netflix und Amazon Prime Video. Doch auch die Sender des ÖRR nutzen YouTube als Ausspielweg ihrer Inhalte. 
mehr »

Smartphones endlich sicherer machen

Als Journalist*innen sind wir verpflichtet, unsere Quellen zu schützen. Wir treffen sie an vertraulichen Orten, anonymisieren Namen, schreddern Unterlagen. Aber was ist mit unseren Smartphones? Während niemand die eigene Haus- oder Bürotür über Nacht offenstehen lassen würde, öffnen wir digital oft ungewollt Tür und Tor zu den sensibelsten Bereichen: Acht Tipps für Datensicherheit bei Smartphones
mehr »

Guatemala: Eine ernüchternde Bilanz

Knapp zwei Jahre ist Guatemalas Präsident Bernardo Arévalo im Amt und erklärtes Ziel seiner Regierung ist es einen Schutzmechanismus für Journalist*innen einzuführen. Doch das innovative Projekt kommt nicht vom Fleck, moniert die Medienanalystin Silvia Trujillo gemeinsam mit zahlreichen bekannten Berichterstatter*innen. Dafür machen sie nicht nur den omnipräsenten „Pakt der Korrupten“ verantwortlich, sondern auch das Zögern der Regierung. Die verharre im Stand-By.
mehr »

Europas Machtprobe mit den Plattformen

Wegen mangelnder Transparenz bei Werbung und Nutzerkonten hat die EU-Kommission eine Strafe in Höhe von 120 Millionen Euro gegen den Onlinedienst X verhängt. Mit dem Digital Services Act (DSA) will die EU das Netz demokratisch kontrollieren. Doch Verfahren gegen X, TikTok und Meta zeigen, wie schnell die angestrebte Regulierung zur politischen Auseinandersetzung wird.
mehr »