Beim täglichen Konsum von Nachrichten hat man schnell den Eindruck, dass einige Personen hier sehr dominant sind, und man ständig von ihnen hört oder liest. Allen voran ist derzeit Donald Trump hier zu nennen, der nicht nur via Twitter präsent ist, sondern auch von den Nachrichtenmedien viel Aufmerksamkeit hat. Ich habe versucht mit einem kleinen Projekt das Ganze mit Zahlen zu belegen, und zu sehen, welche Personen hier in welchen Zeiträumen wie häufig genannt werden.
Das Projekt “Who is in the News!” liefert Statistiken und Grafiken zu den Nennungen von Personen in Online-Newsbeiträgen. Damit lassen sich Fragen beantworten wie:
- Wer sind die meistgenannten Personen?
- Wie hat sich die Medienpräsenz von Personen in verschiedenen Zeiträumen entwickelt?
- Welche Unterschiede sind zwischen deutschsprachigen und englischsprachigen Nachrichten?
- Kann man aus dem gemeinsamen Erscheinen in News Zusammenhänge zwischen Personen abgelesen.
In Form interaktiver Grafiken lassen sich auf der Website http://in-the-news.stoeckl.ai diese Fragen und andere beantworten.
Nicht unerwartet ist in englischen News Trump sehr dominant, aber auch in deutschsprachigen ist er fast gleich auf mit Merkel.
Was hat das Projekt mit AI-Technologien zu tun?
Das Zählen der Nennungen in Nachrichtenbeiträgen (derzeit 70.000 – 80.000 im Projekt) muss auf intelligente Weise automatisiert werden. Mit vorgefertigten Listen von Namen, die dann mittels Textvergleich in den Texten gesucht werden, kann nicht gearbeitet werden, da im vorhinein nicht klar ist, wer erscheinen wird. Abhilfe bringt eine Machine Learning Technik, die als “Named Entity Extraction” (NER) bezeichnet wird. Dabei werden in einer großen Menge von passenden Texten von Menschen die vorkommenden “Objekte” (z.B. Personennamen) markiert, und dann mit einem Lernverfahren, wie zum Beispiel einem Neuronalen Netz, ein Modell trainiert. Bekommt das so trainierte Modell dann einen Text ohne Markierungen vorgesetzt, markiert es selbsttätig die gewünschten Einträge.
In diesem Projekt wurde ein Modell verwendet, dass mit Beiträgen aus Google News auf Personen und andere Objekte trainiert wurde. Mit diesem Modell werden dann Nachrichtenbeiträge, die von der Nachrichtenagentur “Reuters” (www.reuters.com) in den Jahren 2015 bis 2018 veröffentlicht wurden, analysiert. Die daraus gewonnen Daten werden gesammelt und graphisch aufbereitet.
Damit wurde nicht nur untersucht, welche Personen in welchen Zeiträumen wie präsent waren, sondern auch über gemeinsames Erscheinen in den Nachrichten Zusammenhänge zwischen Personen abgeleitet. So erkennt man in der nachfolgenden Grafik zum Beispiel, wie sich der Zusammenhang von Merkel und Schulz verändert hat, als Martin Schulz Kanzlerkandidat wurde.
2 Replies to “Welche Personen dominieren die Berichterstattung in den Medien?”