In einem kleinen Experiment habe ich mich damit beschäftigt zu testen, ob der satirische Inhalt von Text von einem Computer-Verfahren erkannt werden kann. Selbst für Menschen ist der satirische Inhalt von Texten, wie zum Beispiel von dietagespresse.at oft nicht erkennbar. Schon oft haben Artikel für Aufsehen gesorgt, weil der Inhalt für real gehalten wurde. Zum Beispiel, wie in https://futter.kleinezeitung.at/2016/02/25/schon-wieder-tagespresse-artikel-erregt-asylgegner/ nach zu lesen ist, als sich ausländerfeindlichen Kreise in unzähligen Facebook Kommentaren darüber erregt haben, dass Flüchtlinge nun auch noch die Wiener Tageszeitung „Heute“ kostenlos erhalten würden.
Bekannt geworden ist auch der Artikel über Eva Glawischnig https://dietagespresse.com/glawischnig-novomatic/, der, obwohl er ein original APA-Text ist, unter Satire veröffentlicht wurde, und zeigt dass die Grenze zwischen “echten Inhalten” und Satire verschwimmt. Ist es unter diesen Umständen möglich eine Software, die ja präzise Regeln benötigt, zu erstellen, die Satire erkennt?
Wie in einem Beitrag auf https://medium.com/@andreasstckl/detecting-satire-and-fake-news-with-machine-learning-435695749f79 und im Detail auf https://arxiv.org/abs/1810.00593 beschrieben, habe ich eine große Anzahl (über 60.000) echten und satirischen Artikeln gesammelt, und analysiert. Dabei konnte das mittels Machine Learning trainierte Klassifizierungs-Verfahren Satire-Artikel mit über 98%-tiger Genauigkeit erkennen, und echte Artikel wurden nur zu 0,5% irrtümlich als Satire gekennzeichnet.
Haben Computer jetzt schon mehr Sinn für Satire als Mesnchen?