Die amerikanische Investmentfirma “Two Sigma” (www.twosigma.com) hat auf der Data-Science Plattform “Kaggle” einen Bewerb ausgeschrieben, der Modelle zur Prognose von zukünftigen Aktienpreisen auf Basis von Nachrichtenbeiträgen entwickeln soll. Dabei werden sowohl historische Aktienkurse als auch Nachrichtenbeiträge von 2007 bis jetzt zur Verfügung gestellt. Ziel des Bewerbes ist es das Knowhow zum Einfuss von Nachrichten zur Kursentwicklung zu verbessern.
Die Nachrichtenbeiträge stammen von der Nachrichtenagentur THOMSON REUTERS. Es werden Informationen, wie Titel, Veröffentlichungszeitraum, Textlänge, im Beitrag erwähnte Unternehmen, Sentiment-Analyse und weitere angeboten. Der Originaltext der Beitrages ist jedoch nicht enthalten.
Im Wettbewerb soll jeder Teilnehmer Prognose-Modelle für die Kursentwicklung einer Vielzahl von Werten in den jeweils nächsten 10 Tagen abgeben. Bis 8.1. 2019 können Modelle eingereicht werden, die dann bis 15. July entsprechend der Kursentwicklung evaluiert werden. In einem “Leaderboard” kann man die Performance der eigenen Einreichungen verfolgen. Der Bewerb ist mit insgesamt 100.000$ dotiert, die sich auf die ersten 10 Plätze verteilen.
Die Einreichung erfolgt in Form von “Python-Notebooks”, die auf der Kaggle Plattform entwickelt werden, und dort auch in virtuellen Maschinen laufen. Einen “naiven” Zugang, wie man sich dem Problem nähern kann, hab ich in einem früheren Beitrag http://34.91.1.55/aktienkurse-aus-nachrichten-vorhersagen/ versucht zu beschreiben. Um erfolgreich zu sein, werden jedoch mehr Ideen benötigt.