Bei der Untersuchung von Datensätzen tauchen immer wieder gleichartige Fragestellungen auf, wie zum Beispiel ob ein gemessener Wert für eine Gruppe von Daten signifikant größer ist, als der einer Referenzgruppe. Vor solchen Fragen steht man oft bei empirischen Studien. Die Auswahl der geeigneten Analysesoftware ist dabei der erste Schritt.
Klassische Lösungen, wie “SPSS” von IBM bieten einen großen Funktionsumfang und sind auch durchaus kostspielig. Vom Handling überfordern sie oft gerade empirische Forscher, da diesen “Dinosauriern” der Statistik-Pakete deutlich an zu merken ist, dass sie aus der Zeit der Großrechner stammen. Für moderne explorative Datenanalyse sind sie nur wenig geeignet, und die Vielzahl an Modulen und Funktionen überfordert schnell.
Den Stand der Technik repräsentiert derzeit die statistische Skriptsprache “R” mit seiner enormen Flexibilität und fast unbegrenzter Erweiterbarkeit lässt es keine Wünsche offen. Dank der Open Source Lizenz ist es auch Lizenzkosten frei. Die Komplexität und steile Lernkurve stellen jedoch für viele Anwender nicht zu überwindende Hürden dar.
Eine Abhilfe soll hier das Projekt “jamovi” ( https://www.jamovi.org/ ) schaffen, das auf “R” aufsetzt, und einerseits eine graphische Benutzeroberfläche bietet, und andererseits den Funktionsumfang auf die wesentlichsten Funktionen und Analysen fokussiert. Dadurch wird der Anwender durch den Analyse Prozess geführt, und kann sich auf die Inhalte konzentrieren.
Den Bildschirm teilt “jamovi” in zwei Teile, ein “Spreadsheet” und eine Anzeige für die Analyseergebnisse. Die Menüs sind ebenfalls auf zwei begrenzt, eines für Datenmanipulation, wie Editierfunktionen und Möglichkeiten zur Berechnung neuer Daten und Transformationen, und eines für Analysen. Im Analyse Menü versteckt sich alles was der Statistiker-Alltag üblicherweise benötigt, Berechnung von Kennwerten und Grafiken, und die “Workhorses” der Statistik wie T-Test, Varianzanalyse und Regression.
Wem der Funktionsumfang von “jamovi” nicht ausreicht und über entsprechende “R”-Kenntnisse verfügt, kann sich weitere Analysen als Module erstellen, oder von anderen erstellte Modulpakete hinzufügen.
Für jeden der statistische Methoden in der Praxis einsetzt, sei es für die Datenanalyse in Machine Learning Projekten, oder bei der Analyse empirischer Studien zum Beispiel im Rahmen einer Diplomarbeit kann ich die Software sehr empfehlen.