Auf der Suche nach Hilfestellungen zu statistischen Auswertungen? Dann wird euch hier mit einer Vielzahl von Tutorial-Videos geholfen. Der Fokus liegt auf SPSS und R. In Microsoft Excel kann man auch sehr viele Analysen durchführen. Abgerundet wird dies mit Tutorials zum wissenschaftlichen Arbeiten bzw. wissenschaftlichen Schreiben mit z.B. Microsoft Word.
Wenn euch das kostenlose Angebot gefällt und ihr den Kanal unterstützen wollt, würde ich mich freuen, wenn ihr über eine Spende nachdenkt oder Kanalmitglied werdet: ⭐ www.paypal.me/BjoernWalther ⭐ ru-vid.com_BjoernWalther/join ⭐ www.youtube.com/@statorials
Blogbeiträge sowie Datensätze gibt es auf meiner Homepage: www.bjoernwalther.com
HINWEIS: Anfragen zu Methodenberatung können gerne über das Kontaktformular meiner Homepage gestellt werden. Allerdings kann ich aus zeitlichen Gründen keine kostenfreie Beratung leisten.
Hallo, bei mir kommt folgende Fehlermeldung: length(x[as.numeric(g) == 1]) length(x[as.numeric(g) == 2]) Ich möchte die Effektstärke beim Geschlecht (normial) im Zusammenhang mit der Wichtigkeit von Gesundheitsprogrammen (numerisch) untersuchen.
Hallo, vielen lieben Dank für deine Videos. Sie helfen mir unglaublich gut bei meiner Thesis. Könnte ich dir evtl. eine kleine Frage stellen? Ich habe eine Regressionsanalyse durchgeführt, um einen quadratischen Zusammenhang zu testen. Als Output habe ich erhalten, dass mein F-Test in der Anova nicht signifikant ist. Der Regressionskoeffizient, der den quadratischen Zusammenhang abbilden soll, ist aber signifikant. Somit stellt sich mir die Frage, ob ich meine Hypothese ablehnen soll, weil mein Gesamtmodell nicht signifikant ist oder ob ich schreiben soll, dass das Ergebnis nicht eindeutig ist, weil ja mein Regressionskoeffizient signifikant ist. Ich bin mir total unsicher wie ich das interpretieren soll. Könntest du mir da bitte kurz helfen? Das wäre wirklich super! Danke und liebe Grüße! :)
Danke für das Video! :) Ich habe leider Schwierigkeiten damit einzuschätzen wie die Daten dargestellt sein müssen damit R das genau so versteht wie du es hier macht. Sind deine Daten da im long-format? Ich finds irgendwie unintuitiv die Daten für die y-Achse, also in diesem Fall Geschlecht, in einer einzelnen Variable zusammenzufassen. Kann man das nicht gleich in einer Tabelle mit zwei Spalten machen? Ich habe so einen Datensatz und das wurde auch alles schön importiert von Excel und richtig untereinander angezeigt, es hieß dann aber dass es ein nicht-numerisches Argument für binären Operator gibt, was sich auf meine Bezeichnungen für die x-Achse bezog, also was bei dir das Alter war. Wie kann ich das lösen? :/
Hallo und danke für dein Lob! Die Standardfehler geben die Schätzgenauigkeit um den wahren Wert an. Große Standardfehler bedeuten geringe Präzision und umgekehrt. Salopp gesagt möchte man eher kleine als grpße Standardfehler, weil diese wiederum in die Berechnung des t-Werts eingehen: Koeffizient/SE = t-Wert. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank für die Antwort. Nur noch eine Kleinigkeit auf welchen Koeffizienten bezieht sich denn der Standartfehler des Schätzers, auf R^2 ?
Hallo Annika, du kannst die verlinkte Tabelle anpassen und in etwa auf sowas hinarbeiten: i0.wp.com/educationalresearchtechniques.com/wp-content/uploads/2018/02/114.png?resize=625%2C363&ssl=1 Viele Grüße, Björn
Hallo, erstmal deine Videos sind echt hilfreich. Ich hätte paar kleineren Fragen. wie würde man die Moderation durchführen wenn die Variablen mehrere Fragen haben ? Und mit welchem Paket kann man die Moderation durchführen? Reicht ein das Basic Paket von SPSS? Vielen Dank im Voraus
Hallo, die Basisversion von SPSS sollte die lineare Regression enthalten, womit eine Moderation gerechnet werden kann. Wenn du mehrere Fragen bzw. Items hast, die eine Skala bilden, solltest du sie zusammenfassen: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-_7vkvcJSNQg.html Das Skalenhandbuch gibt meist Instruktionen hierfür. Ich würde zudem empfehlen, die Moderation über das PROCESS-Plugin zu rechnen (ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-QHb1INZaGgA.html). Installation PROCESS: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-42DEjzLF9Dw.html Viele Grüße, Björn.
@@StatistikamPC_BjoernWaltherVielen Dank:) Hast du tipps wenn die Daten keine Normalverteilung anzeigen? Wie kann vorgehen um dennoch eine Moderationsanalyse durchzuführen?
Ich habe das Problem das ein Teil der Daten vollständig durch NA ersetzt wird obwohl ich nach lastpage, also Beendigungquote gefiltert habe. Ich habe alles mögliche probiert und auch mit Hilfe von Chat GPT und Foren geguckt woran es liegen könnte. Ich finde leider keine Lösung.
Wie kann ich die t-Werte und p-Werte für paarweise Korrelationen zwischen drei Spalten in Excel berechnen und diese zu einem einheitlichen Ergebnis zusammenfassen? Ich verstehe, dass ich die t-Werte und p-Werte für jede paarweise Korrelation einzeln berechnen muss, aber wie kann ich diese Berechnungen zu einem einheitlichen Ergebnis zusammenführen? PS: Ich arbeite mit Excel.
Ich habe mal eine Frage: Habe ich etwas falsch gemacht, wenn mein unstandardisiertes b und mein standardisierter Regressionskoeffizient beta exakt die gleichen Werte haben? Kann dies durch die z-Transformation meiner Werte kommen (da Standardabweichung dann ja 1) oder habe ich etwas falsch gemacht? Vielen Dank und liebe Grüße!
Hallo Carmelina, die z-Transformation ist exakt das, was zu standardisierten Koeffizienten führt. Daher sind die Werte für b und beta bei dir identisch. Viele Grüße, Björn.
Hallöchen, ich habe mal eine technische Frage bezüglich der Grafikerstellung. In Form meiner Masterarbeit habe ich die Leseflüssigkeit der Kinder in der Grundschule gemessen. Das über das zweite Schuljahr hinweg zu jeweils drei Zeitpunkten die eine Woche mit jeweils drei Testtagen umfasst. Pro Woche entstand ein MW jedes Kindes. Kinder die nur einmal oder keinmal in der Woche da waren wurden für die Auswertung raus genommen. Somit habe ich für alle drei Testzeitpunkte (der Test wurde in Klasse 2,3,4 gemacht) eine unterschiedliche Anzahl an MW.. ich habe die Liste wie Sie in SPSS erstellt. Durch die unterschiedliche Anzahl an gültigen MW pro Testzeitpunkt sind jedoch Lücken durch leere Zeilenblocks entsanden. Ich bin ehrlich.. ich verzweifle ein bisschen und weiß nicht wie ich sinnvoll die Entwicklung der MW aller drei Klassen mit Standardabweichung schön darstellen soll.. Es wäre wirklich toll udn ich wäre super dankbar wenn Sie mir helfen könnten!!! LG Charis
Erstmal vielen Dank für das super erklärte Video! Kann mir aber vielleicht jemand erklären wie ich die Intervalle der x-Achse selbständig bestimme? Ich brauche Intervalle die ein von-bis anzeigen, also 10-20cm, 20-30cm usw. ... Dann müssten sich die importierten Werte jeweils selber einordnen. Geht das irgendwie? Ich habe dafür bisher noch nichts brauchbares gefunden :/
Hallo und danke für dein Lob! Evtl. lohnt sich für dich die Erstellung eines Histogramms mehr, da es dort etwas einfacher ist, das zu tun, was du vorhast. ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-xk0_L82TYy0.html Das Argument in hist() wäre dann breaks=c(10,20,30). Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen lieben Dank für die schnelle Antwort! Bei den Histogrammen hatte ich tatsächlich angefangen und das ging erst gar nicht aber ich glaube ich hatte meine Daten einfach falsch dargestellt vorher. Jetzt habe ich alle Werte einzeln aufgeschrieben und importiert und es hat geklappt! :D Ist noch nicht perfekt aber immerhin viel besser als vorher. Jetzt habe ich noch eine Frage: Die Aufteilung der Balken ist jetzt zwar so wie ich sie will, allerdings wird die x-Achse trotzdem nur in 0,2er Schritten angezeigt und fängt bei 0,2 an. Die y-Achse hat ein ähnliches Problem und geht nicht ganz zum Ende. Müsste ich da den "axis(...)" Befehl nutzen den du in dem Histogramm Video erklärst um die Achsen manuell darzustellen? Oder ergibt das keinen Sinn in Kombination mit dem "breaks=c()"? :)
@@fini8874 Freut mich, wenn es mit dem Diagramm geklappt hat. Ist immer etwas hakelig, wenn man in R mit Diagrammen von Null anfängt aber umso entspannter, wenn man einmal alle Vorlagen hat und immer wieder darauf zurückgreifen kann. VIele Grüße, Björn.
Es handelt sich ja bei der zusammengefügten Skala um ordinalskalierte Items. Ist es zulässig die Variable der Gesamtzufriedenheit zu bilden, indem der Mittelwert ausgerechnet wird? Normalerweise würde man ja den Median verwenden bei ordinalskalierten Daten oder? Falls es zulässig ist, warum? Liebe Grüße!
Hallo Erik, das Berechnen des Mittelwertes ist legitim, i.d.R. gibt das auch das Skalenhandbuch vor, wenn du unsicher bist. Das Argument dahinter ist, dass die Prüfung der Skalenaxiomatik in der Forschungspraxis zumeist entbehrlich ist (vgl. Bortz, Schuster (2010), Statistik für Human- und Sozialwissenschaftler, S. 22-23. und bei der Mittelwertbildung von ordinalskalierten Items, die eine Skala bilden, dann von einem quasimetrischen Merkmal gesprochen wird. Hier wird es freilich auch immer jene geben, die ein solches Vorgehen verneinen. Die Forschungspraxis hat aber gezeigt, dass die Erfassung latenter Konstrukte mittels Zusammenfassung von ordinalskalierten Items funktional ist und bedenkenlos angewandt werden kann. Viele Grüße, Björn.
Wie stelle ich einen Zeilenabstand von 1,25 ein? In den Optionen finde ich lediglich 1 1,5 oder 2 oder eben die Eingabe in Form von Punkten - 1,25 konkret eingeben kann man nicht? Vielen Dank!
Hallo Alena, ja, das ist für solche Boxplots möglich. Im Editor (Doppelklick aufs Diagramm), kannst du oben links auf das "Y" klicken. Da öffnet sich das Eigenschaftsfenster. Dort kannst du den Reiter "Beschriftungen und Teilstriche" auswählen und den Haken bei "Achsentitel anzeigen" setzen. Dann kannst du die Beschriftung wie gewohnt anpassen. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Lieber Björn, danke für die schnelle Hilfe, das hat schon mal geklappt! Eine weitere Frage kam mir dann auch noch...kann man sich über den Editor auch Klammern mit Sternchen zwischen 2 Boxplots anzeigen lassen, um signifikante Unterschiede darzustellen? Das Sternchen könnte man mittels Textfeld einfügen, aber die Klammer?!
@@AlenaHeß Hallo Alena, das klappt leider nicht in SPSS darzustellen. Du kannst das Diagramm maximal exportieren (z.B. Word) und dann dort entsprechende Dinge hinzufügen und die Elemente alle gruppieren. Viele Grüße, Björn.
Hallo, vielen Dank für das Video! Kann ich die z-Standardisierung auch dafür nutzen, wenn ich verschieden stufige Likert-Skalen (4, 5, 7 und 10 stufig) miteinander vergleichen möchte?
Ja, das geht analog, weil nach der Transformation der Mittelwert 0 und die Standardabweichung jeweils 1 ist und damit die Vergleichbarkeit gegeben ist. Zwar sollte man keinen Mittelwert bei ordinalskalierten Variablen, das ist aber zumeist eine theoretische Diskussion. Viele Grüße, Björn.
Nein, die kommen völlig beliebig verteilt sein. Zumeist wendet man den Chi-Quadrat-Test ohnehin nur bei nominal oder ordinalskalierten Variablen an, wo Normalverteilung kein Thema ist Viele Grüße, Björn.
Hallo! Bin auf der Suche nach einem Erklärvideo für eine ANCOVA in R. Ich habe für meine Masterarbeit Text A oder B lesen lassen, das wahrgenommene Wissen und das tatsächliche Wissen erfasst. Meine Hypothese ist nun, dass bei Text B mehr wahrgenommenes Wissen bei gleichem tatsächlichen Wissen als bei Text A ist. Darüber hinaus soll ich testen, ob es vielleicht sogar mehr wahrgenommenes Wissen und weniger tatsächliches Wissen gibt. Ich würde mich sehr über ein Video auch bezüglich Voraussetzungstestung und Post hoc Tests freuen. Und was macht man bei Voraussetzungsverletzung? Danke schonmal!
Hallo, leider kann ich mittelfristig dazu keine Videos erstellen. Ich würde dir aber hierfür auch wärmestens die anova_test()-Funktion aus dem rstatix-Paket empfehlen. Die Dokumentation der Autoren ist auch sehr gut: www.datanovia.com/en/lessons/ancova-in-r/ Post-Hoc würdest du dann auch über emmeans()-Funktion rechnen können. Bei etwaigen Verletzungen der Voraussetzungen hängt es stark von der Stichprobengröße ab, ob man sie damit relativieren kann. Ansonsten kann mit Bootstrapping gerechnet werden oder eine nichtparametrische Alternative, wie z.B. mit dem Paket fANCOVA. Viele Grüße, Björn.
"Weiß" PROCESS, dass beim Modell zwischen einer dichotomen unabhängigen Variablen und einer dichotomen Mediatorvariablen eine logistische Regression durchgeführt werden muss?
Du meinst, dass die AV dichotom ist und dann entsprechend eine binär-logistische Regression gerechnet wird? Wenn ja, ist die Antwort ja. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Ich habe eine dichotome unabhängige Variable (zwei Versuchsbedingungen), eine dichotome Mediatorvariable und eine metrische abhängige Variable. Muss ich hierbei etwas bestimmtes beachten? Danke dir!
Hallo, vielen Dank erstmal für die wirklich hilfreichen Videos! Eine Frage: Wenn ich in SPSS einen Fragebogen auswerten möchte anhand Regression/ Korrelation und z.B. die Mitarbeiterorientierung durch 3 Items (M1,M2,M3) gemessen wurde. Alle Items/ Variablen sind ordinal skaliert. Bilde ich für die anschließende Regression/Korrelation den Mittelwert oder die Summe? Oder gar nicht von beidem, da ordinal skaliert? bin tatsächlich ratlos und finde nur diese Lösung.. Über eine Rückmeldung freue ich mich sehr! :)
Normalerweise gibt das dein Skalenhandbuch vor, ob Summe oder Mittelwert. Zum Skalenniveau: (Bortz, Schuster (2010), S. 22-23) Zusammengefasst: der Skalenmittelwert wird als quasimetrisch angesehen und damit können parametrische Methoden verwendet werden. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank für die Antwort. Eine andere Möglichkeit, wie ich Ordinale Items zusammenfasse, gibt es aber nicht oder? Es geht mir nur darum, ob ich später bei der Korrelationsanalyse nach Spearman oder Pearson rechne, aber da ich durch die Aggregation ja von quasi-metrischen Daten ausgehe, spricht vermutlich alles für Pearson. Oder?
Danke für das tolle Video. Kann ich damit auch die benötigte Stichprobengröße für eine einfache lineare Regression berechnen? (Indem ich bei Anzahl an Prädiktoren einfach 1 nehme) Interessant finde ich: Regorz-Statistik nutzt den T-Test für die Berechnung (linear multiple regression: fixed model, single regression coefficient). Geht beides? Kann eigentlich nicht sein, da andere Werte rauskommen... Muss man das Alphafehlerniveau nicht anpassen, abhängig davon, ob man gerichtete oder ungerichtete Hypothesen hat?
Wenn du einen Prädiktor einträgst, sollte das passen. Alpha ist immer derselbe Wert, unabhängig von der Richtung der Hypothese - nur dein p-Wert halbiert sich bei einseitiger Testung. Allerdings ist der Unterschied zu der Berechnung über Test Family t-Tests genau jener - ob du ein- oder zweiseitig testest. Über Test family F tests ist immer zweiseitig eingestellt und nicht auf einseitig umstellbar. Viele Grüße, Björn.
Danke für das hilfreiche Video! Was bedeutet es wenn in meiner Moderationsanalyse der Interaktionseffekt signfikant ist, jedoch bei model summary der p-Wert des F-Tests über 0.05 liegt?
Hallo Laura, wenn der F-Test keinen hinreichend kleinen p-Wert hat, leistet das Modell keine hinreichend große Aufklärung. Das kann an der Auswahl der Prädiktoren liegen, der Stichprobe usw. Eine Auswahl an Gründen gibt es hier: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-tmRUTeW-hTc.html Die signifikante Interaktion wäre im Falle eines zu hohen p-Wertes beim F-Test daher nicht zu interpretieren. Viele Grüße, Björn.
Hy, ich möchte meine Daten in der Spalte Netto von €149.99 zu 149,99 (von Text zu Währung) formatieren. Er erkennt aber den Punkt nicht als Komma, sondern als Zählzeichen für tausender. Wie kann ich das in diesem bearbeitungsfenster lösen?
Ich habe eine Frage zu der Erstellung eines Boxplots: Die vier DIfferenzen vor und nach einer Intervention füge ich in das Feld "Box entspricht" ein, die Kategorieachse ist meine Gruppe (0 und 1). Bei der Ausgabe erhalte ich nun zwei Boxplots (G0 und G1). Ich möchte aber nur ein Boxplot haben, in dem die vier Differenzen der Gruppe 0 und 1 bei den Ergebnissen jeweiils nebeneinander steht.
Es gibt zuviele Menschen, die in Excelspalten mal Datumswerte jnd mal Freitext wie "nein" oder "ausgefallen" schreiben. Wenn man diese Freitexte verarbeitet hat und durch NA ersetzt hat ist diese Funktion Gold wert!