@03:40 Allein dass du darauf verzichtest, das Ding "Tilde" zu nennen und stattdessen Schlangenlinie sagst zeigt mir, dass du mehr Wert darauf legst, dass man dich versteht als "klug rüberzukommen". Richtiger Ehrenmann. (Hypothese: Du weißt, dass man das auch Tilde nennt).
@@StatistikamPC_BjoernWalther Hi, bei mir kommt eine Fehlermeldung, wenn ich das so eintippe wie, bei dir. Also dort kommt "Fehler in as.environment(pos) : ungültiges `pos`Argument.
OMG endlich kapiere ich es! Mein Prof hat uns mit diesem Stoff 3 Stunden gequält, aber wie du uns das hier erklärst, kann ich meine Freude am Lernen wieder finden...Bitte hör nie auf Videos für uns zu machen! Vielen Dank!!!
Ich bin trotz diverser Tutorials an meiner Hausarbeit verzweifelt. Dank deines Videos konnte ich es beenden! Danke für deine Mühe dieses Video zu erstellen!
Das Video hat mir so doll geholfen. Ich muss meine zweite Statistik Klausur in der Uni mit R schreiben und habe in den Seminaren bisher nie verstanden, was ich machen soll. Deine Videos sind so einfach zu verstehen und haben mir geholfen endlich mal zu verstehen, wie das Ganze funktioniert!!!
Schätze, das liegt daran, dass du bei R alles über Befehle erst formulieren musst. Ich frage mich, ob man das beim Entwurf des Programm nicht gleich hätte etwas einfacher machen können....
Das liegt daran, dass die Profs in 1.Linie Forscher sind, aber in der Regel nie Didaktik gelernt haben. Sie müssen nicht eigens als Lehrkraft ausgebildet sein. Der Unterricht wird von vielen nur als "lästiger aber notwendiger Zusatzauftrag" gesehen - und so sind viele Vorlesungen dann auch....
Wow was für ein Video! Richtig gut erklärt. Danke dafür! Auch wenn ich schon drei Jahre aus dem Studium raus bin und das Thema gerade erst wieder anfange aufzufrischen, habe ich durch dieses eine Video schon wieder massig Inupt, welcher mir hilft mein Wissen wieder herauszukramen. :D Also nochmals 1000 Dank! :D
Richtig tolles Video! Die detaillierten Erklärungen sind enorm hilfreich! Bitte beibehalten :) spannend wäre noch Multiple Regression / hierarchische Regression mit R
Hallo Владимир Лев, danke für deine lobenden Worte! :-) Multiple Regression wird auch demnächst kommen (ist schon fertig und geht am 15.06. online). Hierachische Regression werde ich evtl. im nächsten Aufnahmezyklus was zu machen. Danke für dein Feedback. Viele Grüße, Björn.
Super erklärt! Gibt es ein Video wo die Voraussetzungen für die einfache lineare Regression getestet werden? Oder kann man das genau so wie bei der multiplen Regression testen? Vielen Dank im Voraus :)
Deine Videos sind super erklärt und wirklich hilfreich! Eine Frage hätte ich zur linearen Regression bzw. zur moderierten. Bin ich richtig mit der Annahme, dass wenn bei der linearen Regression UV und AV verschiedene Skalenbreiten haben hier NICHT Z-Standartisiert werden muss? Und wie wäre das bei einer moderierten Regression? Vielen Dank! :)
Hallo Nils, danke für die lobenden Worte! Du musst niemals z-standardisieren, es ist lediglich zu empfehlen, wenn die UV untereinander verschiedene Skalenbreiten haben und du aber deren Einfluss vergleichen möchtest. Da eine Moderation auch nur eine Regression ist, gibt es hierbei keinen Unterschied. Viele Grüße, Björn.
Hallo Björn, super hilfreiches Video! Gibt es auch ein Video für R Studio wie man den p - Wert für gerichtete Zusammenhangshypothesen berechnet (der p Wert in der Ausgabe ist ja immer der von der zweiseitigen Testung soweit ich weiß)?
Hallo Greta, das geht, wenngleich etwas umständlich ist und nur für positive oder negative Koeffizienten auf einmal funktioniert. Zuerst das Modell berechnen und in einen Vektor (model) schieben, danach die Modellergebnisse mit summary() in einen Vektor (res) schieben. Im Anschluss folgt dann die eigentliche Berechnung mit pt - der t--Wert wird zur p-Wert-Berechnung verwendet. Wichtig ist, dass die Freiheitsgrade stimmen. Bei einer einfachen linearen Regression sind es 2 (1 für das Modell, 1 für die Prädiktor). In meinem Beispiel unterstelle ich einen positiven Koeffizient mit lower=FALSE. Mit lower=TRUE wäre die Koeffizient negativ. model
@@StatistikamPC_BjoernWalther Danke für die Antwort! Kann ich bei z.B. bei einer positiv gerichteten Zusammenhangshypothese sonst auch mit der cor.test(...., alternative = "greater")mir den einseitigen p-Wert der Hypothese ermitteln?
Hallo, vielen Dank für das Video! :) Eine Frage: Ich möchte mittels linearen Regression eine Eichgerade erstellen und mit der Geradengleichung dann recht viele Werte umrechnen. Gibt es dafür einen Befehl/ eine Möglichkeit, eine große Datenmenge einzulesen (= y-Werte) und umrechnen zu lassen?
Hallo Jasminka, mit Eichgerade meinst du sicherlich Regressionsgerade. In R ist mir da im Moment kein Befehl bekannt. Allerdings kannst du die Formel in Excel einsetzen und hier recht einfach die y-Werte mit der Formel und den x-Werten prognostizieren. Viele Grüße, Björn.
Hallo Jasmina, du kannst dir die entsprechenden Y-Werte ganz einfach selbst ausrechen lassen, indem du dir die Werte aus deiner Regression ziehst. Bleiben wir bei bei dem Beispiel mit den Schulnoten. Du hast eine ganze Reihe von X-Werten (IQ), z.B. von 50 bis 150: X
Danke für das tolle Video! Ich hatte mich gefragt, ob die "Estimates" den standardisierten beta Koeffizienten angeben? Falls nicht, gibt es eine Funktion in R, die ich nutzen könnte, um diese herauszubekommen?
Hallo Maggie, danke für dein Lob! Die Estimats sind immer unstandardisiert. In einer einfachen linearen Regression ist das ja eigentlich auch nicht wirklich wichtig, da die standardisierten Koeffizienten immer nur dann herangezogen werden, wenn wenigstens 2 UV und deren Einfluss auf die AV bei unterschiedlichem Wertebereich verglichen werden sollen. Im Video zur multiplen Regression zeige ich, wie man die standardisierten Koeffizienten erhält - einfach im Vorfeld alle Variablen standardisieren. Viele Grüße, Björn.
Moin! Eine kurze Frage: Ich habe zwei Kategorien, eine Einfluss- und eine Zielvariable. Wie kann man die Datenpunkte der Einfluss- und Zielvariable nach den beiden Kategorien in einer Abbildung unterschiedlich einfärben. Und wie kann ich für beide eine Regression aufstellen und für beide Kategorien die Formel und Bestimmheitsmaß in der Abbildung anzeigen lassen. Vielen Dank im Voraus! LG Jan
Kann man mit der einfachen linealen Regression eigentlich auch z.B Einkommen (kategorisiert z.B zwischen 1000€ und 1500€) und mit Ausgaben (AV) numerisch analysieren oder wäre bei dem Beispiel die Varianzanalyse besser geeignet? Hypothese wäre, dass Ausgabenhöhe abhängig vom Einkommen ist 🤔
Tolle einfache Erklärung. Hast du auch eine Methode/Video wie mit in R zu dieser linearen Regression einen einseitiges Konfidenzintervall erstellt. Wir sollen den Leistungsabfall eines Produkts über die Zeit errechnen und dazu dann das einseitige 95% CI errechnen. Ich weiß, dass ich mit Hilfe der Formel des Models, die du hier gezeigt hast neue Werte berechnen muss und dann in die Grafik eintragen muss. Nur wie?
Hallo, vorweg ein sehr schönes Video. Es hat mir echt mega weiter geholfen. Eine Frage: Hast du zufällig eine Quelle für die Erklärung der F-Statistik, Coefficents, R² etc. ? Wäre mega. Gruß David
Hallo Björn :) Ich habe leider kein Video zur multivariaten Regressionsanalyse gefunden aber das Video hat mir schon etwas weitergeholfen. Ich möchte in meiner Thesis eine multivariate Regression durchführen (1x UV, 2x AV) und habe die Voraussetzung der linearen Beziehung zwischen der UV und den AV's visuell geprüft. Leider habe ich keine lineare Beziehung feststellen können. Die berechnete Korrelation der Zusammenhänge unterstützt den nicht wirklich vorhandenen linearen Zusammenhang, da r = -.05 und r = - .12. Hast du eine Idee für mich? Gibt es noch eine andere Möglichkeit aufzuführen, dass keine lineare Beziehung vorliegt? Oder kann die multivariate Regression mit der Begründung nicht vorhandener linearer Beziehung nicht durchführen? Danke für deine Rückmeldung und Hilfe!! LG Steffi :)
Danke für die Videos. Sehr gut erklärt etc. Eine Frage nur zu dem IQ: Woher hast du die Daten denn? Das macht inhaltlich doch wenig Sinn, dass wenn der IQ steigt, der Abi Schnitt sinkt. Ich frage mich auch wie man solche Daten erheben will.
Hallo Christian, die Daten sind zufallsgeneriert, allerdings in gewissen Intervallen. Der Abiturschnitt ist aber wie üblich invers kodiert: eine niedrige ist eine gute Note. Das ergibt inhaltlich also durchaus Sinn, wenn ein steigender IQ zu einer niedrigeren und damit besseren Note führt. Viele Grüße, Björn.
Hallo, danke erstmal für deinen tollen Beitrag. Ich habe allerdings eine kleine Frage. Woher weiß ich dass ich meine Nullhypothese bei einem Wert unter 0,005 verwerfen kann. Mein Streudiagramm ist etwas verstreuter und ich habe einen P-wert von 0,000274. Heißt das es besteht ein Zusammenhang?
Hallo Nadine, in der Statistik nimmt man - je nach Forschungsdisziplin - typischerweise ein Alpha von 0,05 (0,01 oder auch 0,001) als Grenze. Liegt der p-Wert darunter, verwirft man die Nullhypothese KEINES Einflusses der UV auf die AV. Im Umkehrschluss bekräftigt das einen darin, dass ein Einfluss besteht. Bei einem so kleinen p-Wert wie bei dir geht man also von einem Einfluss/Zusammenhang aus. Viele Grüße, Björn.
Ich habe eine Frage zum konkreten Output der linearen Regression in R: erhalte ich dabei einen direkten Effekt von UV auf AV oder einen totalen Effekt?
Wenn das Regressionsmodell y = a + b*x + Ɛ lautet und für Ɛ N(0, σ²) gilt, wie gibt man das Modell in r an? Ich hatte an lm(y ~ x, dat) gedacht, aber dann beziehe ich das Ɛ ja nicht mit ein und das könnte noch einen Teil des Modells erklären, oder? Vielen Dank! :-)
Hallo, das Epsilon ist ein Restterm, der nicht durch das Modell geschätzt werden kann. Nur UV und AV sind in die Modellierung im Programm einzugeben. Viele Grüße, Björn.
Hallo, ich versuche bei einer linearen/multiplen Regression auf den P-Wert der F-Statistik zuzugreifen. Leider finde ihn nicht in der summary() Funktion. Obwohl er ja aufgeführt wird, wenn man ihn ausführt. Kann jemand helfen? Ansonsten sehr, sehr schönes und gut verständliches Video!
Wie müsste ich vorgehen, wenn ich beispielsweise die Korrelation und statistische Signifikanz zwischen der Arbeitslosenquote und dem Wirtschaftswachstum über 20 Jahre berechnen müsste? Ich habe nur die beiden Wachstumsraten der Daten für die verschiedenen Zeiträume auf Papier ohne Excel Tabelle. Hättest du eventuell Videos, die mir zeigen, wie ich von diesem Ausgangspunkt bis zu meinem Ziel kommen kann? Habe 0 Erfahrung mit R und Excel.
Hi, tolles Video. Kannst du mir sagen, wie ich mir noch das CI für den standardisierten Regressionskoeffizienten Beta anzeigen lassen kann? Liebe Grüße
@@StatistikamPC_BjoernWalther Danke für deine Antwort. Ich dachte, das wäre der Befehl für den nicht standardisierten Regressonskoeffizient B. Ich habe die Berechnung in SPSS gemacht (Variablen Z transormiert, CI für B ausgeben lassen, ist dann ja gleich beta). Und da kommen unterschiedlich CI´s raus. Sie sind aber gleich, wenn ich auch in r z transformiere.
Ich habe in meinem Skript 14 Unterschiedliche Datensätze in einer Schleife integriert. Ergebnis sind demnach 14 unterschiedliche Graphen. Ich würde gerne "summary(model)" für jeden "Graphen" einzeln ansehen, bzw. wie "Pr" jeweils ausschaut. Wie kann ich das in mein Skript integrieren?
Hallo Laura, hast du es inzwischen gelöst? Ich hätte ja einfach eine Schleife für die die Berechnung und summary-Funktion geschrieben. Viele Grüße, Björn.
Hallo Luisa, nein, es werden in R stets die unstandardisierten Werte verwendet. Wenn du die standardisierten Koeffizienten möchtest, musst du die im Vorfeld mit scale() z-standardisieren: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-3pLZBBti1YM.html Viele Grüße, Björn.
Hallo Jan, in der Regel ist der p-Wert vom Intercept nicht wichtig. Selbst, wenn du eine Prognose mit deinem Modell rechnest, ist es unerheblich, wie der p-Wert vom Intercept ist. Das trifft im Prognose-Fall auch auf andere UV zu, wenn der F-Test signifikant ist. Bei der normalen Interpretation ändert sich nichts. Viele Grüße, Björn.
Hallo, du brauchst Dummy-Variablen für kategoriale Variablen. Erstellung: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-BhbyB5VO10k.html und Interpretation: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-zkDzNJ5jEaQ.html Viele Grüße, Björn.
Pauschal: je höher, desto besser. 1 ist der Höchstwert. Je nach Disziplin gibt es unterschiedliche "Grenzen". Psychologische Phänomene mit unzähligen Einflussfaktoren haben bei nur einem Prädiktor fast nie mehr als 0,1, meist sogar noch weniger. Wenn ich allerdings eine AV habe, die per se nur wenige Einflussgrößen hat, sollte eine oder wenige UV zumindest etwas höhere Varianzaufklärung der AV erzeugen. Ist das nicht der Fall kommen dann die typischen Fehlerquellen ins Spiel: Stichprobengröße, -auswahl, Messung latenter Konstrukte usw. Viele Grüße, Björn.
Und noch ein Themenvorschlag: Ich habe mal gehört, dass man in R auch Webcrawler basteln kann, die einem die Daten aus dem Web sammeln. Könntest du dazu vielleicht ein Tut machen?
Puh, das habe ich tatsächlich noch nicht versucht. Ich habe sowas mit Visual Basic mal geschrieben, ist aber Jahre her. Webcrawler sind auch immer so ein wenig heikel, wenn man Daten abgreift. Viele Grüße, Björn.
Wie kann ich jetzt Alpha interpretieren? Einzig als Wert, den der Abischnitt bei einem IQ von 0 annimt? Oder gibt es da noch andere Interpretationsmöglichkeiten?
Hallo Daniel, genau richtig. Wenn alle anderen Einflussgrößen 0 sind, ist das der Abiturschnitt. Das ergibt inhaltlich natürlich wenig Sinn, liegt aber in der Natur der linearen Regression. In einem Streudiagramm mit Gerade wäre dies der y-Achsenabschnitt. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke dir! Dein Video hat sehr geholfen, genau so eine Aufgabe kam auch in der Klausur dran :D Da ging es aber um durchschnittliche Ausgaben von Touristen mit den Variablen Destination und Reisejahr :)