Тёмный
No video :(

Was sind notwendige Voraussetzungen für lineare Regression? 

Statistik am PC
Подписаться 35 тыс.
Просмотров 110 тыс.
50% 1

Опубликовано:

 

5 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 103   
@derLadenhueter
@derLadenhueter 5 лет назад
Ich gebe es zu: Sogar ich als Dozent schaue deine Videos, um die richtigen Worte für die Vorlesung zu finden. Du machst einen guten Job! Weiter so und viel Erfolg bei deiner Arbeit (nehme ich mal an).
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Freut mich zu hören! Danke, Doktorarbeit ist schon abgegeben und das Verfahren im Januar durch. ;-) Viel Erfolg in den Vorlesungen und viele Grüße, Björn.
@Marcus_R
@Marcus_R 2 года назад
Danke für Deine Videos! Du schaffst mit Deinem Kanal wirklich Mehrwert. Verständlich, kurz und prägnant erklärt, anwendungsorientiert und sympathisch. Herzliche Grüße
@andreas6519
@andreas6519 2 года назад
Vielen Dank, Ihre Videos sind einfach spitze!
@SamuelJalalian
@SamuelJalalian 3 года назад
Vielen Dank für das tolle Video!
@RameshRandom
@RameshRandom 3 месяца назад
Es ist wichtig, die Voraussetzungen für Prozesskostenhilfe zu verstehen, bevor man einen Antrag stellt.
@89sammyguitar
@89sammyguitar 5 лет назад
Hallo, erstmal danke für deine klasse Videos! Ich schreibe gerade meine Masterarbeit über das Diktatorspiel und soll testen, ob ein jemand mit steigendem Grundbudget an Geld auch mehr Geld an eine unbekannte Person abgeben würde. Die Untersuchungen waren Messwiederholungen mit unterschiedlichem Anfangsbudget als sich änderndes Treatment, es wurden insgesamt 2x21 Leute untersucht alle mit allen Treatments (also Anfangsbudget), also wären es ja verbundene Stichproben mit Messwiederholung. Ich habe jetzt verschiedene Variablen mit den Grundausstattungen (-30; -15; -5; 0; 5; 15; 30), deren Werte den für jede ID dazugehörigen abgegebenen Geldbetrag annehmen. Sind die Variablen hier unabhängig und darf ich dabei eine lineare Regression durchführen (wenn ich die Daten beispielsweise ins Long-Format bringe) oder gibt es dafür ein anderes Verfahren? Vielen Dank! :)
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Sammy und danke für dein Lob! Das ist ein wenig knifflig. Ich würde aber dazu tendieren zu sagen, dass du Messwiederholungen hast. Du änderst eine Rahmenbedingung und hast 7 verschiedene Budgets zugeteilt. Wenn es dir gelingt eine Zufallsstichprobe zu ziehen, wo keine ID doppelt vorkommt, kannst du aber eine Regression rechnen. Ansonsten läuft das aber wohl auf einen Mittelwertvergleich hinaus, ANOVA mit Messwiederholung zum Beispiel. Viele Grüße, Björn.
@TheAKHadder
@TheAKHadder 5 лет назад
Deine Videos schaffen einen wunderbaren Überblick, vielen Dank!! Kurze Frage zum Epsilon: ist dort der Störterm, die Residuen oder der Standardfehler einzusetzen? yDach für die Modellvorhersagen, Residuen = yDach minus y. Epsilon steht für die nicht im Modell berücksichtigten Einflüsse und Meßfehler der abhängigen Variablen.
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Anna-Katharina, danke für dein Lob! Da herrscht Uneinigkeit bzw. Ungenauigkeit in sehr vielen Wissenschaftszweigen. Die Residuen beschreiben den Abstand zwischen beobachtetem und berechnetem Wert (der AV). Die Störgröße ist der Abstand zwischen beobachtetem und tatsächlichem Wert (der AV). Residuen kann man also berechnen, Störgrößen nicht. Was in deiner Disziplin unter Epsilon definiert ist, würde ich anhand dessen was die Mehrzahl der Autoren darunter definiert. Viele Grüße, Björn.
@sophieloah
@sophieloah Год назад
wenn ich meine BA endlich abgebe, dann nur weil deine Videos mich durch die Auswertung geführt haben! Besser als jeder Nachhilfe Lehrer - vielen Dank dafür! :) Eine Frage habe ich dennoch, und hoffe, dass ich die hier nicht überlesen habe und zum Wiederholer werde .. Bei mir gibt es im Streudiagramm bei der Regressionsgerade keine Steigung. Soll ich jetzt einfach annehmen, die ist zu klein um sie zu sehen und weiter machen oder ist das quasi schon meine Antwort, dass es keinen Zusammenhang gibt? Oder muss ich da n anderes Verfahren nehmen? Ich bin gerad etwas lost und wäre so dankbar für eine Antwort! :)
@StatistikamPC_BjoernWalther
Hallo Sophie und danke für deine Kanalmitgliedschaft! Gerne zu deiner Frage: Wenn du nur eine UV und eine AV hast und im Streudiagramm quasi eine horizontale Linie beobachten kannst, ist das ein Hinweis, dass das die einfache lineare Regression wohl kein signifikantes Modell hervorbringen wird. Zumeist sollte man dennoch das Modell rechnen und die Ergebnisse vom F-Test berichten - die zeigen dann in Zahlen, dass das Modell keinen Erklärungsbeitrag leistet. Hast du allerdings mehrere UV, würde ich das Modell dennoch rechnen, weil sich sich idR einzelne UV immer wie von dir beschrieben zeigen werden. Trifft das deine Frage? Viele eGrüße, Björn.
@sophieloah
@sophieloah Год назад
@@StatistikamPC_BjoernWalther Hey Björn. Gerne!! :) Danke dir - das beantwortet meine Frage sehr gut und wirft aber eine Neue auf. Ich muss für meine zweite Hypothese noch eine Moderator Analyse machen - kann ich das überhaupt, wenn mein Model kein signifikantes ist? also UV, AV und M. Viele Grüße & große Dankbarkeit!
@StatistikamPC_BjoernWalther
Hallo Sophie, jetzt ist der Kommentar fast durchgerutscht. Hoffentlich noch die rechtzeitige Antwort: wenn du einen Moderator aufnimmst, hast du ein neues Modell und demnach auch wieder die "Chance auf eine Signifikanz", auch weil der Moderator zusätzlich als UV aufgenommen wird. Viele Grüße, Björn.
@FilmscoreMetaler
@FilmscoreMetaler 6 лет назад
Mist, zu spät. Letzte Woche meine Abschlussarbeit über multiple lineare Regression abgegeben. Naja, ich hoffe das Beste! ;)
@VivienHa-qw4jz
@VivienHa-qw4jz 4 месяца назад
Vielen Dank für deine Hilfe in dem anderen Kommentar ! :) eine Frage zur Linearität habe ich noch, mir stellt sich trotz Statistikberatung (bei dir gabs leider keine Termine für meinen zeitlichen Rahmen, sonst hätte ich da gefragt) immer noch die Frage: wie prüfe ich denn linearität für eine binär logistische Regression? Also klar, so richtig linear ist es ja nicht, aber wird bei vielen doch als notwendiges Kriterium angesehen. Kann ich das ähnlich handhaben wie bei einer linearen Regression? Leider gibt es kaum Infos zu Vorraussetzungen für diesen Regressionstyp :( ganz liebe Grüße, Vivi
@rita.humorita
@rita.humorita 5 лет назад
Top! Danke!
@caropeter6085
@caropeter6085 9 месяцев назад
Vielen Dank für die tollen Videos! Ich suche aktuell nach einem Video zu GM4 also der Exogenität der UV und finde leider nichts. Gibt es dazu von dir einfach noch kein Video oder finde ich es einfach aktuell nicht? Würdest mir sehr weiterhelfen!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 9 месяцев назад
Hallo Caro, dazu gibt es kein Video, v.a. weil es keine analytische Möglichkeit gibt, dies zu identifizieren bzw, zu beheben. Am ehesten kann dies gekontert werden, indem auf eine saubere Herleitung des Modells (Wirkrichtung und Vollständigkeit) geachtet wird, also keine UV vergessen wurde. Dann ist die Wahrscheinlichkeit gegen GM 4 zu verstoßen sehr gering. Die Thematik Messfehler schwingt natürlich auch immer mit, was mit der Nutzung von validen Instrumenten für latente Konstrukte auch weitestgehend umgangen werden kann. Viele Grüße, Björn.
@Markus-bu6tr
@Markus-bu6tr Год назад
tolle Videos. Eine Frage: Im Video 13 zur multiplen linearen Regression erklärst du die Schulnoten über unabhängige Variablen. Die Schulnote ist doch eine ordinal skalierte Variable. Kann ich also eine Bewertung z.B. Kundenzufriedenheit oder net promotor score (Note bzw. Scorewert) über diverse unabhängige ordinal skalierte Variablen z.B. Servicezufriedenheit, Preisbewertung (Noten) vornehmen?
@basti0159
@basti0159 2 года назад
und was ist denn der Störterm? ist das epsylon in der Gleichung? Vielen Dank für das coole Video!
@punchline9131
@punchline9131 4 года назад
Könntest du auch ein Video zur Panelregression machen? Insbesondere was die vierte Gauß-Markov-Annahme angeht, würde sich ja dann eine Erklärung der Panelregression anbieten.
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo, Panelregression steht auch in meiner Liste, allerdings wird das noch ein wenig dauern. Das Stichwort Hausman-Test kennst du ja aber sicher schon. ;-) Viele Grüße, Björn.
@user-ky6qx9gu5j
@user-ky6qx9gu5j Год назад
Hallo, erstmal vielen Dank für die Erklärungen! Ich möchte gerne eine multiple lineare Regression durchführen. Dabei habe ich mehrere (also mehr als 2 ) binäre unabhängige Variablen. Wie teste ich die dann auf Multikollinearität? Muss ich das dann für jedes Paar einzeln machen? Lg
@aminaknopf5760
@aminaknopf5760 5 лет назад
Das Video ist super, vielen Dank! Könntest du nächstes Mal etwas langsamer sprechen :)
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Amina und danke für dein Lob! Ich probiere es. Im Zweifel schau es noch mal oder spiele es mit 0,75facher Geschwindigkeit ab. ;-) Viele Grüße, Björn.
@davidr5484
@davidr5484 3 года назад
@@StatistikamPC_BjoernWalther Bitte nicht noch langsamer... Schaue mir die Videos schon bei 1,5-2x an :'D
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
@@davidr5484 gut zu wissen, dass die perfekte Geschwindigkeit auch eine hohe Varianz hat. ;-) Viele Grüße, Björn.
@davidr5484
@davidr5484 3 года назад
@@StatistikamPC_BjoernWalther Hahahha, gut gesagt :D Ach und richtig gutes Videos die du machst. Ich hasse es wenn man sich für nen "kurzes" Tutorial ein 15 minütiges Video anschauen muss. Ich meine wer hat zeit für sowas :D:D:D
@yoshimura11000
@yoshimura11000 5 лет назад
Vielen Dank für deine top Videos!!!! Noch eine Frage hätte ich zu den Vorraussetzungen der Regression: Ich rechne für meine Arbeit eine Moderation, allerdings habe ich dazu keine Hypothesen aufgestellt, somit lehne ich ja auch keine ab und nehme keine an. Muss ich die Voraussetzungen dann trotzdem alle erfüllen (meine Stichprobe ist z.B. keine Zufallsstichprobe), bzw. überhaupt rechnen? Und dürfte ich dann, in den Ergebnisse trotzdem auf den p-Wert eingehen? Vielen Dank für deine Hilfe!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Mungo und danke für dein Lob! Es gilt die Faustregel: Ohne Hypothese keine Untersuchung. Das soll der Beliebigkeit in Untersuchungen Einhalt gebieten. Hypothesen sollten/müssen immer auf theoretisch-konzeptionellen Vermutungen und Begründungen beruhen. Ist das der Fall, sind bei jeglichen Regressionen (inkl. Moderation und Mediation) die Voraussetzungen zu prüfen und zu berichten. Die Zufallsstichprobe ist kein unbedingte K.O.-Kriterium. Bei einer Vollerhebung zum Beispiel. Wenn man Leute online oder auf dem Papier befragt, ist das in der Regel auch eine hinreichende Zufallsstichprobe. Das klärt man im Abschnitt der Datenerhebung. Viele Grüße, Björn.
@patiballerina8132
@patiballerina8132 5 лет назад
Ich finde deine Videos super hilfreich. Gelten diese Voraussetzungen auch für die multiple rückwärtsgerichtete Regression?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Pati, danke für dein Lob! Die Voraussetzungen gelten auch für schrittweise Regression - sowohl vorwärts als auch rückwärts. Viele Grüße, Björn.
@paulkaltenmark5921
@paulkaltenmark5921 3 года назад
Welche Eigenschaft des OLS Schätzers könnte verletzt sein falls wir eine negative Korrelation zwischen den beiden erklärenden Variablen haben?
@basti0159
@basti0159 2 года назад
Vielen Dank für das coole Video! Meinst du bei Exogenität dass der Störterm nicht mit den erklärenden Variablen korrelieren soll oder ihn nicht erklären soll? Du hast geschrieben: "Störterm sollte nicht mit erklärenden Variablen erklären [...]"
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 2 года назад
Hallo Basti, du hast recht, das ist ein Tippfehler. Korrelieren ist hier das richtige Wort. Viele Grüße, Björn.
@alexandrahoffmann8738
@alexandrahoffmann8738 6 лет назад
Hallo Björn, auch ich bin mir bei GM 4 total unsicher, alle anderen hab ich nun prüfen können. Hast Du hierzu vielleicht einen Tip in der Literatur? Ein Video von Dir gibt es leider noch nicht oder? Habe bereits bei Field und Backhaus geschaut. Die sagen aber beide nur der Störterm sollte gleich null sein, nicht wie ich es teste... Wie korreliert man denn die Störgröße und erklärende Variable? Danke Dir! Viele Grüße Alexandra
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 6 лет назад
Hallo Alexandra, die GM4 ist eine eher theoretische Überlegung und meiner Meinung nicht praktikabel zu prüfen. Die Störgröße (zur Korrelation) ist ja gerade nicht schätzbar - wäre sie das, könnte ich sie ins Modell aufnehmen und ein besseres Modell schätzen. Übrigens, nicht die Störgröße mit den Residuen verwechseln. Das ist ein typischer Fehler. Letztere kann ich ja explizit schätzen. Bei Panelmodellen nutzt man den Hausman-Test. Instrumentenschätzer wären noch eine Möglichkeit. Sie gehen davon aus, dass du deine UV durch eine andere Variable ersetzen kannst, die hoch mit jenen korreliert, dies aber nicht mit dem Störterm vorliegt - auch eine sehr theoretische Überlegung. Zusammengefasst, ein Test hierfür existiert nicht. Am sichersten bist du, wenn du geringe Messfehler und ein möglichst vollständiges Modell im Sinne von keine unberücksichtigten UV hast. Viele Grüße, Björn.
@susanneheinen5269
@susanneheinen5269 3 года назад
Wir sollen bei uns die Voraussetzungen erst zum Schluss prüfen (also nach der Regression). Wie und womit begründet man wenn Voraussetzungen nicht erfüllt worden? Bei mir entstammen die Residuen nicht aus einer normalen Grundgesamtheit und die Residuen streuen heteroskedatisch statt homoskedatisch.
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
Hallo Susanne, manche Voraussetzungen wie z.B. Verteilung der Residuen oder Streuung) kann man erst nach Rechnen des Modells prüfen. Bei Verletzung der Normalverteilung der Residuen hilft eine Transformation einer/mehrerer UV mit z.B. Log, bei Heteroskedastizität rechnest du einfach robuste Standardfehler: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-dOf03X1CHyM.html Viele Grüße, Björn.
@lizzyliz6584
@lizzyliz6584 4 года назад
Deine Videos sind mir eine große Hilfe bei meiner Abschlussarbeit, vielen Dank!! Ich hätte noch eine Frage, zu der ich im Netz keine Antwort finden kann. Irgendwo habe ich gelesen, dass die Voraussetzung der Normalverteilung bei großen Stichproben nicht erfüllt sein müsse. Ist das wahr? Meine Stichprobe ist n=4000 und leider nicht normalverteilt (lässt sich auch nicht in eine annähernd normalverteilte Variable transformieren). Ich wäre für eine Antwort sehr dankbar :)
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Lizzy und danke für dein Lob! Bei einer Regression sollten die Residuen normalverteilt sein. Sind sie das nicht, hilft auch eine größere Stichprobe nicht unbedingt dabei. Wie hast du auf Normalverteilung der Residuen getestet? Wenn es analytisch war, kannst du diesen ignorieren und solltest grafisch prüfen. Mehr dazu hier: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-HKvOLhZ36D0.html Viele Grüße, Björn.
@michellev.6476
@michellev.6476 4 года назад
Hallo, vielen Dank für deine tollen Videos! :) Ich hätte eine Frage an dich und zwar erfüllt meine Stichprobe nicht die Voraussetzungen, womit ich wohl keine lineare Regression angewenden kann. Was könnte ich alternativ verwenden? Meine Stichprobe ist zudem sehr klein (
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Mitchel, gerne doch! :-) Welche Voraussetzungen werden denn nicht erfüllt? Viele Grüße, Björn.
@arlenahoffmann4314
@arlenahoffmann4314 4 года назад
Hallo! Deine Videos sind eine unglaubliche Stütze bei der Anfertigung einer quantitativen Forschung. Danke dafür! Ich habe dennoch eine wichtige Frage: Ich möchte hinsichtlich einer Moderationshypothese den moderierenden Einfluss von einer kategorialen Variable (MOD) auf den Zusammenhang zwischen einer weiteren kategorialen Variable (UV) und abhängige Variable untersuchen (N=35 pro Gruppe / Experimental vs Kontrollgruppe). Ich Stoße hinsichtlich der Voraussetzungsprüfungen aber immer wieder vor Hindernissen. Wie kann ich z.B. ein Streudiagramm mit nur 2 kategorialen Variablen erstellen (ich erhalte da nur vertikale 2 Linien), und darf ich mit 2 kategorialen Variablen überhaupt eine Moderation & multiple Regression rechnen? Falls ja, was muss man dabei beachten? Vielen Dank!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Arlena, danke für dein Lob! Die Linearitätsprüfung für kategoriale Variablen kannst du ignorieren, es gibt ja keine Reihenfolge, in der du die Variablenausprägungen bringen kannst. Genrell muss die Linearität nicht unbedingt so akribisch geprüft werden, da dir letztlich ein signifikantes Modell in gewisser Hinsicht Linearität bescheinigt. Eine lineare Regression ist meist auch eine gute Approximation von nicht linearen Zusammenhängen. Wichtiger als strikte Linearität ist eher Heteroskedastizität, Multikollinearität oder normalverteilte Residuen. Viele Grüße, Björn.
@petrazollner8617
@petrazollner8617 3 года назад
Lieben Dank für die tollen Videos! Wie ist das mit der Normalverteilung bei der Linearen Regression, müssen die Abhängigen und/oder Unabhängigen Variablen ebenfalls normalverteilt sein? Vielen Dank für eine Rückmeldung!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
Hallo Petra, gern geschehen. Schau zu deiner Frage mal hier rein: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-Ibl33-e56U0.html Es geht nur um normalverteilte Residuen, AV und UV können beliebig verteilt sein. Viele Grüße, Björn.
@anja8301
@anja8301 4 года назад
Lieber Björn Walther, vielen Dank ersmal für deine super Informativen Viedeos! Ich habe eine Frage zur Überprüfung der Linearität bei der Moderation. Ich hätte sie nur für der Zusammenhang von UV und AV geprüft, aber nicht für den Moderator und die AV und nicht für dern Interaktionsterm und die AV. Ist das richtig? Oder muss ich das für die anderen 2 fälle auch prüfen? Viele Grüße
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Anja, normalerweise ist das für die Haupteffekte und den Interaktionseffekt ist das separat zu prüfen. Wenn dein Modell eine signifikante ANOVA hat, stellt sich die Frage allerdings meist ohnehin nicht mehr, da es eine Mindestgüte hat. Besser geht natürlich immer, es ist nur die Frage ob ein nichtlineares Modell mit seinem Mehraufwand in Relation zu dem (meist geringen) Mehrnutzen steht. Viele Grüße, Björn.
@anja8301
@anja8301 4 года назад
@@StatistikamPC_BjoernWalther Vielen Dank für Deine Antwort! Das ist jetzt bestimmt eine dumme Frage: also ist eine Regression auch immer eine ANOVA? Bzw. meinst du damit wenn die Regression signifikant wird?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Anja, ich meinte damit, dass die ANOVA signifikant ist und dir damit anzeigt, dass dein Modell einen Erklärungsbeitrag leistet. Viele Grüße, Björn.
@moingude
@moingude 3 года назад
Hallo, Meine UV und die AV sind ordinal skaliert. Beide Haben die gleiche Skala (1-4). Scheinbar kann ich die Linerare Regression nicht anwenden, da ja die AV metrisch sein soll. Welchen Test könnte ich stattdessen machen, um eine Korellation herzustellen? Vielen Dank und beste Grüße
@gundulalehmann7793
@gundulalehmann7793 6 лет назад
Hi, ich verstehe leider nicht so ganz wie ich die Exogenität der UV (GM 4) mit SPSS überprüfen kann. Hilfe wäre super!:)
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 6 лет назад
Hallo Leonie, da werde ich demnächst ein Video zu machen. Das ist jetzt hier schlecht erklärbar. Viele Grüße, Björn.
@verenagraf9827
@verenagraf9827 4 года назад
Statistik am PC Hallo, ich habe das selbe Problem. Wo finde ich denn das Video?
@Simenter13
@Simenter13 4 года назад
@@verenagraf9827 Ich auch :) Gibts das mittlerweile?
@montgomeryhartman476
@montgomeryhartman476 3 года назад
GM4 ist mir immer noch ein Rätsel
@timmr7113
@timmr7113 4 года назад
Reicht es aus signifikante Korrelationen zwischen Störterm und unabhängiger Variable auszuschließen um Exogenität anzunehmen? Also indem man quasi einfache bivariate Korrelationen rechnet oder muss man z.B. den Hausmann-Test anwenden? Dieser ist ja leider bei SPSS nicht implementiert.. Nochmals vielen Dank für deine Videos und ich würde mich über eine Antwort sehr freuen.
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Tim, das ist ein schwieriges Thema, gerade in SPSS. Normalerweise würde man dem argumentativ begegnen und es dabei belassen (müssen), weil du ja eigentlich das bestmögliche Modell ex-ante schon formulieren solltest. Auch mit der Erkenntnis, dass Endogenität vorliegt, kann man nur schwer etwas anfangen, da dies ja mehr oder weniger auf ein unterspezifiziertes Modell hinweist und dann die Suche nach der Nadel oder besser gesagt der UV im Heuhaufen beginnt. Viele Grüße, Björn.
@BartwurstGaming
@BartwurstGaming 2 года назад
Hallo Björn, zunächst einmal vielen Dank für das tolle Video! Ich weiß gar nicht was ich ohne dich machen würde 😅 Ich hätte eine Frage zum Skalenniveau der *unabhängigen* Variable. Wenn ich in einer Umfrage das Alter der Probanden mit Hilfe von Altersgruppen abgefragt habe (z.B. 0-18 Jahre, 19-30 Jahre, 31-40 Jahre, ...), würde diese Variable dann noch als ordinalskaliert (und damit als für eine lineare Regression zulässig) gelten? Einerseits lassen sich die Altersgruppen eindeutig ordnen (0-18 Jahre = 0, 19-30 Jahre = 1, 31-40 Jahre = 2, ...). Andererseits sind die Altersgruppen in ihrer Größe unregelmäßig, d.h. sie umfassen ungleiche Spannen (18 Jahre, 11 Jahre, 9 Jahre, ...). Ich frage mich auch, ob eine Likert-Skala als ordinalskalierte, unabhängige Variable eingesetzt werden kann. Könnte man diese in dieser Form in einer linearen Regression verwenden: z.B. Stimme voll und ganz zu = 0, Stimme eher zu = 1, Weder noch = 2, Stimme eher nicht zu = 3, Stimme überhaupt nicht zu = 4? Ich danke dir für deine Hilfe! 😊
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 2 года назад
Hallo und danke für dein Lob. Altersgruppen zu erstellen ist kein Problem, sofern es begründet ist. Solange es auch nur eine UV ist, ist das Skalenniveau salopp gesagt sogar egal. Hauptsache die AV ist metrisch oder zumindest quasi-metrisch (Skalenmittelwert über mehrere Items). Viele Grüße, Björn.
@BartwurstGaming
@BartwurstGaming 2 года назад
@@StatistikamPC_BjoernWalther Das klingt gut. Vielen Dank für deine Antwort! :)
@Simenter13
@Simenter13 4 года назад
Hallo Björn, danke für das Video! Eine Frage: Ich habe mehrere Kontrollvariablen (Alter, Geschlecht, Familienstatus,...) und würde diese gerne ins Modell aufnehmen um zu überprüfen, ob sie die AV signifikant beeinflussen. Das darf ich aber nicht, weil sie nicht metrisch verteilt (z.B. Geschlecht ist nominal) sind, oder? Wie kann ich es sonst überprüfen? DANKE und Gruß aus Bayreuth, Benjamin
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Benjamin, gerne doch. Du kannst Kontrollvariablen unabhängig ihrer Skalierung ins Modell aufnehmen. Nur die AV sollte metrisch sein. Bei nominalen UV musst du, sofern mehr als zwei Ausprägungen existieren eine Dummycodierung vornehmen: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-KjiqXDGgwbk.html Bei Geschlecht gibt es nur 2 Ausprägungen (=dichotom), weswegen du die nicht Dummycodieren musst. Viele Grüße, Björn.
@rokie5536
@rokie5536 6 лет назад
Hallo! Danke für deine stets tollen Videos! Ich hätte eine Frage zu hierarchisch linearen Modellen (gehört doch auch zu den Regressionen). Welche Werte werden zur Signfikanzprüfung in wissenschaftlichen Arbeiten standardmäßig angegeben?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 6 лет назад
Hallo Ro! Danke für dein Lob! Prinzipiell würde ich schauen, wie andere Autoren in peer-reviewd journals dies getan haben. In Field (2012), Discovering Statistics using IBM SPSS, S. 862-863 ist dies noch mal schön zusammengefasst. Entweder in der Bibliothek deines Vertrauens, bei Google Books oder direkt bei Amazon (amzn.to/2FgFFnq) mal schauen. Das Abtippen von den ganzen hoch- und runtergestellten Dingen macht sich leider echt schlecht. Viele Grüße, Björn.
@lisahi5348
@lisahi5348 3 года назад
Tolles Video! Wie kann man denn in SPSS die 1. Annahme berechnen?
@MarfChecker
@MarfChecker 3 года назад
Ich habe die gleiche Frage. Wie kann ich das wissen ohne die Lineare Regression durchzuführen?
@Kugelbitz97
@Kugelbitz97 3 года назад
Hierzu könnt ihr Euch bspw. Streudiagramme ausgeben lassen, daran lassen sich relativ gut lineare Zusammenhänge erkennen. Seid ihr euch dennoch unsicher, könnt ihr die Streudiagramme mit dem LOWESS-Verfahren erweitern. Ggf. eignet sich auch ein Residuenplot :)
@tannybunny1588
@tannybunny1588 4 года назад
Hallo, Super Video! Hat mir sehr geholfen. Könntest du noch die Quellen mit angeben, wo du dies recherchiert hast? Damit man im Zweifel noch etwas genauer nachlesen kann? Ich habe zum Markov-Gauß Theorem nur englische Liter gefunden. :-( LG
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Tanny, danke für dein Lob! Mit deutschen Quellen ist es immer etwas schwierig. Kockelkorn (2018), Lineare statistische Methoden, S. 331. Da geht es um den besten linearen unverfälschten Schätzer, welcher das Ergebnis der erfüllten Gauß-Markov-Theoreme ist. Viele Grüße, Björn.
@marieb.1464
@marieb.1464 5 лет назад
Hallo :) ich schreibe gerade meine BA und Psychologie und wolltefragen, ob du auch eine Quelle hast, für diese Methode? Lg und danke für das tolle Video!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Marie, bei Andy Field gibt es das noch mal: amzn.to/2Akbwzt S. 385-388. Viele Grüße, Björn.
@Anne-xg6qt
@Anne-xg6qt 5 лет назад
Vielen Dank für dein Video! hast du vllt noch eine quelle für mich zum genauen nachlesen?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Sophie, bei Andy Field gibt es das noch mal: amzn.to/2Akbwzt S. 385-388. Viele Grüße, Björn.
@katherina5583
@katherina5583 3 года назад
Frage: Plan meiner Arbeit war eine multiple Regression mit 6 Prädiktoren zu rechnen, beim Testen der Voraussetzungen leider festgestellt das Linearität des Zusammenhangs (graphisch geprüft mit Plot Diagram und Lowes gerade reingelegt bei SPSS) leider nur 4-5 der Prädiktoren noch vertretbar wäre. Lasse ich den Prädiktor bei dem der Zus. nicht linear ist dann weg? Oder muss ich mich eher in polynominale Regression einlesen, wobei es ja nur bei einem nicht geht? Oder trotzdem multiple rechnen und diskutieren dass bei dem einen Prädiktor Zus. nicht komplett linear? SEHR Dankbar für Tipps, trotz langer Recherche habe ich keine konkrete Antwort auf meine Frage finden können. LG und danke für die tollen Videos, sind derzeit meine Rettung :)
@Kugelbitz97
@Kugelbitz97 3 года назад
Moin, ich hatte ein ähnliches Problem. Hast du schon versucht, die entsprechenden Variablen zu transformieren? (Stichwort Potenzleiter). Das hat mir geholfen. Ansonsten ist es dir überlassen, ob du die Variable entfernst oder nicht, hierbei solltest du jedoch argumentieren, wieso du wie vorgegangen bist. Die Elimination einer nicht-linearen Variable stellt nicht zwangsläufig die bessere Alternative dar. Viel Erfolg!
@katherina5583
@katherina5583 3 года назад
@@Kugelbitz97 Cool, danke für den Hinweis - nein das habe ich bisher noch nicht gemacht. Schau ich mir dann aber auf jeden Fall mal an :)
@katherina5583
@katherina5583 3 года назад
Das heißt aber du hast nur die entsprechende Variable transformiert und die anderen so gelassen wie sie sind und dann mit transformierter und "normalen" Variablen die Regression berechnet?
@Kugelbitz97
@Kugelbitz97 3 года назад
@@katherina5583 Ja ganz genau, ich habe nur die entsprechende Variable transformiert. Beachte aber bitte später bei der Interpretation der Regressionskoeffizienten, wie du die Variable transformiert hast ;)
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
Noch kurz meine Meinung dazu. Eine Nichtlinearität eines Koeffizienten zur AV ist kein Problem und kein zwingender Grund für einen Ausschluss oder eine Transformation. Korrelation ist ja letztlich nur eine univariate Betrachtung, die im multiplen Regressionsmodell nur bedingt standhält. Im schlimmsten Fall zeigt sich eben kein linearer Zusammenhang der einen UV zur AV unter Beachtung der anderen Zusammenhänge (UV zu den UVs). Das Gesamtmodell wird wohl dennoch einen signifikanten F-Test ausweisen. Ein nichtlineares Modell zu rechnen, wie eingangs erwähnt, ist in jedem Fall zu begründen und erst dann zu rechnen - ist aber gerade bei der Interpretation sehr unschön und wie gesagt auch bei dessen Begründung. Eine Transformation der einen Variable ist natürlich auch denkbar, aber auch da hat Niklas schon richtig gesagt, dass du auch hier die Nichtlinearität und die Transformation infolge dessen zu begründen hast. Viele Grüße, Björn.
@Inexorablehorror
@Inexorablehorror 3 года назад
Du sagtest "Zufallsstichprobe: sowieso", naja ich kenne fast keine Forschung, die Zufallsstichproben benutzt (außer ggf. Telefoninterviews mit Schwedenschlüssel oä).
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
Hallo, "zufällig" lässt hier Raum für Interpretation. Wenn gewisse Konditionen untersucht werden sollen, sucht man natürlich nach Untersuchungsobjekten mit solchen Konditionen - die Auswahl ist dann aber immer noch innerhalb dieser Gruppe zufällig. Wenn Onlineumfragen geteilt werden, bestimmt man sicherlich mit den gewählten Medien, auf denen sie geteilt werden auch ein Stück weit die Untersuchungsobjekteigenschaften. Da kann man sozusagen noch von eher zufällig sprechen. Das geht sehr schnell in die philosophische Richtung. Viele Grüße, Björn.
@Inexorablehorror
@Inexorablehorror 3 года назад
@@StatistikamPC_BjoernWalther Ich würde dir zustimmen, dass es sicherlich ein wenig philosophisch ist ;-) aber genau genommen sind alle Stichproben, bei denen die Untersuchungsobjekte nicht durch eine Zufallsauswahl aus der definierten Zielpopulation bestimmt werden, keine Zufallsstichproben. Das Problem ist dabei nicht die eigentliche Gelegenheitsstichprobe (obwohl alle Teststatistiken nur für Zufallsstichproben gelten und daher fraglich, in wie weit sie sinnvoll anwendbar sind, lässt sich ja nicht prüfen, muss man so annehmen), sondern dass viele Personen die Ergebnisse einfach so interpretieren und vor allem generalisieren, als ob es eine Zufallsstichprobe sein würde. Es kann aber ein deutlicher Bias vorhanden sein. Das ist auch vielen professionellen Anwendern nicht klar oder sie ignorieren es. Bei der Onlineumfrage wäre die Zielpopulation ja nur Personen im bestimmten Altersbereich, die Zugang zum Internet haben und ausreichend in sozialen Medien unterwegs sind, um auf die Umfrage aufmerksam geworden zu sein (etc.) und nicht alle Personen generell in diesem Altersbereich. Aber danke für die Videos, die sind wirklich gut und verständlich gemacht!
@jan-fn3lz
@jan-fn3lz 5 лет назад
Hey, tolles Video. Eine Frage habe ich dennoch. Was bedeutet es, wenn jemand fragt, ob ich bei einer multiplen Regressionanalyse "enough Cases for the control of discrimination" habe?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
Hallo Jan und danke für dein Lob! Die Aussage ist etwas kryptisch, spielt aber sehr wahrscheinlich auf die Power an. Also, ob du für die Anzahl deiner Variablen genügend statistische Power hast, einen Effekt entdecken zu können. Diese Power hängt maßgeblich von der Größe deiner Stichprobe ab. Faustregel: größer ist besser. Dazu gibt es auch ein Video bei mir: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-4kl9zb1fqQU.html Viele Grüße, Björn.
@jan-fn3lz
@jan-fn3lz 5 лет назад
@@StatistikamPC_BjoernWalther Toll Danke für die Antwort! Vielleicht kannst du bei Gelegenheit auch mal was über den RAMSEY Reset berichten und wie man damit umgeht. VG Jan
@Drashuq
@Drashuq Год назад
Das Video hat mir so sehr geholfen, vielen lieben Dank 🙏🏽😄 Hast Du auch ein Video zur Regressionen und Beziehungen von Log log, level level, log level etc ? Vielen Dank im Voraus!
@copperredable
@copperredable 4 года назад
Hallo, ich bin ein bisschen über deine Aussage bei 4:04 gestolpert.. Die UV muss (z.B. bei einer Mediationsanalyse) doch nicht ordinal sein, sondern kann auch nominalskaliert sein, oder?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo, die UV kann alle Skalenniveaus annehmen. Es ist meist nur für die Interpretation und für die Voraussetzungsprüfung einfacher, wenn sie metrisch bzw. ordinal ist. Zum kategorialen Fall der UV gibt es auch hier ein Video: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-MjvnwcsgxBo.html Viele Grüße, Björn.
@dianahincapie863
@dianahincapie863 4 года назад
Hallo, erstmal danke für deine klasse Videos! Kannst du mir bitte die Literatur nennen, die du für die Erstellung des Videos benutzt hast?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 4 года назад
Hallo Diana und danke für dein positives Feedback! Es ist schon ein Weilchen her, es war mit Sicherheit ein englischsprachiges. Deutschsprachig fand ich die Ausführungen hierin: amzn.to/2QRMKQb nicht ganz verkehrt. Genauer gesagt der Artikel darin: Rottmann H., Auer B. (2010) Das lineare Regressionsmodell und seine Annahmen, S. 435-457. Viele Grüße, Björn.
@maximilianfri3807
@maximilianfri3807 3 года назад
Hättest du eine Beispielliteratur zur Hand, bei der auf den Grenzwert von Korrelation von 0,7 hingewiesen wird? Danke!!
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 3 года назад
Hallo Maximilian, Field, Discovering Statistics Using SPSS (2018), S. 402. Viele Grüße, Björn.
@maximilianfri3807
@maximilianfri3807 3 года назад
@@StatistikamPC_BjoernWalther vielen Dank!!
@piaregolien821
@piaregolien821 5 лет назад
Gibt es denn eine Regressionsanalyse die ich benutzen kann, wenn meine AV metrisch ist und meine UVs ordinär sind und nicht alle normalverteilt sind ?
@piaregolien821
@piaregolien821 5 лет назад
ach ja und meine Stichprobe nur N=27 ist
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 5 лет назад
@@piaregolien821 Hallo Pia, im Falle einer linearen Regression können deine UVs sämtliche Skalenniveaus annehmen. Normalverteilt müssen sie auch nicht sein, lediglich die Residuen müssen normalverteilt sein. Viele Grüße, Björn.
@dance_fitness_yoga
@dance_fitness_yoga 4 года назад
@@StatistikamPC_BjoernWalther Wenn ich mir die Literatur anschaue, wird immer wieder erwähnt, dass auch die UV intervallskaliert sein sollte. Wo finde ich in der Literatur andere Angaben dazu? Ich muss untersuchen, wie Branchengruppen (ca. 7 Gruppen, zudem "keine Angabe" oder "nicht zuzuordnen"), Alter und Geschlecht das Präventionsverhalten vorhersagen. Ist es korrekt, dass ich "nur" die Branchengruppen in Dummy-Variablen transformieren muss? Muss ich dabei alle Antworten mit "keine Angaben" und "nicht zuzuordnen" als fehlende Werte eingeben? Oder eignet sich in diesem Falle die einfache Regressionsanalyse nicht?
@bestLetsplayer
@bestLetsplayer 2 года назад
Hey, wie überprüft man denn die Annahmen?
@StatistikamPC_BjoernWalther
@StatistikamPC_BjoernWalther 2 года назад
Hallo, die meisten sind in dieser Playlist. Ansonsten einfach nach den Stichworten auf RU-vid/Kanal suchen, da bekommst du die entsprechenden Videos. Viele Grüße, Björn.
@bestLetsplayer
@bestLetsplayer 2 года назад
​@@StatistikamPC_BjoernWalther Danke dir, für die super Erklärung der Vorraussetzungen übrigens! Hast du eine Quelle für diese 6 von dir beschriebenen Gauß-Markov Annahmen? Dann könnten wir dich mit der Quelle in unserem Paper zitieren :D
Далее
Lineare Regression: Einfach erklärt
16:48
Просмотров 73 тыс.
У ГОРДЕЯ ПОЖАР в ОФИСЕ!
01:01
Просмотров 4,2 млн
T-test, ANOVA and Chi Squared test made easy.
15:07
Просмотров 291 тыс.
17.3 Multiple Regression Vorraussetzungen
9:53
Просмотров 12 тыс.
How To Perform Simple Linear Regression In Excel
14:51
Просмотров 435 тыс.
У ГОРДЕЯ ПОЖАР в ОФИСЕ!
01:01
Просмотров 4,2 млн