교수님 나중에 latent variable part(y*)에서 오차항의 분포가정으로 logit 과 probit 모형 혹은 다른 link function(clog,...)으로 나뉘어질수있는데, 오차항의 pdf 와 cdf 그래프를 시각적으로 보여주시면 감사하겠습니다. 한국어로된 영상중에 가장 좋은 영상인것같습니다 항상 감사합니다.
지적하신대로 정확한 표현이 맞습니다. 수학에서는 밑수가 생략된 경우는 자연로그를 의미하는 경우가 일반적입니다. 그런데 어떤 학문분야에서는 생략하면 상용로그가 되기도합니다. 이 영상을 여러 전공자가 볼 수 있으므로 정확히 ln 으로 표시해야했는데 신중하지 못했습니다. 지적 감사합니다.
논문을 쓰시는 경우라면 변수란을 차례로 독립변수, 통제변수 나눠서 표시하는 경우가 일반적입니다.(전공에 따라 약간 다를 수도 있습니다) 우리가 관심을 갖는 것은 다른 통제변수의 영향을 제거하고 독립변수만의 영향을 알고자 하는 것이라서 통제변수에 대한 해석은 별로 중요하게 생각하지 않습니다. 단지 직관적으로 이해가 가능한 수준이어야 겠죠. 심지어 통제변수는 VIF가 커도 종속변수에서 통제변수의 영향력을 제거한다는 차원에서 다 포함시키기도 합니다. 굿럭~
안녕하세요. 로지스틱 회귀분석에 대한 자료를 찾다가 발견하였고, 공유해주신 자료를 감사한 마음으로 시청하였습니다. 여전히 어렵고 질문 사항이 있어서 글을 남겨봅니다. 동영상 마지막에 일자리 형태를 다른 독립변수들과 함께 넣고 로짓 회귀 분석을 하면 유의한 영향을 주지 않는 것으로 나왔지만, 일자리 형태만 따로 로짓 회귀 분석을 하면 유의한 영향을 주는 것으로 결과가 나왔다는 것으로 이해하면 될까요? 이게 맞다면, 실제 논문에서는 이런 변수들은 따로 단순 로짓 회귀분석을 해서 제시하는 것이 적절한지요? 선형 중다 회귀분석 같은 경우, 엔터 방식으로 투입해서 나온 회귀식의 계수는 다른 독립변수들의 영향을 통제한 상태에서 해당 독립변수의 영향력이라고 보는 것과 마찬가지로 로지스틱 회귀분석에서도 해석하면 되는 것인지요? 바쁘실테지만 답변 부탁드립니다.
질문 감사합니다. ㅎ 일단 고용형태와 근로형태 모두 유의했습니다. 단지 일용직만 유의하지 않았죠. 어쨌든 여러변수를 포함한 회귀식(다른 변수를 통제한 변수식)에서 유의하지 않은 변수가 개별적으로 단순회귀를 하든가 유력한(?) 변수를 제외하면 유의해지는 경우가 생기죠. 그래서 논문의 경우 모형에 어떤 변수를 포함하였는가가 디펜스때 논란이 되기도 합니다.(그래서 기존의 연구에 포함되었던 변수를 일단 다 포함시키는 것이 관례) 다중회귀에서 설명드린 바와 같이 따로 분석하는 것은 바람직하지 못합니다.
SPSS는 로짓회귀에서 VIF값을 제공하지 않습니다. 그래서 VIF값이 필요하면 일반회귀분석으로 구합니다. 똑같이 종속변수, 독립변수 넣고서 VIF값만 가져다 씁니다. 조금 이상하게 보이겠지만... 다중공선성은 독립변수들(X행렬)의 종속성에 관한 것이고 이를 계산할 때 (X'X)값을 이용하기 때문에 VIF값은 동일하게 구해집니다. 그렇다면 왜 SPSS에서는 로짓회귀에서 VIF 값을 제공하지 않을까요. 다중회귀에서는 회귀계수의 추정이 (X'X)^-1X'y 공식을 이용하지만 로짓에서는 이 공식이 아닌 뉴턴 랩슨같은 반복측정으로 구하죠. 그러니 수학적으로는 다중공선성이 영향을 안준다고 생각할 수도 있기때문에 엄밀함때문에 제공하지 않는 것이 아닌가 조심스레 추측해봅니다. 그러나 많은 학자들이 여전히 로짓회귀분석에서 VIF로 다중공선성을 진단하고자 하니... 일반회귀분석에서 그 값만을 가져오는 방법을 권합니다.