다들 아시다시피, 잠재변수 A(측정변수 a1, a2), 잠재변수 B(측정변수 b1, b2)가 있을 때 a1, a2가 잠재변수 B와 그 어떠한 관계도 인정하지 않으면 CFA이고, 관계를 인정하면 EFA입니다.(잠재변수 B의 경우도 마찬가지입니다.) 즉, CFA에서는 b1, b2와 잠재변수 A의 관계는 없으며 EFA에서는 a1, a2 뿐만 아니라 b1, b2도 잠재변수 A와 관계가 인정됩니다. 여기서 관계라는 의미는 공분산(or 이를 표준화한 상관계수)을 말합니다. 그래서 SEM의 옛 명칭이 공분산구조분석(CSV)이었습니다. 확인(confirmatory) 또는 탐색(exploratory)라는 말이 상황에 따라 이해가 쉽지 않을 경우가 많은데, 간단히 말해서 처음 연구되는 분야 또는 주제인 경우 솔직히 잘 모르니까 a1, a2, b1, b2는 모두 잠재변수 A와 B 모두와 관련이 있다고 보고 요인분석을 해보자~~~ 이게 탐색적 요인분석입니다. A, B를 측정하려고 만든 a1, a2와 b1, b2이지만 처음이고 잘 모르니까 예를 들어 a1이 A만 측정하는 것인지 B도 측정을 많이 하고 있는지 등에 대해서 가능성을 두고 요인분석을 하는 것이 EFA라고 봅니다. 대부분의 연구에서는 선행연구들을 바탕으로 이론이 전개되기 때문에 CFA를 사용하게 됩니다. 사실 CFA를 하게 된 이유는 SEM 때문입니다만. 그럼 SEM에서 EFA와 CFA를 동시에 해야 하나 아니면 CFA만 해도 되느냐의 의문점이 생기게 되는데 CFA만 해도 상관이 없다고 봅니다만 국내에 SEM이 도입될 당시 CFA라는 요인분석이 생소하다보니 많은 심사위원들이 EFA(즉, spss로 한 요인분석)를 요구하기도 했습니다. SEM에서 CFA를 하는 또 다른 이유로 개인적 견해는 잠재변수들의 구조를 명확히 보려하기 때문이라고 생각합니다. SEM의 특징 중 하나가 측정모형과 잠재모형을 동시에 본다(계산한다)는 것인데 측정모형 자체가 CFA의 한 부분입니다. 만약 A와 b1 또는 b2의 관계를 인정해 버리면 A의 계산값은 a1, a2 관계만 인정한 계산값과 분명 달라질 겁니다. A는 a1, a2와만 관계있고 B는 b1, b2와만 관계가 있다는 전제하에서 A와 B의 관계가 명확해진다고 보는 것입니다. 물론 선행연구에서도 이 결과를 따르고 있겠지요. 그러니 CFA는 선행연구, 이론들이 바탕이 되어야 한다고 하는 것이라고 봅니다. 좀 더 자세한 내용들, 부가적인 내용들은 www.sciencedirect.com/topics/social-sciences/confirmatory-factor-analysis 에서 간략 간략하게 참고하시면 좋을 듯 합니다.
좋은 강의 감사합니다. 빡논교수님 강의 순서대로 차근차근 잘 듣고 있습니다. 그런데, 질문 하나 드려도 될까요? 저는 유의확률 F변화량과 그냥 F변화량이 뭐가 다른 건지 잘 와닿지가 않습니다ㅠㅠ 독립변수가 종속변수를 설명하는 데 있어 통계적 유의성을 지닌다는 표현과 회귀 모형이 적합하다는 표현이 어떤 차이가 있는 건가요? 저는 그게 그 말처럼 느껴져서요ㅠㅠ
답이 좀 늦었네요. 양해 부탁 드리며 질문에 대해 답변 남깁니다. 위계적 회귀분석 결과가 유의하다고 해석하려면 2가지 조건을 충족해야 합니다. 첫째, 결정계수(R2)의 변화량이 유의할 것 둘째, 각 변수의 계수가 유의할 것 위 조건 중 첫째 조건의 충족 여부를 검토하기 위해 모형 요약표를 살피게 됩니다. 이 모형 요약표에 제시되어 있는 F 통계량은 결정계수인 R2의 변화량이 통계적으로 유의한지 검토하는 데 필요한 검정통계량입니다. 그런데 F 통계량이 질문하신 것처럼 한 곳에 더 나옵니다. 즉, 분산분석 표에도 나옵니다. 이 F 통계량은 귀무가설인 '회귀선의 기울기가 0이다.'를 기각할지 여부를 판단할 때 쓰이는 검정통계량입니다. 이렇게 설명 드리면 이해하기 어려울 겁니다. 그래서 이 F 통계량은 '분석을 실시한 회귀모형이 통계적으로 쓸모가 있는지 여부'를 판단할 때 검토하는 통계량으로 이해하시면 됩니다. 이것이 유의하지 않게 나오면, 계수 표에 제시되어 있는 여러 검증 결과들이 아무런 쓸모가 없게 된다고 생각하시면 됩니다. 그래도 이해가 안 되면 다시 댓글 남겨 주세요. 열공하시고요~
안녕하세요. 좋은 강의 감사합니다. 다중회귀분석을 하려고 하는데 독립변인으로 월평균소득, 하루 평균 양육 시간을 사용하려고 합니다. 소득과 양육시간을 그 자체로 주관식으로 적었다면 비율척도인데 제가 설문을 받을 때는 구간으로(예. 300~500만원, 500~700만원... / 3~5시간, 5시간 이상...) 응답을 받았습니다. 그래도 이것은 양적척도가 맞는지 답변 부탁드립니다. 감사합니다.
안녕하세요! 질문이 있어 댓글 남깁니다 변수 설정할때 1개의 변수에 여러개의 하위요인으로 임의로 나누어놓았는데, 해당 하위요인들을 요인분석을 하니 2개이상의 변수로 추출되어서 난감하네요... 추출되는 요인을 1개로 고정하면 설명된 총 분산력 값이 10%정도가량 낮아지게 되어 51%가 됩니다 1개의 추출요인만 나오도록 조작한다면 다른 통계기법을 사용할때 문제가 될까요? 아니면 추출개수 조작 없이 자연적으로 2개이상 나온 하위요인들은 과감히 버려서 한개만 나오도록 해야 할까요 ㅜㅜ
@@alice990957 일단 전제가 잘못된 것 같아 이 부분을 어떻게 처리했는지 확인할 필요가 있겠네요. 여러 개의 하위 요인을 임의로 나누었다고 하셨는데, 이렇게 임의로 하시면 안 됩니다. 해당 측정도구 개발자가 단일요인으로 봤다면 선생님도 단일요인으로 봐야 합니다. 선생님 임의대로 여러 개로 나눠서는 안 됩니다. 이에 대한 의문이 해소돼야 그 후 질문에 대해 답할 수 있겠네요.
중심극한정리 강의내용이 제가 갖고 있는 모든 통계학교재와 완전히 다름니다. 평균이 1인 지수분포에서 표본크기 2개, 표본집단 크기 n = 1000 을 뽑아 히스토그램을 그려도 정규분포와 같아지지 않는 사례가 있습니다. 방송대 교재 "확률의 개념과 응용" 입니다. 뭐가 맞는 것인지 헷갈리네요! 좀 더 명확한 설명을 부탁드립니다.
선생님 덕에 변수 입력 모두 완료했습니다 감사합니다!! 데이터 입력에 궁금한점이 있는데, 꼬리질문으로 특정문항에만 답을 하고 안할때는 데이터 입력을 어떻게 해야할까요? ㅠㅠ 1번 문항에서 예-> 1-1로, 아니오-> 1-2 로 이동했다면,,, 각각 해당되지 않는 질문의 데이터에는 0을 기재하는 것인지 궁금합니다..ㅠㅠ
교수님 안녕하세요! 하나씩 차근차근 설명해주셔서 이해가 정말 잘되었습니다 감사합니다. 궁금한 게 있는데요, 6개의 집단을 일원배치분산분석 했는데 출력결과 ANOVA표에서는 P값이 0.067로 유의미하지 않다는 게 확인하였는데 맨 아래 사후검정표에서는 a<e,f로 차이가 있다고 나오더라고요 ㅠㅠ 혹시 ANOVA표에서 유의미하지 않다는 걸 확인했으니 결과를 작성할 때 유의미하지 않다고 작성하면 될까요?
안녕하세요 선생님 강의 잘 들었습니다. 제가 처리하는 데이터 관련해서 질문 드립니다. 현재 시계열 데이터들을 분석 중인데 상관관계는 0.4 ~ 0.5 수준인데 유의수준이 0.15 ~0.3 정도입니다. 유의수준이 높게 나오는 원인으로는 변수간에 끼치는 영향에 있어서 중간에 lag 텀이 있어서 유의수준이 높게 나오는 것이 아닐까 입니다. 이런 데이터들은 어떤 분석법으로 해야될 지 조언해 주실 수 있으신가요? 감사합니다.