변인(Variables)이란 쉽게 말해 변수이다. 연구자가 실험을 설계할 때 여러 가지 상황이 존재하고 이에 따라 어떤 변수를 넣어 결과물을 도출하거나 연구 대상과의 상관관계를 찾아낼 수 있다. 즉, 실험 계획을 세울 때 어떻게 변인을 설정하고 관리하는지가 가장 중요하다고 볼 수 있다. 결과에 대한 방정식이 다음 수식 \( Y = \alpha X + \beta \)과 같을 때 변인이란 X와 Y에 해당한다.
하지만 우리는 변인을 설정하기 이전 측정을 해서 데이터를 확인해야 할 것이다. 변인에 값을 부여하는 과정이 측정이기 때문이다. CO2는 보통 400 이상의 값을 가지고 있고 미세먼지는 높아도 보통 100 이하의 수치를 띤다. 이 수치들이 의미하는 바는 측정 단위(unit)가 ppm, ppb인지 또는 \( m^3 \)인지 명확히 알아야 하며, 이 수치가 얼마나 위험한 정도인지에 대해 판단할 척도가 필요하다. 따라서 변인의 측정척도에 대해 먼저 알 필요가 있다.
변인의 측정 척도
앞서 언급했듯 측정된 값의 의미를 알려면, 측정된 값이 어떤 정보를 가지고 있는지 이해하는 것이 중요하다. 왜냐하면 측정 수준에 따라 해당 변인의 통계분석 방법이 달라지며, 올바른 통계분석을 통해 올바른 연구결과가 나올 수 있기 때문이다. 측정 정도의 종류는 다음과 같이 네 가지가 있다.
명명 척도
명명 척도는 흔히 분류를 위해 사용한다. 운동선수 등 번호를 예로 들 수 있는데, 서로 다른 등 번호는 다른 선수라는 것을 의미하는 용도로 쓰인다. 또한 앞에서 예로 든 성별 자료에서 남자에게 ‘1’, 여자에게 ‘2’라는 숫자를 부여해 구분한다면, 이때 이 숫자들은 단지 두 성별의 구분을 위한 명명 척도가 된다.
서열 척도
서열 척도는 변인을 하나의 연속선상에서 순서를 매긴 척도이다. 서열 척도의 예로 학급의 석차를 들 수 있다. 석차의 숫자는 학급에서 성적이 좋은 순서를 알려 주는 용도로 활용된다. 그러나 1등과 2등이 얼마만큼의 차이를 가지는지의 정보는 알려 주지 못한다.
등간 척도
등간 척도는 점수들의 차이가 동일한 간격을 이루어 그 차이를 비교할 수 있는 척도이다. 그러나 차이는 비교할 수 있어도 두 점수의 비율에 대해서는 말하지 못한다. 온도를 예로 들 수 있다. 온도에서 30°C는 25°C 보다 5°C 덥고, 15°C는 10°C도 보다 5°C 덥다. 따라서 30°C와 25°C의 차이는 15°C와 10°C의 차이와 같다고 할 수 있다. 그러나 30°C가 15°C 보다 2배 더 덥다고는 할 수 없다. 또한 0°C는 임의적인 0점이지 온도가 존재하지 않는다는 것을 의미하는 것은 아니다.
비율 척도
비율 척도는 진정한 의미의 0점, 즉 절대 0점이 존재하는 척도이다. 절대 0점은 사물의 대상이나 측정하려는 속성이 존재하지 않는다는 것을 의미한다. 이 척도는 앞의 서열 척도, 등간 척도의 속성을 가질 뿐 아니라 비율이라는 속성도 가진다. 길이, 부피, 시간과 같은 물리 척도들이 비율 척도의 예이다. 10초는 5초의 2배가 되는 시간이고, 100kg은 300kg의 1/3의 무게가 된다.
변인(Variables)
독립 변인(Independent Variable)과 종속 변인(Dependent Variable)
우선 가장 많이 쓰이는 독립 변인(Independent Variable)과 종속 변인(Dependent Variable)이다.
- 독립 변인(Independent Variable):
- 다른 변인에게 작용하거나 다른 변인을 예언하거나 설명해 주는 변인
- 실험 연구의 경우는 독립변인은 실험자에 의하여 임의로 통제되고 조작됨
- 실험 변인(experimental variable) 또는 처치 변인(treatment variable)이라고도 불림
- 조작 변인, 통제 변인은 독립 변인에 속함 - 종속 변인(Dependent Variable):
- 독립변인의 조작 결과에 의존하며 이의 효과를 판단 근거가 되는 변인
독립 변인이 아닌 변인이 종속 변인에 영향을 미칠 때 이 변인을 가외 변인 또는 외생 변인(extraneous variable)이라고 한다. 독립변인이 종속 변인에 미치는 영향을 연구하고 결과를 증명하고자 할 때 가외 변인이 독립 변인에 영향을 미친다면 종속 변인의 효과가 독립 변인에 기인한 것이라고 증명하기 어렵다.
[예] 폭력적 TV 프로그램 시청과 아동 폭력성의 관계를 알아보고자 연구 설계를 했으나, 폭력적 TV 프로그램 시청 이외에 다른 변인(참가 아동의 성별, 정서, 폭력물 이외의 TV 시청시간 등)으로도 아동의 폭력성을 설명할 수 있다면 이는 가외 변인이라고 할 수 있다. 만약 남자 아동들만을 대상으로 폭력적 TV 프로그램을 시청하게 한 후 폭력성을 측정한다면, 폭력성의 점수가 TV 프로그램 시청(독립변인) 때문인지, 아니면 남자 아동(가외 변인)이기 때문인지 증명하기 어렵다.
조절 변인(Moderating Variable)
조절 변인(Moderating Variable)은 독립변인이 종속 변인에 미치는 영향의 효과가 다른 예측 변인의 수준에 의해 달라지게 하는 변인이다.
[예] 폭력적 TV 프로그램 시청과 아동 폭력성의 관계에 성별이라는 조절 변인이 작용할 수 있다. 같은 시간에 폭력적 TV 프로그램을 시청하더라도 남아가 여아보다 폭력성이 더 증가했다면, 남녀의 수준에 따라 폭력성 결과가 영향을 받은 것이다. 즉, 폭력적 TV 프로그램을 시청하여 남녀 아동의 폭력성이 증가한 것을 주 효과라고 할 수 있으며, 같은 시간 폭력적 TV 프로그램을 시청했더라도 남아의 폭력성이 여아의 폭력성보다 더 크게 증가한 것을 상호작용효과라고 할 수 있다.
매개 변인(Mediation Variable)
매개 변인(Mediation Variable)은 종속 변인에 영향을 주는 독립변인 이외의 변인으로서 연구에 통제되어야 할 변인이다.
유의한 매개 변수가 존재한다면, 독립 변인이 종속 변인에 주는 영향은 직접 효과(direct effect)와 간접 효과(indirect effect)로 나뉜다.
$$ t = c + ab $$
직접 효과(c)는 매개 변인이 존재함에도 불구하고 매개 변수를 거치지 않고 종속 변인에 영향을 주는 것이고, 간접 효과(a×b)는 매개 변인을 통해 종속 변인에 영향을 주는 것이다. 간접 효과를 매개 효과라고 한다. 직접 효과와 간접 효과를 합한 값을 전체 효과(total effect)라 하는데, 이는 매개 변인을 고려하지 않았을 때의 독립 변인이 종속 변인에 주는 영향(t)과 같다.
추가적으로 간접 효과(a×b)의 통계적 유의성은 간접 효과를 간접 효과의 표준 오차\( (S_{ab}) \)의 비율 Z가 정규분포를 따른다고 가정하고 검증한다. 이를 '소벨 테스트(Sobel test)'라고 한다.
$$ Z = {-ab \over S_{ab}} $$
$$ S_{ab} = \sqrt{b^2S^2_b + a^2S^2_a + S^2_aS^2_b} $$
점추정을 이용할 때는 |Z|가 1.96보다 크면 간접효과는 유의 수준(p-value) 5%에서 통계적으로 유의한 것이다.
이때 \( S^2_a \)와 \( S^2_b \)는 각각 a와 b의 표준오차이며, \( S^2_aS^2_b \)는 0에 가까운 매우 작은 값일 경우가 많아 생략할 수 있다.
[예] 폭력적 TV 프로그램 시청과 아동 폭력성의 관계에 부정정서(negative affect)라는 매개 변인이 작용할 수 있다. 폭력적 TV 프로그램을 시청한 아동은 부정정서를 경험하게 되고, 그 부정정서가 아동의 폭력성에 영향을 미칠 수 있다는 것이다. 즉, 폭력적 TV 프로그램을 시청하고 나서 분노, 화, 흥분과 같은 감정을 경험한 결과 이러한 감성이 폭력성이라는 행동으로 나타날 수 있다는 것이다.
조작 변인(Manipulated Variable)과 통제 변인(Controlled Variable)
- 조작 변인(Manipulated Variable):
- 가설 검증을 위해 실험자가 의도적으로 변화시킬 수 있는 변인 - 통제 변인(Controlled Variable):
- 독립 변인 중 조작 변인 이외에 일정하게 유지시켜야 하는 변인
조작 변인과 통제 변인은 독립 변인에 속한다.
조작 변인은 원하는 결과를 도출하기 위해 의도적으로 변화시키는 변인이므로 그 변화에 따른 결과를 확인하면서 실험 목적을 달성할 수 있다. 이를 반대로 거슬로 올라가 조작 변인이 무엇인지 보면 실험 목적을 파악할 수 있다.
조작 변인 외 다른 변인이 실험에 영향을 미친다면 그 실험 결과가 오직 그 조작 변인에 의한 결과라고 단언할 수 없다. 그러므로 다른 변인이 영향을 미치지 못하도록 연구자가 통제하는 변인이 통제 변인이다. 이처럼 조작 변인 외 나머지 변인들을 일정하게 유지시키는 행위를 '변인 통제'라 한다.
나머지 변인들
- 양적 변인(Qantitive Variable):
- 양의 크기를 나타내기 위하여 수량으로 표시되는 변인
- e.g. 몸무게가 50kg 나간다. - 질적 변인(Qualitative Variable):
- 변인이 가지고 있는 속성을 수량화할 수 없는 변인
- e.g. 몸무게가 적게/많이 나간다. - 연속적 변인(Continuous Variable):
- 주어진 범위 내에서는 어떤 값도 가질 수 있는 변인 - 비연속적 변인(Discrete Variable):
- 특정 수치만을 가진 변인
참고 자료
https://ko.wikipedia.org/wiki/%EB%B3%80%EC%9D%B8
https://ko.wikipedia.org/wiki/%EB%A7%A4%EA%B0%9C%EB%B3%80%EC%9D%B8
https://terms.naver.com/entry.naver?cid=41991&categoryId=41991&docId=2118667
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=keatom01&logNo=140052436535
http://contents2.kocw.or.kr/KOCW/document/2017/cnue/parkheonwoo/1.pdf