최근 수정 시각 : 2024-11-20 00:24:15

척도

거트만척도에서 넘어옴
1. 개요2. 종류
2.1. 누적성 활용
2.1.1. 보가더스 척도2.1.2. 거트만 척도
2.2. 형용사 활용
2.2.1. 의미 차별화 척도2.2.2. 스타펠 척도
2.3. 평정법 활용
2.3.1. 리커트 척도2.3.2. 서스톤 척도
2.4. 네트워크 활용
2.4.1. 소시오메트리
2.5. 보기 간 비교 활용
2.5.1. 서열 순위 척도2.5.2. 상수 합계 척도2.5.3. 쌍대 비교 척도
3. 척도화의 접근법4. 관련 문서5. 둘러보기

1. 개요

/ Scale

측정을 목적으로 일정한 규칙에 따라 질적인 측정 대상에 적용할 수 있도록 만들어진 계량적 도구. 즉 측정 도구.

사회과학의 현장에서 굉장히 강조되는 연구방법론으로, 사회조사분석사 자격증을 위해서 공부하게 되는 주된 주제 중 하나이다. 종류가 굉장히 많이 개발되어 있고, 대부분의 경우 사용하는 척도에 따라서 결과 데이터 역시 차이가 발생할 것이 자명하기 때문에 설문조사나 자료분석을 위해서는 절대로 경시할 수 없는 개념이다. 척도를 통해 측정하는 측정 수준(measurement level)에 대한 내용은 측정 문서를 참고.

사회과학에서 측정의 대상이 되는 개념(concept) 내지 구성(construct)은 굉장히 막연한 경우가 많아서, 과학적 방법으로 탐지할 수 없는 주관적이고 모호한 성격을 띠게 된다. 이때 사회과학자는 조작화(operationalization)를 통해서 그 '뜬구름' 을 계량화 가능한 형태로 가공한다. 이때 조작화의 결과로 그 개념은 하나 또는 여러 지표(indicator)들로 구성될 수 있다. 예를 들어, '육아에 우호적인 환경' 개념을 조작화하기 위해서는 지자체 육아지원 예산, 인구 대비 어린이집 수, 주민 육아 만족도, 평균 통학거리 등의 여러 지표들을 동원할 수 있다. 그리고 이런 지표들을 측정할 수 있도록 돕는 도구로 지수( index)와 척도가 있는 것이다.

지수와 척도는 서로 거의 동일한 기능을 수행하나, 지수가 다수의 데이터를 연산하여 일정한 수치를 도출한다면, 척도는 그에 더하여 강도 구조(intensity structure)를 탐지할 수 있다는 추가적인 장점을 갖는다. 예컨대 육아 만족도를 척도로 측정할 경우, 단순히 만족한다는 정도를 넘어서 어느 정도로 만족하는지에 대한 정보를 얻을 수 있다. 그러나 주제에 따라서는 지수만으로도 충분한 정보가 얻어지기도 한다. 장래 인구추계에 흔히 사용되는 소멸위험지수의 경우, 특별한 이유가 없는 이상에야 구태여 척도를 동원해서 측정할 이유는 없다. 그래서 객관적으로 파악이 가능한 유형적인(tangible) 개념은 지수로, 좀 더 주관적이고 인식의 세계에 있는 무형적인(intangible) 개념은 척도로 측정하는 경향이 있어, 서로 상호보완적인 도구로 봄이 옳다.[1]

척도는 합성측정(composite measures)의 형태로 구성된다. 즉 단일문항이 아니라 복수의 문항들로 구성되어 있다. 구태여 여러 문항들을 동시에 활용하는 이유는 단일문항이 엄격한 기준으로 사용되기에는 너무 불안하기 때문이다. 어떤 개념은 다차원성(multi-dimensionality)을 갖고 있어서 하나의 문항으로는 그 중 하나의 차원밖에는 측정하지 못할 수 있고, 또 여러 문항들이 서로 도와주지 않으면 응답자의 혼란이 초래되어 그 하나의 문항의 응답결과에 왜곡이 발생, 신뢰도와 타당도가 저해되기 때문이다. 조사자 입장에서도 합성측정을 활용해야 신뢰도 분석이나 차원성 분석 등의 통계적 검토가 훨씬 쉽다.

개념도 발음도 비슷한 측도와 혼동할 수 있다. 하지만 수학에서 말하는 측도(measure)는 조사방법론에서는 측정이라는 단어로 번역되고 있으며, 조사방법론의 척도는 오히려 scale이라는 단어에 대응된다. 그래서 measure를 척도로 번역하는 것은 자칫 학문적 비용을 초래할 수 있다. 측도(측정)는 어떤 크기나 면적, 부피 따위를 재고 그 값을 수치로 나타낸다는 뜻이다. 가장 대표적인 사례가 바로 결정계수 R2인데, 이것은 어떤 모형의 설명력을 정량화한 측도이다. 또한 한 사람의 소득이나 재산의 화폐가치 역시 그 사람의 재력을 화폐단위로 정량화한 측도이다. 측도는 정량적인 성질을 전제로 하므로, 소득이나 자산과는 달리 예컨대 소득분위는 서열수준에 해당하여 측도가 될 수 없다.

2. 종류

척도는 크게 보아 누적 논리를 따르는 보가더스 척도와 거트만 척도, 형용사 기반의 의미 차별화 척도 및 스타펠 척도, 평정 논리를 따르는 리커트 척도와 서스톤 척도, 네트워크에 기초하는 소시오메트리, 문항 간 비교에 입각한 서열 순위 척도와 상수 합계 척도 및 쌍대 비교 척도가 있다. 그 외에도 온갖 복잡한 방식의 척도들이 시도되고 있지만 여기서는 생략한다.

2.1. 누적성 활용

누적 척도(cumulative scale)는 여러 문항들이 강도(intensity)에 따라 상호 관련성을 갖는다. 그 기저 논리는, 더 어려운 난이도 또는 더 극단적인 진술에 반응을 보인 응답자는 더 쉬운 난이도 또는 더 중립적인 진술에도 반응을 보일 것이나, 그 역은 항상 성립하지 않는다는 것이다. 제곱에 대해 이해하는 사람이 곱셈을 못 할 리 없으며, 조선족과 결혼할 수 있다는 사람이 조선족을 전부 내쫓자고 주장할 리 없지만, 반대 상황에서는 곱셈은 하는데 제곱은 모른다든지, 조선족의 입국을 허용하자는 사람이 조선족과의 결혼은 꺼린다든지 하는 게 얼마든지 가능하다는 것이다. 아울러 누적 척도(특히 거트만 척도)는 각 문항들 간에 논리적으로 완벽한 서열화가 가능함도 전제로 한다. 만일 각 문항들이 강도에 따라 서열화될 수 없는 상황에서는 누적 척도가 쓰일 수 없다.

또한 누적 척도는 단일차원성(uni-dimensionality)을 갖는다. 척도 상에서 문항이 여러 개일 경우, 각각의 문항들이 갖는 차원성에 대한 이해가 필요하다. 온습도계를 생각해 보자. 0℃에서 100℃까지 잴 수 있는 온도계와, 0%에서 100%까지의 습도를 잴 수 있는 습도계가 함께 붙어 있는 것이다. 이때 온도가 얼마나 높을지에 대한 측정과, 습도가 얼마나 높을지에 대한 측정은 서로 엄연히 구별되며, 의미 상 중복되지 않는다. 그렇지만 두 측정이 상충되지는 않으며, 때로는 '뜨거운데 습하다' 는 측정 결과가 나올 수도 있고, 때로는 '차가운데 건조하다' 는 측정 결과가 나올 수도 있다. 2차원 척도에서 일부 문항은 온도 차원에, 일부 문항은 습도 차원에 배정될 것이다.[2]

그런데 누적 척도의 모든 문항들은 2차원성이 아니라 일차원적인 연속체(continuum)를 구성한다. 어떤 문항은 다른 문항보다 의미 상 더 호의적인(favorable) 위치에 놓이고, 또 다른 문항보다 의미 상 더 불호적인(unfavorable) 위치에 놓인다. 0℃에서 100℃까지 잴 수 있는 온도계에서 60℃는 30℃보다 더 뜨겁지만 90℃보다는 덜 뜨거운 위치에 자리한다. 여기에 다른 방식으로 관여할 차원은 존재하지 않는다. 누적 척도는 다른 차원의 개입 가능성이 없다고 전제하기 때문에, 조선족과 결혼할 수 있다고 응답한 사람이 조선족을 전부 내쫓아야 한다고 응답할 경우에는 (실제로 그런 응답이 나올 수도 있음에도) 그것을 응답 오류로 판정한다.

2.1.1. 보가더스 척도

Bogardus social distance scale

보가더스의 사회적 거리 척도, 혹은 목적에 따라서는 인종 간 거리 척도(racial distance scale)라고도 한다.

미국의 사회학자 에머리 보가더스(E.S.Bogardus)가 개발했으며, 사회학을 넘어서 사회 심리학이나 정치학, 여론조사에서 애용되었던 척도. 인종이나 사회적 계층, 계급, 구성집단 사이의 관계를 확인하기 위한 척도로, 집단 간 관계를 측정한다는 점에서 소시오메트리와는 차이가 있다. 조사의 대상이 되는 특정 여러 집단들을 선정한 후, 그들과 교류하는 것을 상정하는 다양한 진술들의 세트를 제시한다. 누적적인 점에서는 거트만 척도와도 유사성이 있다. 단, 마지막 가장 극단적인 문항의 경우에는 누적되지 않는다.

현대에는 잘 사용되지 않고 어디까지나 예비적 조사로서의 성격이 강하기는 하지만, 간단한 방식으로 여러 사회적 집단, 특히 '사회적 소수자'[3]로 일컬어지는 집단 간의 거리감을 평가할 수 있다는 중요한 장점이 있다. 그래서 이 집단을 대상으로 저 집단을 얼마나 친밀하게 혹은 혐오스럽게 느끼는지 직관적으로 질문하기에 제격이다. 응답자들이 보기에도 각 문항들이 서로 어떤 관련성을 갖는지 눈치채기가 쉽다.

물론 단점도 존재한다. 우선 거트만 척도와는 달리 보가더스 척도로는 사회적 집단이 아닌 사회적 이슈에 대한 찬반 태도를 묻기 힘들다는 것이 있다. 낙태에 대한 찬반이나 총기소지에 대한 찬반을 이런 방식으로 물을 수는 없다. 그리고 다른 단점으로, 먼저 척도의 설문을 실시할 대상자들을 추려야 한다는 점이 있다. 외국인 유학생에 대한 심리적 거리감을 보가더스 척도로 측정하기 위해서는 먼저 응답자 풀에서 자기 자신인 외국인 유학생들이 빠져 있어야 한다.
Q. 국내 소수 집단에 대한 교류 조사를 진행하고 있습니다. 제시된 집단에 따라, 동의할 수 있는 진술에 모두 체크해 주시기 바랍니다.
진술 문항 소수 집단
이주노동자 새터민 조선족 성 소수자 지체장애인 또는 지적장애인 무슬림
<colbgcolor=#EEEEEE>1. 가족 구성원으로 받아들일 수 있다. <colbgcolor=#FFFFFF>   <colbgcolor=#FFFFFF>   <colbgcolor=#FFFFFF>   <colbgcolor=#FFFFFF>   <colbgcolor=#FFFFFF>   <colbgcolor=#FFFFFF>  
2. 친구로서 함께 사회적 활동을 할 수 있다.                  
3. 이웃 주민으로 받아들일 수 있다.                  
4. 우리 동포로 받아들일 수 있다.                  
5. 우리 나라에 방문하는 것을 허용할 수 있다.                  

2.1.2. 거트만 척도

Guttman scale

이스라엘의 심리측정학자 루이 거트만(L.Guttman)이 개발했으며, 반응 중심적인 누적 척도이다. 보가더스 척도와 마찬가지로 단일차원성을 띠고 있으며, 강한 진술에 반응했을 때 약한 진술에도 당연히 반응할 것이나 그 역은 성립하지 않음[4]을 전제로 한다. 그러나 보가더스 척도와는 달리, 거트만 척도는 낙태, 총기소지, 사형, 이민, 님비 등 폭넓은 사회적 이슈 및 정책적 의사결정에 활용되기 쉽다.

거트만 척도는 Y/N 형태로 응답하게 되며, 하나의 주제에 대해서 서로 다른 강도를 갖는 다수의 문항들이 배치되어 있고, Yes 응답을 반응으로 간주하여 각각의 Yes마다 1점씩 부여해서 합산한다. 합산된 결과는 응답자를 각각의 행(row)으로 배치한 표 내부에 기록되는데, 이를 스칼로그램(scalogram)이라고 한다. 이상적인 형태의 스칼로그램을 가상으로 구성한다면 아래와 같으며, 맨 아래쪽의 두 줄은 오류로 처리되는 응답자의 사례를 추가한 것이다.
지체장애인 재활센터 건립 반대 여부
응답자 Q1.
집 옆
Q2.
우리 동
Q3.
우리 구
Q4.
우리 시
Q5.
우리 도
Q6.
우리 나라
총점
A 1 1 1 1 1 1 6
B 0 1 1 1 1 1 5
C 0 0 1 1 1 1 4
D 0 0 0 1 1 1 3
E 0 0 0 0 1 1 2
F 0 0 0 0 0 1 1
G 1 0 0 0 1 1 3
H 0 1 1 1 0 1 4

이후 연구자는 재생 계수(CR; coefficient of reproducibility)라는 것을 구하게 된다. 재생 계수는 ① 모든 응답자들이 응답한 모든 문항의 수 중에서 ② 오류로 판단된 응답 문항의 수가 얼마나 되는지 비율을 산출하고, ③ 1에서 이 비율을 감하여 0~1 사이에 숫자가 위치하게 하되 숫자가 클수록 바람직하다는 결론이 도출되도록 한다. 일반적으로 거트만 척도의 CR은 .90 이상이 나와야 바람직하다고 말할 수 있다. 이를 다시 말하면 오류 응답이 전체 응답 중의 10% 이하여야 한다는 것이다.

거트만 척도는 기왕 누적 척도가 필요한 상황에서라면 범용적으로 사용될 수 있는 좋은 척도이다. 하지만 누적 척도가 부적합한 상황, 다시 말해 둘 이상의 다양한 차원에 걸친 측정이 필요한 상황이라든지, 혹은 논리적으로 문항 간 누적성을 구현하기 어려운 이슈에 대해서라든지 등 기초적인 전제가 깨지는 경우에는 아무것도 보여주지 못한다.
Q. 설문에 참여해 주셔서 감사합니다. 이하의 진술들은 복지정책에 대한 귀하의 견해를 수집하기 위한 것입니다. 동의하실 수 있는 진술에 모두 체크해 주십시오.

 1. 우리 집 옆에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)
 2. 우리 동에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)
 3. 우리 구에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)
 4. 우리 시에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)
 5. 우리 도에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)
 6. 우리 나라에 지체장애인 재활센터를 건립하는 것  □ 찬성(Y)  □ 반대(N)

2.2. 형용사 활용

형용사(adjective)를 활용하는 척도는 조사 주제에 대해서 다양한 차원에서 접근할 수 있는 방법으로, 하나의 형용사 단어가 모두에게 하나의 의미로 동일하게 이해될 것임을 전제한다. 이때 형용사를 어떤 방식으로 배치할 것인가에 따라서 척도의 형태가 달라지게 된다. 하나의 형용사를 두고 그것에 관련된 주관적인 느낌의 강도를 응답할 경우에는 단극성 척도(unipolar scale)라고도 하고, 두 개의 의미 상 반대되는 형용사를 두고 그 사이에서 주관적인 느낌의 강도를 응답할 경우에는 양극성 척도(bipolar scale)라고도 한다.

형용사에 기초한 척도는 단순히 호불호의 느낌을 넘어서서 보다 다양한 응답을 하는 것이 가능하다. 물론 '못생긴' ↔ 아름다운' 같은 관계처럼 긍정적이고 부정적인 관계를 배치할 수도 있지만, 한편으로는 '빠른' ↔ '느린', '시끄러운' ↔ '조용한', '강한' ↔ '약한', '신선한' ↔ '진부한' 처럼 그 대상의 속성이나 상태, 양상, 잠재적 측면 등을 고루 평가할 수 있다는 게 장점이다. 연구주제에 따라서 조사자가 동원 가능한 형용사에는 때로 한계가 생기기도 하므로, 단극성으로 제시할지 혹은 양극성으로 제시할지에 대한 정답은 없다.

2.2.1. 의미 차별화 척도

semantic differential scale

의미 분화 척도, 의미 분별 척도, 어의 차이 척도, 어의 분화 척도 등 어이가 날아갈 만큼의 유사한 이름들이 잔뜩 있다. 공통적으로 '단어' 의 '의미' 가 '나누어져 있다' 는 내용이 담겨 있다.

일직선의 양극선상에 상반되는 형용사를 배치한다는 점에서 하단의 슈타펠 척도와는 달라진다. 상반되는 두 형용사 간에 의미상의 연속선이 있고 응답자의 반응을 그 연속선 위에서 등간 수준으로 정량화가 가능하다고 추가로 전제한다. 측정에는 대개 7점 척도가 활용되며, 데이터 분석 시에는 1~7점 형태로 코딩하거나 -3~+3점 형태로 코딩할 수 있다. 측정된 데이터는 평균이나 중앙값 등을 분석할 수도 있다. 이때 응답자는 서로 상반되는 양극성 형용사 표현 사이에서 자신의 주관적 느낌에 따라 적절한 위치로 응답하게 된다. 기업이나 브랜드의 이미지를 확인하는 데에 유용하게 쓰인다.

장점으로는 이해가 빠르고 결과에 대한 신속한 피드백이 가능하다는 것, 등간 척도로서 분석이 용이하다는 것 등이 있다. 반면 단점으로는 의미가 상반된 형용사를 적합하게 조합하기가 어려울 수 있다는 것 정도가 꼽힌다. 예를 들어 "적극적이다 vs 소극적이다" 정도는 무난한 쌍이 되겠지만, "진취적이다 vs 소극적이다" 의 경우는 어떻게 보아야 할까? 응답자가 혼란에 빠질 여지는 없을까? 또한 어떤 종류의 형용사들은 적당한 반의어를 찾기가 쉽지 않을 수 있으며, 이 경우에는 '안 ○○하다' 같은 표현을 쓸 때도 있지만 그보다는 스타펠 척도를 고려하게 된다.
Q. ○○역 지하상가에 대한 귀하의 이미지나 느낌을 다음 진술 사이에서 골라 주시기 바랍니다.
<colbgcolor=#EEEEEE>불편하다 <colbgcolor=#FFFFFF>                       <colbgcolor=#EEEEEE>편리하다
비싸다                        적절하다
어둡다                        밝다
불결하다                        청결하다
위험하다                        안전하다
구시대적이다                        현대적이다

2.2.2. 스타펠 척도

Stapel scale

얀 스타펠(J.Stapel)이라는 인물이 고안한 척도라고 알려져 있으며, 마찬가지로 태도의 방향과 그 강도를 측정하기 위해 사용된다. 특정 주제에 관련된 형용사들의 세트를 개발하고, 양수 값과 음수 값으로 이루어진 값의 범위를 정한다. 긍정적인 태도는 양수로, 부정적인 태도는 음수로 응답할 수 있으며, 상단의 의미 차별화 척도와는 달리 단극성이기 때문에 상반되는 두 개의 표현을 찾을 수고를 할 필요가 없다.

스타펠 척도는 문항들을 구성하기가 쉽고 간결하며, 적당한 반의어를 찾기 힘든 표현이 있을 경우 쓰기에 유용하다. 반면 스타펠 척도는 다소 직관적인 느낌이 부족하기 때문에 자칫 혼란을 불러일으킬 수도 있다.
Q. 우리 ○○군을 방문해 주셔서 대단히 감사합니다. 우리 군에서 머무시는 동안 느끼셨던 우리 군의 이미지를 이하에서 응답해 주십시오. 긍정적인 응답은 양수로, 부정적인 응답은 음수로 표기하시면 됩니다.
<colbgcolor=#FFFFFF>-5  -4  -3  -2  -1 <colbgcolor=#EEEEEE>푸근하고 넉넉한 인심 <colbgcolor=#FFFFFF>+1  +2  +3  +4  +5
-5  -4  -3  -2  -1 다채로운 볼거리와 관광지 +1  +2  +3  +4  +5
-5  -4  -3  -2  -1 합리적인 가격의 맛있는 식사 +1  +2  +3  +4  +5
-5  -4  -3  -2  -1 역동적으로 발전하는 모습 +1  +2  +3  +4  +5
-5  -4  -3  -2  -1 외지인들을 위한 편리한 서비스 +1  +2  +3  +4  +5

2.3. 평정법 활용

평정 척도(rating scale)는 측정할 대상이 연속성을 갖고 있다고 전제하여 일정한 등급법에 따라 평가하는 척도이다. 즉 각 보기들이 단순한 서열 관계가 아니라 등간 관계라고 전제하기에 순위(ranking)의 논리에 호소하지 않는다.[5] 문항 속의 각각의 값들은 단일차원적인 연속선상에 놓이게 되며, 상호간에 우열이나 강약 등에 입각하여 나열된다. 그러나 위의 누적 척도와는 달리, 강한 반응을 보이기 위해서 응답자가 그보다 약한 모든 보기들에 전부 응답할 필요는 없다. 응답자는 그저 자신의 느낌을 가장 잘 표현하는 강도에 해당하는 보기를 골라서 거기에만 체크하면 된다.

평정 척도는 매우 흔하게 발견되는데, 측정 항목에 사례로 나온 상당수도 바로 이 평정 척도에 속한다. 어찌보면 흔한 설문조사에서 가장 쉽게 발견될지도 모를 척도.

각 보기의 나열은 비언어적인 형태로도 나타내 보일 수 있으며, 특히 언어적인 모호성이 큰 주제의 경우에는 형용사를 활용하는 척도나 언어적인 평정 척도보다 효과적이다. 영유아나 지적장애인과 같은 취약계층을 위해서는 언어적 평정 척도보다 비언어적 평정 척도가 더 효과적일 수 있다. 그리고 우리나라에는 해당사항이 별로 없지만 문맹자들의 경우에도 비언어적 평정 척도가 필요하다.
  • 도표형 평정 척도
    수직선 비슷하게 선을 긋고 각 위치에 균등한 거리로 세로선을 그어서 각각의 값을 나타내 보여주는 척도. 이것이 등간 수준이라는 것을 직관적으로 알 수 있으며, 종종 등간성 논란이 불거지곤 하는 리커트 척도에서 도표를 보완적으로 활용하는 것은 경우에 따라 조사결과의 설득력이 더해질 수 있다.
Q. 우리나라 정부의 정책 추진력은 얼마나 강하다고 생각하시는지 평가해 주십시오.

   ├──────────┼──────────┼──────────┼──────────┤
 매우 약하다       약하다       보통이다       강하다       매우 강하다
  • 범주형 평정 척도
    선을 긋는 것이 아니라 어떤 속성을 나타내는 표현들을 정도에 따라 오름차순 혹은 내림차순으로 배열하는 척도. 서열 수준이라는 점만이 드러날 뿐이며, 등간성에 대해서는 응답자가 직관적으로 판단하기 어렵다. 리커트 척도를 포함한 대개의 평정 척도들이 여기에 속한다.
Q. 고객님과 방금 전에 통화했던 당사 콜센터 상담사는 얼마나 친절했습니까?

 매우 친절했다    친절했다    보통이었다    불친절했다   매우 불친절했다
                                         
  • 안면 평정 척도
    각각의 값들을 글자로 보여주는 것이 아니라 사람의 얼굴 표정을 본뜬 이미지로 대체하는 비언어적인 평정 척도. 웃는 얼굴은 긍정적 응답을, 찡그린 얼굴은 부정적 응답을 의미한다. 취약계층에게 활용하기 쉽고 말로 설명할 방법이 없는 미묘한 값의 차이를 설명할 수 있다는 장점이 있지만, 단순 호불호 이외의 답변이 나올 문항에는 쓸 수 없다.
Q. 이 페이지가 귀하의 요청하신 정보를 찾는 데 얼마나 도움이 되었습니까?

파일:CiTcMZB.jpg
                                        

2.3.1. 리커트 척도

Likert rating scale

농학자이자 경영학자인 렌시스 리커트(R.Likert)에 의해 1932년에 개발되었다.

리커트 척도는 어떤 태도에 대해 연속적인 강도 관계를 갖는 다수의 값들로 구성된 다수의 문항을 활용하는 평정 척도이다. 하나의 주제를 그 척도의 중심내용으로 삼아서 여러 개의 진술의 세트를 구성한다. 그리고 그 진술들에 대해서 응답자가 응답하는 전반적인 경향을 측정치로 합산하여 결과 점수를 도출하는 척도. 리커트 척도에서 가장 중요한 것은 동일한 주제를 다루는 서로 다른 진술들 사이에는 매우 높은 연관성이 보장되어야 한다는 것이다. 즉, 문항 간 내적 일관성이 높아야 한다. 그렇기 때문에 일차적으로 사전검사(pilot testing)를 거쳐서 신뢰도가 낮게 나타나는 문항이 있으면 이를 제거하고 본 조사에 투입하게 된다.

리커트 척도는 3점(+, 0, -)을 두는 경우는 드물고, 보통 5점[6]이나 7점[7] 등 홀수 보기를 두는 경우가 많다. 만일 홀수 보기가 아니라면 이는 중도적 응답인 "보통이다" 를 삭제했거나, "잘 모르겠다" 같은 예외적인 응답을 추가한 경우. 일본 등의 문화권에서는 극단적인 응답을 가급적 자제하고 거의 대부분 중간 정도에서 응답하는 경향을 보이는데, 이것이 심할 경우 아예 "보통이다" 를 없애버리는 것도 가능하다. 특히 한 개인이 어느 쪽으로든 입장을 표명하는 것 자체가 중요한 경우. 이런 방법을 강제선택법(forced-choice method)이라고도 한다.

리커트 척도는 개인의 태도나 가치를 평가하기에 매우 유용하며, 굉장히 범용적이고 다루기에도 편하다. 그러나 총점을 계산하는 과정에서 각 문항 간의 응답자의 편차는 전부 사라지고, 총점이 의미하는 개념적 정의가 무엇인지에 대해서도 별도로 이론을 세워야 하며 그 자체로는 별 의미가 없다. 또한 자기보고(self-report) 식이기 때문에 주관성이 혼입된다는 문제점도 있고, 사람마다 각 점수가 의미하는 긍정/부정 및 동의/거부의 정도가 다 다를 수 있다.
□ 매우 그렇다  □ 그렇다  □ 보통이다  □ 아니다  □ 전혀 아니다
□ 매우 그렇다  □ 다소 그렇다  □ 보통이다  □ 다소 아니다  □ 전혀 아니다
□ 그렇다  □ 다소 그렇다  □ 보통이다  □ 다소 아니다  □ 아니다
□ 그렇다  □ 그런 편이다  □ 보통이다  □ 아닌 편이다  □ 아니다

이 중에서 어떤 식으로 보기를 안내하느냐에 따라서 의미가 전부 달라질 수 있다. 숫자를 임의로 매기자면, 어떤 사람들은 -30, -10, 0, +10, +30 같은 서수적인 의미로 생각할 수 있고, 어떤 사람들은 -30, -15, 0, +15, +30 같은 등간의 의미로 생각할 수 있다. 이런 사람들이 하나의 조사 내에서 전부 뒤섞여 버렸다고 한다면 결과 데이터의 해석도 그만큼 난감해질 수 있다. 그럼 9점이나 그 이상까지 값을 늘릴 수 있지 않겠느냐고 할 수 있겠지만 리커트 척도에서 그런 경우는 거의 없으며, 직관성을 위해서 100℃ 온도계 척도를 사용하거나 커다란 눈금자 그림을 보여주고 그 위에 적당한 곳에다 V자 표시를 하라고 안내하는 경우가 많다. 물론 막상 그렇게 하면 응답자들은 이번에는 거꾸로 5의 배수, 10의 배수 위에 체크하는 청개구리 같은 모습을 보인다(…).

그래서 리커트 척도의 측정 수준은 늘 논란의 중심에 있다. 일반적으로는 등간 수준(interval level)으로 간주되는 편이지만, 등간 수준과 서열 수준 사이에 위치한다고 보는 편이 학문적으로는 가장 적절하다. 사실 조사방법론 연구자들에게 "리커트 척도는 등간수준인가요 서열수준인가요?" 라고 물어보면 이들이 순식간에 두 패로 나뉘어서 치열하게 싸우는 모습(...)을 볼 수 있다.

리커트 척도가 등간 수준인지 서열수준인지가 중요한 이유는 통계학의 꽃인 회귀분석을 쓸 수 있냐없냐가 갈리는 문제이기 때문이다. 서열수준은 회귀분석에 맞지 않는 자료인 경우가 절대다수이기 때문이다. 예를 들어 몸무게를 키에 대해 단순선형회귀분석을 한다고 했을 때, 160cm에서 161cm로 가는 1cm와 170cm에서 171cm로 가는 1cm는 자로 쟀을 때 똑같은 값이이어야한다. 그래야 회귀분석 계산 결과를 놓고 '키가 1cm 정도 더 큰 사람은 몸무게가 얼마 더 클 것으로 기대된다'라고 해석할 수 있기 때문이다. 하지만 서열 수준이 되면 이런 해석을 할 수 없다. 그리고 애석하게도 리커트 척도는 등간척도라고 하기 힘든 경우도 많다. 예컨대 설문지 상에서 '매우 그렇다'에서 '그렇다'로 한 칸 움직이는 것과, '그렇다'에서 '보통이다'로 한 칸 움직이는 것이 동일한 변화라는 보장이 없기 때문이다.

이런 점 때문에 통계적 방법론을 깐깐하게 적용하는 리뷰어들은 리커트 척도에 서열 수준 측정의 성격이 있다고 보아 리커트 척도 결과를 가지고 회귀분석을 돌린 논문은 읽지도 않고 리젝트하는 경우도 있다. 선행연구를 통해 해당 리커트 척도가 회귀분석 등을 써도 된다고 검증된 경우거나, 연구자가 회귀분석 등을 써도 된다는 점을 입증한 경우라면 이야기가 달라지지만, 이러기는 극히 어렵다.

리커트 척도를 B급 양적방법론 수단으로 취급하는 통계학자들도 있지만, 리커트 척도를 응용한 연구가 워낙에 활발하기 때문에 리커트 척도의 단점을 어떻게든 커버하기 위해 노력하는 통계학자도 있다. 후자의 경우 대부분의 결론은 '리커트 척도를 아주 세분화하여 설계할수록, 표본이 많을수록 리커트 척도를 등간척도 비슷하게 간주해도 무리가 없을 확률이 커진다'로 수렴한다. 하지만 애석하게도 일반적으로 접하는, 일반적으로 만들어지는 리커트 척도 설문지는 '매우 그렇다 - 그렇다 - 보통이다 - 아니다 - 매우 아니다'와 같이 5점 스케일에 그치는 경우가 많다. 그리고 리커트 척도를 활용한 분석이 중심 테마인 연구는 대부분 연구비가 부족한 소형 연구인 경우가 많아서 대표본을 구할 수 없는 경우가 많다.

2021년 사회적 이슈가 된 KBS 세대인식 조사에 대한 통계방법론적 논쟁도 일정 부분 리커트 척도의 등간척도 여부에서 기인한다. 해당 연구를 보면 설문조사를 통해 자신이 생각하는 자신의 경제 계층을 보고하도록 했다.

사회조사분석사 자격증 같은 중립적인 관점이 요구되는 상황에서는 "실질적으로는 서열 수준이나 통계적 분석의 편의를 위해 임의로 등간 수준으로 전제한다" 라고 함으로써 이의제기나 복수정답 시비를 사전에 차단하는 출제 테크닉을 보여준다.

또한 각 값들이 정확히 어떤 의미를 갖는지에 대해서 안내될 필요가 있고, 논문이나 보고서에서도 이를 반드시 보고해야 한다. 예를 들어 "당신은 현 집권여당에 대해 얼마나 지지하십니까?" 질문에 1점으로 대답하는 것은 여당에 아무 지지의견이 없음을 의미할 수도 있지만, 만일 1점을 "야당에 대해 강력히 지지한다" 로 정의할 때에는[8] 아무 지지의견이 없다는 반응이 중간값(5점 척도상에서는 3점)이 된다. 이처럼 각 값에서 정의되는 반응의 내용이 다르기 때문에 값에 대응되는 의미를 명확히 정의해야 하는데 이를 간혹 앵커링(anchoring)이라 부르기도 한다. 영자논문에서도 흔히 ("1"=definitely, "5"=never) 또는 ("1"=strongly disagree, "7"=strongly agree) 같은 의미의 안내가 따라붙는 것을 볼 수 있다.[9]

전통적으로는 리커트 척도에 응답한 값들을 전부 합산하는 총화평정법(summated rating method)으로 통계 분석을 준비하곤 했다. 리커트 5점 척도 10개 문항 중에서 예컨대 5개 문항에는 ③번에, 4개 문항에는 ④번에, 1개 문항에는 ⑤번에 체크했다면, 총화평정법으로 그 응답자의 점수는 5×3+4×4+1×5=36점으로 합산된다. 하지만 학술논문의 경우 총점이 중요한 것이 아니라 편차치가 중요한 경우도 있고, 중앙값을 보는 편이 더 유리한 경우도 있어서 더 이상 리커트 척도가 곧 총화평정 척도라고 말하기는 조금 어렵게 되었다. 실제로 평균 표준 편차를 취해서 보고하는 것은 심리학을 비롯한 여러 사회과학계에 정착되어 있는 관행이다.

현실적으로 보면 리커트 척도는 한 마디로 학계에서 사회과학 논문 연구방법의 AK-47(…)이라고 해도 과언이 아닐 정도다. 주관성이 개입할지언정 계량화 자체는 보장되는 가장 간단한 양적연구 방법이기도 하고, 주어진 진술에 어떤 태도를 취하는지 보면 되기 때문에 연구자에게나 참가자에게나 굉장히 직관적이다. 이 편의성 하나 때문에 백 년 가까이 척도계의 최강자로 군림할 수 있었던 것이다. 특히 후속 통계분석을 준비하는 입장에서는 이런 거라도 있어야 t-검정을 할 수 있다. 그러나 세상의 어떤 척도도 단점이나 한계가 없는 완벽한 척도가 아니기 때문에, 한계점을 잘 모른 채 리커트 척도를 함부로 쓰면 곤란하다. 지도교수에게 갈굼을 듣게 된다.

똑같은 리커트 척도가 질문만 바뀌면서 계속 반복될 경우, 각 보기마다 계속해서 '매우 찬성', '찬성', '보통', '반대', '매우 반대' 같은 방식으로 안내를 반복하는 것은 지저분하고 비효율적이다. 이 경우에는 질문지를 표처럼 엮어서 맨 위에다 각각의 보기에 해당하는 안내를 적어 놓고, 그 밑으로는 그냥 보기의 숫자만 적어서 동그라미를 칠 수 있게 하면 된다. 자리가 없다면 맨 왼쪽이 어떤 의미고 맨 오른쪽이 어떤 의미인지만 기입해서 서열관계를 암시하기도 한다. 아래 소개된 예시가 대표적. 이처럼 질문지를 깔끔하게 정리하는 방식의 리커트 척도를 행렬식 질문이라고 부르는 사람들도 있다.
성 역할 인식: 5점 척도
진술 문항 응답 보기
전혀 아니다     매우 그렇다
1. 집안일을 하는 것은 여성의 의무이다. <colbgcolor=#FFFFFF>1 <colbgcolor=#FFFFFF>2 <colbgcolor=#FFFFFF>3 <colbgcolor=#FFFFFF>4 <colbgcolor=#FFFFFF>5
2. 여성은 남성에게 순종적이어야 한다. 1 2 3 4 5
3. 남성은 외향적이고, 여성은 내향적이다. 1 2 3 4 5
4. 집안 대소사는 반드시 남성이 결정해야 한다. 1 2 3 4 5
5. 간호사는 여성이어야 하고, 법관은 남성이어야 한다. 1 2 3 4 5
6. 남성이 부엌에 들어가는 것은 부끄러운 일이다. 1 2 3 4 5

2.3.2. 서스톤 척도

Thurstone scale

등현등간 척도(equal-appearing interval scale), 유사등간 척도라고도 한다.

정신물리학(psychophysics) 및 심리측정학자인 루이 서스톤(L.L.Thurstone)에 의해 개발되었다. 서스톤 척도는 리커트 척도가 갖고 있는 편의성을 희생하고 번잡함을 감수하되, 리커트 척도의 대표적인 단점인 등간성 미증명 문제를 회피할 수 있는 척도이다. 그러나 연구의 역사를 따져 본다면 오히려 리커트 척도보다도 좀 더 오래되었다.

서스톤 척도의 제작은 다음의 절차에 따라 이루어진다.
  • 어떤 연구주제에 대한 예상가능한 태도에 대해서 가능한 한 많은 문항들을 확보한다. 대략 수백 개 정도의 진술이면 충분하다.
  • 그 문항들이 그 주제에 대해 얼마나 우호적 혹은 불호적인 태도를 드러내는지 평가할 수 있는 다수의 심사자들을 확보한다. 대략 수십 명에서 수백 명 정도면 충분하다. 이쯤에서 이미 이 척도는 불지옥급 난이도에 도달한다.
  • 심사자들은 수집된 문항들이 어떤 호불호 태도를 드러내는지 11점 평정 척도 상에서 응답하게 된다. 이때 1점은 가장 불호적이고, 6점은 가장 중립적, 11점은 가장 우호적이게 된다.
  • 다수의 심사자들이 응답한 결과를 바탕으로, 각각의 문항마다 중앙값사분위값을 구한다.
  • 사분위값의 범위가 사전에 등록된 기준 이상으로 지나치게 커질 경우, 문항의 진술 자체가 애매하기에 심사자들마다 주관적 이해가 심하게 달라지기 때문이라고 판단하여 그 문항을 제거한다.
  • 나머지 문항들을 중앙값의 크기 순으로 정렬하고, 사분위값의 범위가 작은 문항들을 1.0에서 11.0 사이의 모든 구간에서 고르게 추출한다.

이렇게 만들어진 서스톤 척도는 의미를 이해하기 쉬운 진술형 문항들이 다수 모여 있다. 그리고 각각의 문항마다 심사자들로부터 산출된 중앙값 정보가 포함되어 있지만, 응답자에게는 어떤 문항의 중앙값이 얼마인지 공개되지 않는다. 응답자로서는 척도 우측에 찬반(agree/disagree) 형태의 가장 단순한 호불호 여부만을 묻는 값들에 응답하게 된다. 응답이 끝나면 조사자는 이 응답자가 어떤 문항들에만 찬성했는지 코딩하고, 찬성한 문항들이 갖고 있는 중앙값들을 전부 모아서 평균을 낸다. 그렇게 하면 그 응답자가 그 주제에 대해 보이는 찬반의 경향이 하나의 숫자로 정리될 수 있다.

보다시피 과정과 절차, 비용이 엄청나므로 절대로 가볍게 할 수 있는 조사는 아니다. 그리고 심사자들은 그 주제에 대한 확실한 전문성을 갖고 있어야 한다. 그런 전문가들을 어디서 그렇게 많이 구할 수 있을까는 논외로 하자.(…) 서스톤 척도의 단점을 하나 더 꼽아보자면, 최초 심사자들을 어떻게 선정하는가에 따라서 결과 문항의 도출이 달라질 수도 있다는 것. 그러나 일단 모든 절차가 완료되어 질문 항목이 준비되면, 그 척도를 활용하는 평가자는 아주 전문적인 태도 측정의 역량을 갖출 필요는 없으며 이는 분명한 장점이 될 수 있다.
여성할당제에 대한 다음의 진술들 중에서 동의 또는 반대를 표시해 주십시오.
문항 찬성 반대
<colbgcolor=#EEEEEE>1. 여성할당제 정책은 전면 중지되어야 한다.(1.53) <colbgcolor=#FFFFFF>□ <colbgcolor=#FFFFFF>□
2. 여성할당제의 수혜 및 피해집단을 모두 고려해야 한다.(6.46)
3. 사회적 합의를 바탕으로 여성할당제를 적용해야 한다.(5.58)
4. 여성할당제는 사회적 불의를 종식시키는 방편이다.(8.90)
5. 유능한 인재들이 여성할당제로 피해를 입고 있다.(4.07)
6. 모든 일자리에서 50:50의 성비에 도달해야 한다.(10.30)
7. 여성할당제는 산업 현장의 생산성을 저해한다.(3.19)
8. 여성할당제는 우리 사회의 다양성을 촉진한다.(9.11)
9. 장기적으로 여성들의 사회 진출을 지원해야 한다.(7.63)

여기서 작게 적혀 있는 숫자들이 바로 각 문항들에 대응되는 가설적인 중앙값으로, 연구자는 각 문항별로 중앙값을 알고 있지만 응답자는 어떤 문항이 얼마의 중앙값을 갖는지 알 수 없다. 만일 어떤 응답자가 이 중에서 2번, 3번, 5번, 7번에만 찬성에 체크했다면, 이 사람은 11점 만점 중 (6.46+5.58+4.07+3.19)÷4=4.83점의 점수를 획득하게 되며, 불호와 중립 사이의 커트라인인 5점 인근에 있으므로 여성할당제에 대해 약한 불호를 보인다고 해석할 수 있다.

2.4. 네트워크 활용

2.4.1. 소시오메트리

sociometry

미국의 정신의학과 의사인 제이콥 모레노(J.L.Moreno)가 개발했으며, 어떤 소집단(small group)의 구성원들 사이에 존재하는 대인관계에 대한 자료를 수집하고 분석하며 도표화하는 인간관계 측정 방법. 보가더스 척도가 집단 간의 관계를 측정한다면, 소시오메트리는 집단 내의 관계를 측정한다는 차이가 있다. 또한, 보가더스 척도는 단순히 집단 간의 거리감을 판단하는 용도지만, 소시오메트리는 한 집단 내에서 각 구성원들이 서로 어떻게 연결되어 있는지 확인할 수 있으며, 구성원 간의 매력과 반발심 외에도 이러한 정서에 의해 촉발되는 집단역동(group dynamics)까지 분석할 수 있다는 장점이 있다.

소시오메트리가 사용되는 소집단 환경은 집단 구성원 모두가 서로의 존재를 알고 있으며 모든 구성원 조합 간의 상호작용이 가능한 환경이다. 이때 소시오메트리를 통해서 그 소집단에서 가장 영향력을 강하게 발휘하는 사람이 누구인지, 그리고 고립되어 있는 사람은 누구인지 확인할 수 있다. 이 때문에 경영학이나 행정학, 조직심리학 등지에서 리더십 연구를 하기에 적절하며, 사회심리학 교육학 등지에서 집단따돌림 여부를 확인하는 데에도 쓰일 수 있다.

질문지에 대한 응답이 완료되면, 연구자는 이를 토대로 하여 소시오메트리 행렬이나 소시오그램(sociogram), 소시오메트리 지수 등으로 데이터를 산출하고, 결과 데이터를 도표로 만들 수 있다. 소시오메트리 행렬을 사용할 경우 소집단 구성원이 n명일 때 n×n 행렬의 형태로 구성되며, 상대방의 이름을 지명할 때마다 1씩 더하여 총계를 합산한다. 대표적인 계량적 분석방법이고 계량화 자체도 어려운 것은 아니지만, 이론적 밑바탕이 결여되어 있다는 지적도 있다. 또한 호불호를 이분법적으로 나누기 때문에 미묘한 긴장관계를 탐지할 수는 없다.
<colbgcolor=#DDDDDD>구성원명 →A →B →C →D →E
A→ 0 1 1 0
B→ 1 0 1 0
C→ 1 0 1 0
D→ 0 1 1 0
E→ 0 0 0 1
총점 2 1 2 4 0

위 가상의 소시오메트리에서 A와 B 사이의 관계는 일방적인 짝사랑 같은 우호 관계로 이루어져 있으며, C와 D 사이의 관계는 쌍방향 우호 관계로 이루어져 있다. 그리고 B와 C 사이의 관계는 어느 쪽도 서로를 지명하지 않은 관계이다. 마지막으로, 이 집단의 최고의 인기쟁이(?)는 D임을 짐작할 수 있으며, 이 집단의 미운 오리 새끼(…)는 E임을 알 수 있다.

짐작하겠지만 많은 일선 학교들에서 설문조사를 할 때 "친한 친구 이름을 떠오르는 만큼 (혹은 세 명까지) 적으세요" 같은 문항이 나온다면 그것이 바로 소시오메트리다. 그리고 어떤 학생들에게는 평생의 트라우마를 남긴다. 최대한 정확성 높은 분석을 위해서 굳이 따라야 할 가이드라인은 없지만, 소시오그램을 깔끔하고 명확하게 표시해야 한다거나 혹은 다른 조건이 걸릴 때에는 구성원의 나열에 제한을 둘 수도 있다.
1. 같은 부서에 편성되어 함께 일하고 싶은 구성원이 있다면 누구입니까?     
2. 귀하께서 가장 친밀감을 느끼는 구성원이 있다면 누구입니까?     
3. 귀하의 집단에서 생일이나 경조사를 챙겨주기를 희망하는 구성원들을 선호에 따른 순서대로 나열하십시오.
                 

2.5. 보기 간 비교 활용

비교 척도(comparative scale)는 모든 보기들에 대해서 응답자가 갖고 있는 호불호의 강도가 보기마다 다르리라 전제하고, 그 차이에 따라서 보기들을 서수적으로 정렬하는 논리를 따른다.

일반적으로는 사회조사분석사 2급 수준에서는 잘 포함되지 않는 내용이지만, 그 유용성으로 인하여 일반인들부터 마케팅 실무에 이르기까지 범용적으로 활용되고 있다.

2.5.1. 서열 순위 척도

rank-order scale

비교 척도의 한 종류로, 응답자가 특정한 태도나 가치에 관해서 여러 대상들을 값으로 정하고 상대적 순위를 정하도록 하는 것. 굉장히 단순하고 기초적인 척도로, 이것이 좀 더 버전업(?)을 하면 쌍대 비교 척도가 된다. 응답자 입장에서는 굉장히 손쉽고 단순한 질문.

반대로 연구자 입장에서는 굉장히 불편한데, 자료분석에 사용할 통계적 기법들이 극히 제한되고, 1위로 가장 빈번하게 나타나는 값만 의미가 있고 나머지는 큰 의미가 없는 것이 보통이다. 1등만 기억하는 더러운 세상 게다가 어떤 응답자가 특정 값을 1위로 선정했다 하더라도, 그것이 "이것을 가장 선호한다" 가 아니라 "그나마 이것이 가장 덜 싫다" 라는 의미일 수도 있으니 주의가 필요하다.

이 때문에 이 종류의 척도만을 대상으로 분석하는 결합분석 혹은 (그대로 음역한) 컨조인트 분석(conjoint analysis)이라는 것도 만들어졌다. 이것은 경영학계에서 자신들만의 통계적 방법으로 자신있게 내놓을 만한 분석기법인데, 이는 이 분야에서 소비자들의 피드백을 받거나 상품 선호와 관련한 시장조사를 할 때마다 순위 척도를 워낙 빈번하게 써야 했기 때문이다.
Q. 귀하의 가정에서 사용하실 수 있는 유선인터넷 서비스를 선호하는 순서에 따라 서열 번호를 매겨 주시기 바랍니다.
1. olleh 인터넷: (   )   2. SK브로드밴드: (   )   3. LG U+: (   )   4. 케이블인터넷 업체: (   )

2.5.2. 상수 합계 척도

constant-sum scale

고정 총합 척도라고도 한다. 여러 속성들로 이루어진 값(value)들을 배치하고, 각각의 값들에 대한 응답자의 선호도를 측정하되, 총점의 총량을 미리 설정하여 각 속성들의 상대적인 중요성을 파악하기 위한 척도. 결과 데이터는 일반적으로 등간 수준에서 다루어지는 것이 보통이다. 응답 결과 사이의 변량이 충분히 크지 않아서 차후 분석에 곤란할 수 있다는 문제는 이 척도의 단점.

일반적으로 총점은 10점 혹은 100점으로 설정되는 경우가 많다.
Q. 귀하께서는 스마트폰 단말기를 구입하실 때 어떤 요소를 가장 고려하십니까? 각각의 중요성에 따라서 합계가 100점이 되도록 점수를 할당해 주십시오.
1. 디자인: (   ) 점   2. 카메라 성능: (   ) 점   3. 저장공간: (   ) 점   4. 배터리: (   ) 점   5. A/S: (   ) 점

2.5.3. 쌍대 비교 척도

pairwise comparison scale

위에서 보았던 서열 순위 척도의 확장판. 어떤 주제에 대한 다양한 값들을 정한 뒤, 응답자에게 그 값들을 둘씩 짝지어서 고르게 한 뒤 그 결과를 토대로 연구자가 직접 선호순위를 도출한다. 둘 중에 하나를 고르는 결과가 계속 누적되면, 그 자료를 가지고 연구자가 분석을 거쳐서 가장 선호받는 값과 가장 덜 선호받는 값을 얻게 되는 것. 확실히 응답자에게는 편하다. 서열 순위 척도처럼 여러 값들을 한꺼번에 응답자에게 던져주고 순위를 정하라고 하는 것보다는, 차라리 둘 중 하나를 고르게 하는 과정을 계속 반복하게만 하고 그 분석은 연구자가 알아서 하면 되니까. 연예인들의 이상형 월드컵을 예시로 들면 이해하기 쉬울 것이다.

하지만 응답자 입장에서 판단이 간결하다는 것과는 별개로, 쌍대 비교 척도는 경우에 따라 굉장히 다루기 불편할 수 있다. 특히 값들의 수가 많은 조사에서 그렇다.[10] 이렇게 되면 아무리 쉬운 판단이라 하더라도 응답자가 지치게 될 가능성이 있다. 그리고 두 값의 쌍 중에서 먼저 제시된 값을 선호하게 하도록 은연중에 압박이 작용할 위험도 있고, 사실 둘 중 하나를 고르는 것 자체가 항상 말처럼 쉬운 건 아니다.(…) 짜장면 vs 짬뽕 김치찌개 vs 된장찌개 물냉면 vs 비빔냉면 양념치킨 vs 후라이드치킨 차라리 부먹 vs 찍먹처럼 개인 간의 입장차가 극명하다면 몰라도, 한 개인이 두 값 모두 선호수준이 비등해서 고르기 힘들어하는 경우도 충분히 있을 수 있다.
Q. 면식동호회 회원으로서, 귀하께서 이하의 라면 상표들 중에서 더 선호하시는 라면을 골라 주십시오.
1. AA라면 & BB라면 (   )    2. AA라면 & CC라면 (   )    3. AA라면 & DD라면 (   )
4. BB라면 & CC라면 (   )    5. BB라면 & DD라면 (   )    6. CC라면 & DD라면 (   )

3. 척도화의 접근법

척도 사용의 본질이 '재어 봄' 에 있다면, 다수의 측정대상을 재어 보았을 때 필연적으로 그 수치에 차이를 보이게 마련이다. 그런데 사회과학에서 어떤 종류의 측정은 응답자들이 저마다 다르다는 점 때문에 차이가 나타나기도 하고, 어떤 종류의 측정은 그 척도상의 문항들이 다르다는 점 때문에 차이가 나타나기도 하며, 또 어떤 종류의 측정은 응답자와 문항의 차이가 모두 관여하여 측정결과를 다양하게 만들기도 한다. 이것은 무엇을 줄세우기를 할 것인가의 문제라고도 볼 수 있다. 측정을 통해서 어떤 조사자는 눈금자 위에 사람들을 줄세우려 할 수도 있고, 또 어떤 조사자는 눈금자 위에 문항들을 줄세우려 할 수도 있으며, 어떤 조사자는 둘 다 줄세우기가 가능한 측정을 시도할 수 있다.

이에 대해서 미국의 심리측정학자 워런 토거슨(W.S.Torgerson)이 척도화의 접근법(approach)에 관련하여 논의했던 내용을 정리하면 다음과 같다.
Q. 차별금지법 입법에 대한 귀하의 의견은 어떻게 되십니까?
① 매우 반대  ② 반대하는 편  ③ 중립  ④ 찬성하는 편  ⑤ 매우 찬성
  • 피험자 중심 척도화(subject-centered scaling): 측정 결과의 차이가 각 응답자들 간의 차이로 인해 발생한다고 보는 접근법으로, 여러 응답자가 동일한 자극에 노출되면서 응답의 차이를 드러내게 된다. 눈금자 위에 응답자들을 줄세우는 접근법이라고도 볼 수 있다. 비교대상이 각각의 응답자 혹은 응답 집단이 되기 때문에, 문항들을 서로 비교하는 상황은 의도되지 않는다. 측정 결과에는 응답자의 호불호 의견의 강도가 반영된다. 리커트 척도가 이 견해를 따르는 척도 구성이라고 간주되고 있다.
Q. 다음 두 문장 중에서 차별금지법 입법에 대해 더 호의적이라고 느껴지는 문장을 골라 주십시오.    
① 우선 충분한 사회적 논의를 거친 이후에 통과시키는 것이 바람직하다.
② 우선 통과시킨 후 적응을 위한 교육 프로그램을 편성하는 것이 바람직하다.
  • 자극 중심 척도화(stimulus-centered scaling): 측정 결과의 차이가 각 문항들 간의 차이로 인해 발생한다고 보는 접근법으로, 동일 응답자가 여러 자극들에 노출되면서 응답의 차이를 드러내게 된다. 눈금자 위에 문항들을 줄세우는 접근법이라고도 볼 수 있다. 비교대상이 각각의 문항들이 되기 때문에, 응답자들끼리 서로 비교하는 상황은 의도되지 않는다. 측정 결과에 응답자의 의견은 배제되며, 문항 자체의 우호성만이 반영된다.[11] 서스톤 척도가 이 견해를 따르는 척도 구성이라고 간주되고 있다.
Q. 다음 두 문장에 대해서 귀하의 의견을 찬성 또는 반대로 표명해 주십시오.
① 우선 충분한 사회적 논의를 거친 이후에 통과시키는 것이 바람직하다.  □ 찬성  □ 반대
② 우선 통과시킨 후 적응을 위한 교육 프로그램을 편성하는 것이 바람직하다.  □ 찬성  □ 반대
  • 반응 중심 척도화(response-centered scaling): 측정 결과의 차이가 응답자들 간의 차이와 문항들 간의 차이 모두로 인해 발생한다고 보는 접근법으로, 여러 응답자가 여러 자극들에 노출되면서 응답의 차이를 드러내게 된다. 여기서는 눈금자 위에 응답자들도 줄세울 수 있고, 문항들도 줄세울 수 있다. 따라서 이 척도에서는 응답자들끼리 비교하거나 문항들끼리 비교하는 것이 모두 가능하다. 측정 결과에 응답자의 호불호 의견과 문항 자체의 우호성이 모두 반영된다. 거트만 척도가 이 견해를 따른다고 간주되고 있다.

4. 관련 문서

5. 둘러보기

🏬 사회과학 조사·연구 방법론 둘러보기
{{{#!wiki style="margin: 0px -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -2px -11px"
<colbgcolor=#C1F3FF>📝 서론 <colbgcolor=#F7FFFF,#191919> 사회과학 · 과학적 방법 · 사회조사 · 연구 · 가설 · 이론( 이론적 조망) · 연구윤리
🔍 조사방법론 I 변인 · 정의 · 상관관계와 인과관계 · 실험( 실험설계 · 통제 · 통제집단과 실험집단) · 사례연구
자료 · 자료수집( 면접법 · 초점집단면접법 · 질문지법 · 관찰법) · 코딩
📈 조사방법론 II 표본조사 · 지표 · 측정 · 신뢰도와 타당도 · 지수 · 척도
📊 사회통계 통계적 방법 · 기술통계학 · 확률 및 분포 · 추론통계학 · SPSS · 분석기법( 분산분석 · 회귀분석)
👔 공인 자격증 사회조사분석사 · 빅데이터분석기사 · 국가공인 데이터분석 전문가
📂 메타 문서 연구방법론 관련 정보
상기 문서들은 한국통계진흥원 및 한국산업인력공단의 출제범위에 의거하여 엄격히 망라되어 있으며, 동 기관의 과목별 구분·명명에 의거하여 조사방법론은 2파트로 구분됨
}}}}}}}}} ||



[1] 물론 이는 사회과학 분야에서 한정적으로 합의된 개념화이므로, 다른 학문분야나 언론사 등지에서 ○○인덱스, ●●스케일 같은 표현이 나온다고 해서 기계적으로 위 개념화를 적용하기에는 무리가 있다. [2] 사회과학적인 예를 들자면 조선족에 대한 태도 척도를 '따뜻함'(warmth) 차원과 '유능함'(competence) 차원으로 나누어 측정하는 경우를 떠올릴 수 있다. 여기서도, 조선족들이 다정하고 친절할지에 대한 태도와, 조선족들이 실력 있는 인재일지에 대한 태도는 상충되지 않는다. 때로는 '따뜻하면서도 유능하다' 는 태도가 나올 수도 있고, '따뜻하지도 유능하지도 않다' 는 태도가 나올 수도 있다. [3] 여성, 노인 역시 넓은 의미의 '사회적 소수자'에 해당될 수 있으나, 일반적으로는 제외한다. [4] 가령 원하지 않는 임신의 경우 낙태할 수 있다고 응답한 사람이, 어떤 경우에도 낙태는 절대 금지라는 진술에도 긍정한다고는 장담할 수 없다. [5] 하술하겠지만 리커트 척도가 바로 이 전제 때문에 많은 논란을 겪고 있다. [6] 중립적 반응 외에 호불호 반응의 강·약을 구분. [7] 중립적 반응 외에 호불호 반응의 강·중·약을 구분. [8] 이럴 때는 리커트 척도가 아니라 스타펠 척도나 의미 차별화 척도를 쓰는 게 더 적절하다. 리커트 척도를 쓰려다간 자칫 지도교수에게 까일 수도 있다. [9] 비슷한 다른 사례로 "귀하는 연인의 교육 수준이 이성교제의 지속에 얼마나 중요하다고 생각하십니까?" 에서 높은 숫자가 무엇을 의미하는지 명확히 할 필요가 있다. 많은 사람들은 숫자가 높을수록 '연인의 교육 수준이 높거나 낮음 여부가 내게 무조건 중요하다' 라고 이해하곤 하지만, 어떤 사람들은 '내 연인은 무조건 고학력이어야 한다' 로 의미를 약간 다르게 받아들이기도 한다. 또 다른 사례로, "이 광고를 보고 나서 ○○사에 호감이 생겼습니까?" 에 대해서 값 '1 = 매우 그렇지 않다' 의 의미를 '이전에나 이후에나 아무런 변화가 없다' 로 받아들이는 사람이 있는가 하면 '오히려 매우 나빠졌다' 로 받아들이는 사람이 있다. 이 경우 전자는 중립적 반응을 보이기 위해 1을 골랐는데 후자는 극단적으로 부정적 반응을 보이기 위해 1을 고르는 상황이 된다. [10] 5가지 값을 가지고 만들어야 할 쌍의 수, 그리고 15가지 값을 가지고 만들어야 할 쌍의 수는 각각 수학적으로 몇 개가 나오는지 계산해 보자. [11] 예컨대 위 사례에서 응답자는 본인이 차별금지법에 대해 어떻게 생각하건 간에, 두 문장을 서로 비교하면서 더 호의적이고 덜 호의적인 상대적 관계를 파악하려 애쓰게 된다.