데이터는 여러 가지 변수로 구성되어 있다. 변수는 데이터를 수집할 때 측정 결과나 조사 대상에 따라 다양한 값을 가질 수 있는 하나의 특성이다. 관심있는 변수들을 조사하거나 측정하여 실제 값들을 모은 결과를 데이터라고 한다. 양적변수는 수치형 변수라고 하며 연속형 변수(키, 몸무게)와 이산형 변수(산불 발생 건수)가 있다. 질적변수는 범주형 변수라고 하며 순위형 변수와 명목형 변수가 있다. 순위형 변수는 말 그대로 순위가 있는 자료로서 1등급, 2등급, 3등급 등으로 등급을 나눌 수 있는 데이터이다. 혈액형은 순위의 의미를 따질 수 없는 명목형 변수다. 범주형 자료를 요약할 때는 도수분포표를 활용할 수 있다. 도수는 각 범주에 속하는 관측 값의 개수이고 이를 전체 도수로 나눈 값들을 상대도수라고 한다. ..