교육학에서 데이터는 교육과 관련된 문제를 데이터를 기반으로 해결하기 위한 과학적 방법론을 적용하는 것이 목적이다. 수집하는 데이터는 학생들의 학업기록, 결과, 성적, 개인 특성, 관심사 등이다. 학생들의 개인정보는 보호하되 다양한 유형의 학생들을 이해하고 학습 향상을 위한 교육법을 찾기 위해 교육 데이터가 중요해지고 있다.
교육 데이터의 활용 사례
- 사회-정서적 활용: 학습 동기 유발 요인을 이해
- 요구사항 모니터링: 학습자 요구분석을 통해 맞춤형 교육에 활용
- 교육과정 혁신: 수요에 맞는 학습과정으로 혁신
- 교사 실적 측정: 교사의 성과 추적 및 모니터링 가능
교육 데이터를 수집하기 위한 사이트
- NCES http://nces.ed.gov 미국 국립교육통계 센터
- PISA http://www.oecd.org/pisa 수과학 학업성취도 꽌련 연구에 유용
- 학교알리미 https://schoolinfo.go.kr/ 우리나라 학교 주요 정보 확인 가능
- EDSS https://edss.moe.go.kr 교육기관에 축적되어 있는 교육 관련 데이터
- Gap minder https://www.gapminder.org 인구 예측, 부의 이동 등의 내용, 시각화 잘함
교육데이터 분석의 접근 방법(2가지)
1. 확증적 데이터분석>(CDA, Confirmatory Data Analysis)
미리 설정한 분석 목적을 기반으로 데이터를 확보한 뒤에 분석하는 방법
수집한 데이터로 연구 가설들을 평가하고 추정하는 전통적인 분석방법이다. 관측된 형태나 효과의 재현성 평가, 유의성 검정, 신뢰구간 추정 등 통계적 추론 방법 등이 많이 사용된다. 예를 들어 해당 과학 수업이 학생의 과학 실력 향상에 도움이 될 것이라고 가설로 설정하고 관련 데이터를 수집한 후 수업 여부와 과학 점수의 연관관계를 파악하여 가설검정을 하는 방법이다.
2. 탐색적 데이터분석(EDA, Exploratory Data Analysis)
데이터를 탐색해 특징과 구조를 분석한 뒤 결론을 얻어내는 분석 방법
특별한 가설 설정 없이 유연하게 데이터를 탐색하며 이 과정에서는 주로 시각적 기법들과 기술통계 방법들이 많이 이용된다. 최근에는 이 방법을 많이 사용하여 여기서 얻은 정보를 이용해 가설을 다시 세워본다.
데이터 분석 프로세스
데이터 수집 - 데이터 전처리 - 데이터 탐색 - 데이터 모델링 - 모델 공유 및 결과 해석
데이터 수집 단계에서는 직접 설문조사를 시행하거나 교육 자료들을 수집한다. 여러 학술논문들을 참고하여 어떤 데이터를 활용했고 데이터를 어디서 구했는지 등을 참고한다. 이후 데이터가 적절히 잘 수집되었는지 확인하고 결측치 처리, 이상치 처리, 데이터 분포 변환, 데이터 단위 변환 등 데이터 전처리 과정을 거친다. 데이터가 제대로 정제되지 않으면 결과에 오류가 생기므로 데이터 전처리 단계는 전체 과정 중 매우 중요하다.
데이터 탐색 단계에서는 수집한 데이터를 분석하기 전 다양한 각도에서 데이터 특징을 파악하고 이해한다. 데이터 전처리 과정과 동시에 진행되는 경우도 많다. 다양한 각도로 데이터를 살펴보면서 문제 정의 단계에서 미처 발생하지 못했을 다양한 패턴을 발견하고 기존 가설을 수정하거나 새로운 가설을 세운다. 탐색 단계에서 데이터를 시각화하며 여러 방법으로 통계값들을 요약해보며 데이터를 탐색한다.
데이터 모델링 단계에서는 데이터 탐색이 끝난 뒤 설정한 가설이나 해결하려는 문제에 맞춰 적합한 모델을 만든다. 의미있는 분석 결과나 좋은 모델을 만들기 위해 다양한 방법론들이 비교되고 적용된다. 분류 혹은 예측 알고리즘을 적용하거나 군집분석을 적용 후 분석, 평가를 진행한다.
데이터 분석 방법의 사례를 보면, A, B 중학교의 국어와 영어 4개 연도 기초학력을 비교해보고자 했을 때 회귀분석으로 한다. 회귀분석을 하는 또다른 사례들을 보면, 대학 입학시험에 미치는 요인들을 알아보고자 할 때 다중회귀분석을 이용했고 원격교육에서 학습자의 중도탈락 요인을 알기 위해 로지스틱 회귀분석을 사용했다. 변수가 너무 많아서 변수를 선택해야하고 예측 성능을 올리기 위한 방법으로는 Lasso벌점회귀모형이 있다.
'교육 이론' 카테고리의 다른 글
자료의 요약: 평균, 중앙값, 최빈값, 변수 간 상관관계 (0) | 2023.05.19 |
---|---|
데이터의 유형과 시각화 기초: 도수분포표, 히스토그램 (0) | 2023.05.15 |
마이크로 티칭(수업 시연)과 수업 분석 (0) | 2023.05.08 |
수업지도안 양식 (0) | 2023.05.06 |
수업지도안 작성 방법 (0) | 2023.05.05 |