npsm 새물리 New Physics : Sae Mulli

pISSN 0374-4914 eISSN 2289-0041
Qrcode

Article

Research Paper

New Phys.: Sae Mulli 2024; 74: 1258-1271

Published online December 31, 2024 https://doi.org/10.3938/NPSM.74.1258

Copyright © New Physics: Sae Mulli.

Practical Exploration for the Introduction of Scientific Inquiry Using Open Data

오픈 데이터 활용 과학 탐구 도입을 위한 실천적 탐색

Jongwon Park, Hye-Gyoung Yoon*

Department of Physics Education, Chonnam National University, Gwangju 61186, Korea
Science Education Department, Chuncheon National University of Education, Chuncheon 24328, Korea

Correspondence to:*yoonhk@cnue.ac.kr

Received: September 30, 2024; Revised: November 4, 2024; Accepted: November 6, 2024

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

This study proposes a novel scientific inquiry model utilizing open data, developed through a review of relevant literature and the researchers’ direct engagement and reflective practice. The practical feasibility of this model was examined by conducting inquiry activities in collaboration with science teachers. The model is structured into three primary phases: ‘preparation’, ‘conducting scientific inquiry’, and ‘sharing and reflecting inquiry results’ with each phase further subdivided into multiple steps. Based on detailed feedback provided by the teachers regarding the open data inquiry model, the researchers offer several recommendations for the implementation and broader dissemination of scientific inquiry utilizing open data.

Keywords: Open Data, Scientific Inquiry Model, Science Teacher

이 연구는 관련 문헌 검토와 연구자들의 직접적인 참여 및 성찰을 통해 오픈 데이터를 활용한 새로운 과학 탐구 모형을 제안한다. 이 모형의 실천적 가능성은 과학 교사들과의 협업을 통해 탐구활동을 수행하면서 검토되었다. 제안된 모형은 ‘사전 준비’, ‘탐구 실행’, ‘탐구 결과 공유 및 성찰’의 세 가지 주요 단계로 구성되며, 각 단계는 다시 여러 세부 단계로 나뉜다. 오픈 데이터 탐구 모형에 대한 교사들의 구체적인 피드백을 바탕으로, 연구자들은 오픈 데이터를 활용한 과학 탐구의 실행 및 확산을 위한 몇 가지 제언을 제시한다.

Keywords: 오픈 데이터, 과학 탐구 모형, 과학 교사

과학교육은 학생의 과학적 탐구 역량을 증진하는 것을 목표로 해 왔다. 전통적으로는 학생들이 직접 가설을 설정하고, 실험을 계획하고, 실험을 통해 관찰하거나 수집한 데이터를 바탕으로 결론을 내리는 탐구가 중시되었다. 그러나 인공지능(AI), 빅데이터(Big Data), 사물 인터넷(Iot), 클라우드(Cloud) 등이 융합된 지능정보기술이 발달하면서 실제 과학자들의 탐구에도 이러한 지능정보기술이 다양하게 도입되고 있고 빅데이터 분석을 중심으로 한 연구도 활발해졌다. 천문학에서는 우주망원경, 관측 위성 등을 통해 수집한 방대한 데이터가 활용되고 있으며, 생태학, 환경 과학에서도 원격 센서 등을 통해 수집한 빅데이터가 활용되고 있다. 독일 기상청과 막스 플랑크 연구소 등이 공동으로 개발하여 운영 중인 ICON 모형(Icosahedral Nonhydrostatic Weather and Climate Model)은 지구 전체를 작은 격자로 분할하고 각각에 해당하는 온도, 기압, 습도, 풍향, 풍속 등의 데이터를 이용하는데 하루 동안 생성되는 데이터만 수 테라바이트에 해당한다[1]. 유럽입자물리학연구소(CERN)의 강입자 충돌기(LHC: Large Hadron Collider)는 초당 페타바이트(PB) 단위의 데이터를 생성하며, 이 데이터는 전 세계의 데이터 센터에 공개되어 분석되고 있다[2].

이제 학교 과학교육에도 이러한 실제 과학의 추세를 반영하여 미래 사회를 살아갈 학생들에게 새로운 유형의 탐구를 지도해야 할 필요성이 생기게 되었다. 이러한 변화의 필요성을 강조하고 있는 것 중 하나가 영국에서 나온 ‘혁신적 교수법(Innovating Pedagogy)’ 보고서다[3]. 이 보고서에는 혁신적 교수법의 한 가지로 ‘빅데이터 기반으로 사고하고 질문하기’를 제안하고 있다. 미리 가공된 데이터로 간단한 질문에 관한 명확한 답을 구하는 게 아니라, 유연하게 다양한 모형을 구성할 수 있는 빅데이터 환경에 참여하여 사고하고 질문하며 문제해결 역량을 키우는 교육이 필요하다는 것이다. 같은 맥락으로 빅데이터를 이용한 탐구가 새로운 유형의 참된(authentic) 과학 탐구라는 주장이 제기되고 있다[4, 5].

아직 중·고등학교에는 빅데이터를 활용하는 탐구가 적극적으로 도입되고 있지는 않지만, 일부 연구가 시도되고 있다. 교사들의 빅데이터 교육역량 증진을 위해 실제 천체 관측 데이터로 H-R도(Hertzsprung-Russell diagram)를 작성하는 탐구 프로그램을 개발, 적용한 연구가 있으며[6], 고등학교 지구과학 영역인 대기와 해양의 상호작용 단원에서 빅데이터를 활용하는 탐구 수업을 적용한 연구도 있다[7]. 연구자들은 사전, 사후 평가를 통해 학습자의 빅데이터 활용 역량에 통계적으로 유의한 차이가 있음을 보고하였는데, 탐구를 수행한 연구 참여자는 과학고등학교 학생들이었으며 이들은 Python 프로그래밍을 통해 탐구를 수행했다. 천문 분야나 기후 과학 분야의 경우 전 지구적 관측을 통한 빅데이터 자료가 풍부하여 이러한 실제 과학의 빅데이터 기반 탐구를 과학교육에 도입하려는 시도는 유의미하고 선도적인 것으로 볼 수 있다.

한편 저작권 및 특허권 제약 없이 공공기관 혹은 민간기관에서 데이터 자원을 모두에게 무료로 활용 및 배포하는 것을 오픈 데이터라고 한다. 우리나라에서 오픈 데이터 개념은 공공 데이터 포탈(www.data.go.kr)을 통하여 많이 알려졌다. 공공 데이터 포탈은 날씨 데이터, 교통 데이터, 의료 데이터 등 우리 생활과 밀접한 데이터를 누구나 쉽게 이용할 수 있도록 제공하고 있다. 또 이것은 여러 빅데이터 플랫폼과 연결되어 있기도 하다. 외국의 연구기관인 NASA(National Aeronautics and Space Administration)나 NOAA(National Centers for Environmental Information) 등은 물론 국내의 한국과학기술연구원, 한국전자통신연구원, 한국에너지기술연구원, 한국생명공학연구원 등 연구소도 웹사이트를 통해 오픈 데이터를 제공하고 있다. 이처럼 우리는 지능정보 사회의 ‘데이터의 바다’에서 살고 있으며 미래를 살아갈 학생들이 이러한 데이터를 효과적으로 활용하여 지식을 생성하고, 문제를 해결하고, 의사결정을 하도록 돕는 교육이 확대될 필요가 한다. 따라서 오픈 데이터 혹은 빅데이터에 기반한 과학 탐구활동의 의미와 실천 가능성을 탐색하는 것이 필요하다.

이 연구는 과학 교수 학습 과정의 새로운 과학 탐구 유형으로서 오픈 데이터를 활용한 과학 탐구 모형을 제안하고, 연구자들이 개발한 모형을 적용한 탐구활동을 과학 교사들과 함께 수행해 보면서 그 실천적 가능성을 탐색하고자 하였다. 연구 문제를 구체화하면 다음과 같다.

· 오픈 데이터 활용 과학 탐구 모형은 어떻게 구성할 수 있을까?

· 오픈 데이터 활용 과학 탐구 모형 도입에 대한 과학 교사의 의견은 어떠한가?

1. 빅데이터, 오픈 데이터 활용 과학 탐구

디지털 자원을 이야기할 때 ‘빅데이터(Big Data)’, ‘오픈 데이터(Open Data)’가 흔히 언급된다[8]. ‘빅데이터’는 일반적으로 5가지의 특성(5V)을 가진다. 크기(Volume)의 측면에서 많은 양이 필요하며, 속도(Velocity) 측면에서 데이터의 수집 및 측정 주기가 빠르게 이루어지고, 데이터의 종류가 다양하고 다층적이며(Variety, Variability) 데이터로서 중요한 가치(Value)를 지닌 것이어야 한다[9]. 또 빅데이터는 일반적인 데이터베이스 프로그램으로는 수집·저장·분석 등이 어려운 대규모 데이터를 말한다[10]. ‘빅데이터’는 흔히 ‘크다’라는 뜻을 가진 ‘빅(big)’이라는 수식어로 인해 양적 측면만 부각하는 경향이 있지만, 실제로는 질적 측면의 의미를 살펴볼 필요가 있다[11]. 즉 데이터의 수집, 분석, 정제 방식 등이 기존의 방법과는 질적 측면에서 차별화되고 미래 사회의 복잡계 특성에 연관된 다양한 특성을 담고 있다[12]. 여러 분야에서 새로운 유형의 대규모 데이터가 생성되면서 이러한 데이터를 처리하고 시각화하여 이전에는 해결하기 어려웠던 문제를 탐색할 수 있게 되었다[13].

그러나 초중등 교육에서 수 페타바이트(petabyte) 규모의 데이터를 직접 다루기는 어렵다. 그래서 교육에서는 스프레드시트로 다룰 수 있는 수백, 수천 레코드와 같은 ‘대규모 데이터’를 빅데이터라고 부르기도 한다[14]. 즉 데이터의 양적 측면에 절대적 기준을 가지고 빅데이터를 구분하지 않고 생성 속도가 빠르거나, 실시간으로 측정되거나, 긴 기간 동안 주기적으로 축적된 데이터, 다양한 출처의 데이터를 동시에 다루는 경우 등을 통칭하여 ‘빅데이터’로 칭하기도 한다. 한편 ‘오픈 데이터’는 저작권 및 특허권의 제약 없이, 혹은 합법적 통제를 통해 데이터 자원을 모두에게 무료로 활용하게 하는 것으로 ‘데이터 민주주의’ 개념과 일맥상통한다. 이처럼 빅데이터와 오픈 데이터는 서로 다른 개념이지만 오픈 데이터는 대개 실제 상황의 데이터로서 중요한 가치를 지닌 것이며, 빅데이터 플랫폼도 오픈되어 일반인이 이용할 수 있는 경우가 많아 두 개념은 어느 정도 연관성을 가진다고 볼 수 있다.

과학교육에서 빅데이터 활용은 크게 두 가지 방식으로 생각해 볼 수 있다. 첫 번째는 학생과 교사가 사물 인터넷(Iot), MBL(Microcomputer Based Laboratory) 센서 등을 통해 직접 빅데이터를 생성하는 경우이다. 학생들은 직접 디지털 기기를 통해 여러 변수를 동시에 측정하거나 데이터 샘플링 속도를 높이거나 혹은 측정 기간을 늘려 빅데이터를 생성하여 이전에 잘 이해하기 어려웠던 현상을 탐색할 수 있다. Benz et al.[15]는 데이터 샘플링 속도만 높여도 기존에 관찰하기 어려웠던 스틱-슬립 현상(stick-slip effect)의 데이터를 학생들이 실험실에서 관찰할 수 있음을 보였다. 이처럼 학생들이 직접 디지털 기기를 다루어 측정하고, 측정의 결과를 해석하는 것은 새로운 도구를 통해 새로운 실험 방법을 확장해 가는 것이며, 과학교육에서 실험의 가치와 중요성이 확장되는 것이라고 할 수 있다. 빅데이터를 과학 탐구에 활용하는 두 번째 방법은 온라인 저장소에 제공되는 오픈 데이터를 활용하는 것이다. 학생들은 직접 실험하지 않더라도 과학적으로 유효한 데이터를 제공받을 수 있고 그에 기초한 탐구를 수행할 수 있다.

이 연구는 두 번째 유형의 탐구에 초점을 두고자 한다. 즉 학생이 온라인 오픈 데이터를 활용하여 필요한 데이터를 찾고 이를 분석하고 해석하는 탐구에 중점을 둔다. 온라인 저장소에 공개된 대규모 데이터를 다루기 위해서는 Excel, MakerPlot, TinkerPlots, Tableau 등의 소프트웨어나 인공지능 도구를 활용하거나 Yoon and Kim의 연구[7]처럼 학생들이 직접 코딩하는 것이 필요할 수도 있다. 그러나 코딩이 필요한 경우 오픈 데이터를 활용하는 과학 탐구를 일반 중‧고등학교에 도입하여 학생들이 직접 수행하도록 하기 어려울 수 있다. 따라서 모든 학생이 접근하고 실제로 실천할 수 있는 탐구활동이 되기 위해서는 다음과 같은 점을 고려할 필요가 있다.

첫째, 데이터가 인터넷상에 공개되어 있고 학생이 접근하기 쉬워야 한다. 과학 주제에 따라 실제 오픈된 데이터 자원에 차이가 있으므로 데이터 접근 가능성을 미리 파악하고 이를 고려해야 한다. 둘째, 교사나 학생이 프로그래밍 언어에 익숙하지 않아도 탐구활동을 할 수 있는 방안이 필요하다. 실제 용량이 큰 빅데이터 활용 탐구에서는 학생들이 빅데이터를 시각화하거나 분석하기 위해 프로그래밍을 하거나 관련 도구를 활용하는 것이 필요할 수 있지만, 탐구를 지도하는 교사나 학생이 프로그래밍 언어나 관련 도구에 능숙하지 않다면 과학 탐구의 본말이 전도될 위험성이 있다. 따라서 사용하는 분석 도구는 교사나 학생이 쉽게 접근하고 활용할 수 있는 것이어야 한다. 셋째, 데이터 탐색을 통해 탐구 문제를 발견하는 과정이 강조되어야 한다. 즉 데이터로부터 학생들이 직접 과학적 문제를 찾아내고 탐구 문제를 구체화하는 것이 중요하다. 실제 데이터를 분석하는 과정에서는 데이터를 정제하는 과정이 중요하다. 이상값이나 결측치를 어떻게 조정하거나 제거해야 하는지 등 데이터 전처리 과정이 중요하다. 이러한 데이터 분석의 절차적 과정이 중요하긴 하지만, 학생은 데이터 과학자가 아니므로 데이터를 탐색하여 그 패턴이나 변화를 탐색하고 무엇이 문제인지 탐구 문제를 발견하는 것이 데이터 분석에 대한 절차적 기능을 학습하는 것보다 우선되어야 한다. 이것은 두 번째에서 강조한, 프로그래밍 언어에 대한 이해나 관련 도구 사용 능력에 의해 과학 탐구활동이 제한되지 않도록 해야 한다는 것과 같은 맥락이다.

2. 교사와 연구자 간 협력

많은 교육 연구에서 교사는 연구의 대상이 된다. 연구자는 교육적 현상을 조사하고 탐구하여 이론을 생성하고 교사는 교육적 이론을 실행에 옮기는 것으로 여겨 연구자와 교사의 역할이 이분화 되기도 한다. 그러나 숙련된 교사의 경우 학생의 흥미와 이해 수준, 행동 특성에 대한 풍부한 경험과 실제적 지식을 가지고 있으며, 교육과정 내용과 교육과정의 강조점에 대한 이해도가 높다. 이러한 교사의 지식과 목소리와 관점이 반영되지 않은 교육정책이나 교육개혁안은 실제 현장에 안착하거나 교육 발전 견인에 실패할 가능성이 크다. 마찬가지로 과학교육 연구에서도 과학 교사의 목소리를 적극적으로 반영할 필요가 있다. 교육 이론은 실천적인 기반을 필수적으로 요구하는 것이며, 교사의 목소리를 연구 결과에 담아낼 때 연구 결과가 실제로 활용될 가능성이 높기 때문이다[16].

교사는 처방된 이론을 실천에 옮기는 수동적인 실천가가 아니라, 지식을 생산하는 주체로 여겨져야 하며, 교사-연구자 간 협력을 통해 서로가 비판적인 동료 역할을 하여 상호 발전하는 환경을 조성할 수 있어야 한다. 연구자는 교사의 실천적 지식을 통해 연구자의 이론적 모형에 대한 유용한 피드백을 얻을 수 있고, 반대로 교사는 자신의 지식이나 실천에 대한 성찰을 통해 전문성을 증진할 수 있다. 이러한 협력적 성찰은 과학 교사의 전문성 향상에도 효과적이라고 밝혀지고 있다[17-20]. 교사와 연구자는 서로에게 비판적 친구(critical friend)이다[21]. 즉 교사는 연구자가 가진 지식과 안목을 인정하면서 동시에 자신이 가지는 교육에 대한 실제적 경험에 비추어 이들의 문제와 한계를 지적할 수도 있다[16]. 또 연구자는 교사의 실천적 지식을 존중하고 교사의 다양한 교육적 경험과 학생에 대한 이해를 탐색하여 이를 연구 결과에 반영할 수 있다. 즉 연구자는 교사의 목소리를 연구 결과에 반영하고자 적극 노력할 필요가 있으며, 교사는 반성적 실천가로서 교육 개선을 위한 연구에 참여할 필요가 있다. 교사와 연구자 간 협력은 다양한 방식으로 이루어질 수 있지만 이 연구에서는 소규모 워크숍을 진행하며 교사와 연구자가 협력 관계를 형성하는 환경을 조성하고 과학 교사의 목소리를 통하여 오픈 데이터 활용 과학 탐구 모형의 실천적 가능성을 논의하고자 하였다.

본 연구의 전반적인 연구 과정은 다음 Fig. 1과 같이 도식화할 수 있다.

Figure 1. Overview of research process

첫째, 문헌 연구와 연구자 간 논의를 통하여 과학 교수 학습 과정에 도입할 수 있는 오픈 데이터 활용 탐구 모형을 제안하였다. 사회과학인용색인(SSCI)과 한국학술지인용색인(KCI)을 통해 ‘빅데이터 활용’ 및 ‘과학교육’, ‘탐구’를 주제로 하는 논문을 1차로 선정하고, 이 논문에서 주요하게 참조한 논문을 2차로 선정하는 방식으로 문헌 고찰의 범위를 확대해 나갔다. 기존 연구에서 제안한 빅데이터 활용 탐구 모형을 분석하여, 오픈 데이터를 활용한 탐구 모형의 주요 특성을 추출하였다.

둘째, 연구자가 직접 ‘우리나라의 신재생 에너지 생산량’을 주제로 오픈 데이터 분석 활동을 수행해 보고, 수행 과정을 성찰하여 탐구 모형의 구체적 단계 및 이에 해당하는 활동을 제안하였다. 연도별 및 유형별 에너지 생산량을 다양하게 분석해 보면서 오픈 데이터 활용 탐구 모형의 세부 사항들을 확정해 나갔다. 그리고 개발된 모형을 적용하여 교사와 학생을 위한 탐구활동 자료를 개발하였다. 여기에는 교사나 학생에게 필요한 안내 자료와 탐구 진행을 위한 프로토콜, 학생용 보고서 양식 등이 포함되었다.

셋째, 소규모 교사 그룹과 협력적 워크숍을 진행하였다. 워크숍에 참여한 교사는 총 20명으로 중학교 교사 11명, 고등학교 교사 9명이었으며, 교직 경력은 5년 미만이 17명, 5년 이상이 3명이었다. 이들은 모두 물리교육을 전공한 교사들이다. 협력적 워크숍에서 교사는 학생 입장으로 직접 오픈 데이터를 활용하는 탐구활동을 수행하고 보고서도 작성해 보도록 하였다. 워크숍에서 교사들이 탐구활동을 직접 수행하기 전과 수행한 이후 개별적으로 간단한 설문에 답하도록 하였고, 설문 내용을 바탕으로 소개된 탐구 모형 도입의 필요성, 개선 방향, 실천적 이슈 등에 대해 논의하도록 하였다(Table 1 참조). 연구자 중 1인이 워크숍 진행을 담당하였고 다른 연구자 1인은 참여 관찰자로 워크숍에 참가하면서 워크숍의 진행 과정과 교사의 반응을 현장 메모하였다. 교사의 전체 토론 과정은 녹음 후 전사되었다.


Questions and discussions at the collaborative workshop.


Before conducting inquiry activities

· Have you had any experience guiding inquiry using open data or big data? If so, what was the content, and how did the students perform?

· Do you think that inquiry using open data should be introduced in science classes? Or do you think it's not necessary?

· Please explain the reasons why you think it should or should not be introduced.

After conducting inquiry activities

· Please freely write your opinions on the inquiry model introduced in the workshop (e.g. strengths, areas for improvement)

· What do you think about incorporating inquiry using open data into science lessons? Has your thinking changed since the beginning?

· If inquiry using open data is introduced in science lessons, what difficulties do you anticipate in terms of actual implementation?



넷째, 워크숍 전후 교사가 작성한 설문의 주요 내용 및 이를 바탕으로 한 토론 내용 중 주요한 이슈를 추출하고 이를 요약하였다. 교사의 주요한 의견에 진하게 표시하거나 줄을 긋는 세그멘팅(segmenting) 과정을 통해 예비 코딩을 하고 예비 코딩 내용을 범주화한 후, 중복되는 내용과 비슷한 내용 위주로 범주화하고 영역을 합쳐가며 상위 범주와 하위 범주로 분류하는 과정을 거쳤다.

1. 기존 탐구 모형 분석

과학 교수 학습 맥락에서 도입할 수 있는 오픈 데이터 활용 과학 탐구 모형을 개발하기 위해 선행 연구에서 제안된 탐구 모형을 조사하고 그 특징을 살펴보았다. 선행 연구 분석은 이 연구의 맥락과 같이 공공기관이나 연구기관에서 제공하는 개방된 오픈 데이터를 활용한 과학 탐구에 제한하였다. 대표적인 연구와 각 연구에서 제안된 모형의 단계와 특징을 Table 2에 요약하였다.


The scientific inquiry models using open data proposed in previous research.


ResearchTarget (topic)DurationKey stageOverview
Yoon & Kim [7]1st-year science high school students (Interaction between the atmosphere and the ocean)9 sessionsGuidance on Learning and Understanding Big DataGuiding on the concept, usage methods, and programming languages related to big data
Problem IdentificationDiscovering and defining significant problems
Establishing Big Data Utilization StrategyPlanning detailed strategies and processes for collecting, analyzing, and visualizing big data for its effective use
Big Data CollectionSelecting data and exploring providers, identifying big data file formats for collection and storage
Big Data Analysis and VisualizationPerforming data preprocessing, applying data mining methods, and using visualization tools to represent data in graphs, images, etc.
Deriving Problem- Solving SolutionsProposing problem-solving and response plans based on analysis results
Results Presentation and FeedbackOrganizing the process and results of big data utilization and incorporating feedback from teachers and peers
O'reilly et al. [14]University students (environment, climate, etc.)3–4 hours per topicPart AEngageExploring data initially and learning simple analysis functions using Excel.
Part BExploreInvestigating what the appropriate analysis methods are
ExplainDescribing the meaning and implications of the data
Part CElaborateResolving personal inquiries and expanding on ideas
EvaluateEngaging in discussions and evaluating the learning process
Schubatzky, & Haagen- Schützenhöfer [24]Pre-service teachers (particulate matter)4 hoursInstructor's GuideIntroducing the topic of fine dust and the TinkerPlots software, followed by a simple practice session
Open inquiryQuestionCreating inquiry questions, recognizing relevant variables, and forming hypotheses.
AnalysisChoosing the appropriate data, generating graphs, and making transformations
InterpretationAnalyzing and understanding the graphs
ConclusionReaching conclusions and justifying them, considering uncertainty in the data


Yoon and Kim의 연구[7]에서는 먼저 ‘학습 안내 및 빅데이터 이해’ 단계에서 학생들에게 빅데이터의 개념 및 수업 목표와 과정을 이해하도록 하였고, Google Colab 환경에서 Python 프로그래밍 실습을 연습하도록 하였다. ‘문제 인식’ 단계에서는 교사가 제공한 기후 변화 및 지구 환경 변화에 대한 빅데이터 자료를 통해 학생들이 문제를 인식하고 명료화하였다. ‘빅데이터 활용 전략 수립’ 단계에서는 학생들이 빅데이터 활용, 시각화 전략 및 과정을 구체적으로 계획하였고, ‘빅데이터 수집’ 단계에서는 학생들이 빅데이터 파일 형식 및 저장 방법을 파악하고 Python 프로그래밍 언어를 이용하여 빅데이터를 저장하였다. ‘빅데이터 분석 및 시각화’ 단계에서는 이상값, 결측값을 전처리하고 변인 간의 관계를 분석하고 분석 결과를 그래프로 시각화하였다. ‘문제해결 방안 도출’ 단계에서는 빅데이터 분석 결과를 활용하여 구체적 미래를 예측하여 해결 방안을 탐색하였다. 마지막으로 ‘결과 발표 및 피드백’ 단계에서는 빅데이터 활용 과정과 의사결정 과정에 대해 발표하였다. 이 탐구 모형은 Google Colab 환경에서 Python 프로그래밍 언어(코딩)를 이용하여 진행되었다는 특징이 있다.

O'reilly et al. 연구[14]에서는 환경 과학 분야의 대규모 데이터를 활용해서 대학생의 과학적 문제해결 능력과 개념적 이해를 증진하고자 하였다. 특히 학생들이 스프레드시트를 활용하여 데이터를 관리하고 분석하는 능력에 중점을 두었다. 온라인에 공개된 다양한 데이터를 활용하여 6개 학습 모듈을 구성하였는데 각 모듈은 Part A–Part B–Part C 구조로 이루어졌다. Part A는 초기 데이터를 탐색하고 데이터를 저장하거나 분석하는 기능을 익히는 단계이고, Part B는 학생들이 독립적으로 데이터를 분석하는 단계이다. Part C는 학생이 선택한 문제에 관해 탐구하는 단계이다. 이 모듈은 과학교육에 광범위하게 사용되는 5E 순환학습 모형[22]에 연계된다. Part A는 ‘참여(Engage)’ 단계에 해당한다. 학생들이 초기 데이터 탐색을 통해 간단한 분석을 수행하게 하여 데이터에 친숙하게 한다. Part B는 ‘탐색(Explore)’, ‘설명(Explain)’ 단계에 해당한다. 학생들이 데이터에 관한 자세한 분석을 수행하며, 적절한 분석 방법을 독립적으로 결정하도록 한다. 그리고 학생들이 분석 결과를 바탕으로 데이터의 의미와 과학적 개념을 이해하고 설명하도록 한다. Part C는 ‘확장(Elaborate)’, ‘평가(Evaluate)’ 단계에 해당한다. 학생들은 자신이 선택한 데이터를 사용하여 새로운 질문을 탐구하고 개념을 확장한다. 그리고 토론에 참여하여 자신의 학습 결과를 공유하고 교수자는 피드백을 제공한다. Part A–Part B–Part C 구조는 교수자가 상황에 맞게 유연하게 사용하도록 제안하였다. 초보자를 위해서는 Part A–Part B 구조만 사용할 수 있으며 Part C는 과제로 부여할 수도 있다. 이 탐구 모형의 경우 데이터 분석에 Excel Spreadsheet의 기능을 주로 활용하도록 하였다는 것이 특징이다.

Schubatzky et al.[23]은 미세먼지에 관한 지역의 실제 데이터를 활용하는 탐구에서 QAIC (Question–Analysis–Interpretation–Conclusion) 모형을 제안하였다. 여기서는 다변량 분석을 염두에 두고 소프트웨어 TinkerPlots를 활용하여 학생들이 데이터를 시각적으로 분석할 수 있도록 하였다. 본격적인 탐구에 들어가기 전 교수자는 미세먼지 주제에 관해 소개하고, TinkerPlots의 기본적인 사용을 안내하고 연습하도록 하였다. 이는 학습 주제와 사용할 도구에 대해 친숙하게 하고자 함이다. 공개된 빅데이터 세트를 활용해서 학생들은 그들의 탐구 문제와 가설을 생성하고(Question), 그와 관련된 데이터를 선택하여 그래프로 나타내고 적절한 형태로 변환한다(Analysis). 그리고 그래프를 통해 데이터의 특징을 파악하고(Interpretation), 이에 대한 추론을 통해 결론을 도출하되 불확실성에 관해서도 토론하도록 하였다(Conclusion).

Table 2에 정리한 이 3개의 대표적 모형은 과학고등학교 학생, 대학생, 예비 교사를 대상으로 했다는 점에서 중학교나 일반 고등학교 학생에게 바로 적용하기에 어려움이 있을 것이라 예상할 수 있다. 그러나 오픈 데이터 활용 과학 탐구 모형에서 무엇을 주요하게 고려해야 하는지 다음과 같은 시사점을 얻을 수 있다.

첫째, 오픈 데이터, 빅데이터의 구조와 의미, 사용 도구에 대한 교사의 안내가 필요하다. 이것은 Table 2에 제시한 3개 연구 모두에서 나타나는 특성이다. 연구[7]에서는 Python 프로그래밍 언어에 대해 안내하였고, 연구[14]에서는 Excel Spreadsheet 활용, 연구[24]에서는 TinkerPlots 활용 연습이 이루어졌다. 둘째, 학습자가 데이터를 탐색하며 탐구 문제를 발견하거나 인식하도록 하는 과정이 필요하다. 연구[6]의 ‘문제 인식(Problem Identification)’ 단계나 연구[14]의 ‘탐색(Explore)’ 단계, 연구[24]의 ‘질문(Question)’ 단계가 이에 해당한다. 빅데이터를 탐색하는 과정에서 ‘무엇’을 알아보고자 하는지 학습자가 탐구 문제의 초점을 명확하게 인식하는 것이 중요하다. 셋째, 시각화를 통해 데이터의 패턴을 발견하고 시각화된 자료를 전환하거나 해석하는 단계가 필요하다. 즉 시각화는 데이터 분석에 있어 중요한 단계이다. 연구[7]에서는 ‘빅데이터 분석 및 시각화(Big Data Analysis and Visualization)’ 단계를 명시적으로 설정하고 있고, 연구[24]에서는 ‘분석(Analysis)’ 및 ‘해석(Interpretation)’ 단계에서 그래프 사용을 명시하고 있다. 넷째, 발견한 데이터의 패턴에 대해 추론하여 결론을 내리고 탐구 과정을 평가하는 토론 과정이 필요하다. 연구[7]의 ‘결과 발표 및 피드백(Results Presentation and Feedback )’ 단계, 연구 [14]의 ‘평가(Evaluate)’ 단계, 연구[24]의 ‘결론(Conclusion)’ 단계 등이 이에 해당한다.

2. 연구자의 오픈 데이터 활용 탐구활동 수행 및 성찰

이 연구에서는 오픈 데이터 활용 과학 탐구 모형을 제안하기에 앞서, 오픈 데이터를 활용한 탐구활동을 연구자들이 직접 수행해 보면서 탐구 과정을 성찰하였다. 연구자들이 탐색한 주제는 ‘우리나라의 신재생 에너지 생산량’에 대한 것이었고, 이 과정에서 연구자들이 논의한 주요 내용은 다음과 같다.

첫째, 앞서 제시한 바와 같이 오픈 데이터의 추출과 분석을 위한 데이터의 전처리는 교사가 준비하는 것이 적절하다. 중학생이나 고등학생이 다룰 수 있을 정도로 변인의 종류와 데이터의 양을 줄여야 하고, 또 불필요한 데이터는 삭제하거나, 2개 이상의 오픈 데이터를 결합하는 등의 과정이 꼭 필요하다.

둘째, 큰 탐구 주제와 세부 탐구 주제(탐구 문제)를 구분할 필요가 있다. 큰 주제는 교육과정과 연계된 주제로, ‘우리나라 신재생 에너지 생산량에 대해 알아보자’ 같이 포괄적이며, 기본적인 탐구 주제를 말한다. 세부 주제는 데이터의 기본 특성을 먼저 파악한 후에, 데이터로부터 분석할 수 있는 주제, 예를 들면, ‘풍력에너지와 화력에너지의 연도별 생산량의 변화를 비교해 보자’ 같이 주어진 오픈 데이터로부터 분석할 만하다고 생각되는 구체적인 탐구 질문을 의미한다. 기존의 과학 탐구활동에서는 구체적인 탐구 목적이 설정되면 그에 따라 관련된 데이터를 수집하는 과정이 일반적이지만, 오픈 데이터 탐구활동에서는 데이터가 주어 지기 때문에, 데이터에 대한 기본 특성을 파악한 후에 구체적인 탐구 문제 설정이 가능할 수 있다는 점이 기존의 탐구와 다르다고 할 수 있다.

셋째, 오픈 데이터는 비교적 변인과 데이터의 양이 많다. 따라서 학생들의 분석을 도와줄 수 있도록 분석용 도구를 활용할 필요가 있는데 많은 교사와 학생이 쉽게 사용할 수 있는 도구가 인공지능 도구이다. 인공지능의 사용은 Excel 프로그램, Python 프로그래밍 등의 기능 숙달에 필요한 시간과 노력을 줄여주기 위한 목적에도 유효하다. 단 인공지능을 사용할 때 분석 결과에 오류가 없는지를 점검하는 과정이 필요하다.

넷째, 앞서 언급한 바와 같이 동일 데이터에 대해서 서로 다른 세부 탐구 문제 설정이 가능하고, 그에 따라 탐구 결과가 다르게 얻어질 수 있다. 따라서 서로 다른 탐구 문제에 관한 분석 결과를 공유하고, 비교하고, 모으는 과정이 필요하다.

다섯째, 기존의 탐구활동에서는 탐구 목적을 위한 변인을 설정하고, 나머지 변인들을 통제하는 과정이 일반적이다. 그러나 오픈 데이터의 경우에는 변인이 통제되지 않은 실제 상황에서 얻어진 데이터가 대부분이다. 따라서 데이터 분석 결과 해석이 어려운 경우가 있을 수 있다. 따라서 중학생이나 고등학생이 수행하는 탐구에서는 인과관계를 탐색하기보다는 정량적인 분석 결과를 기술(description)하는 것에 한정하는 것이 적절할 수 있다. 예를 들면 특정 시기에 왜 풍력 발전이 증가하였는지 그 원인을 데이터만으로는 알기 어렵고 다른 사회적 요인(경제적, 정치적, 정책적 요인 등)을 고려할 필요가 있으므로 이 부분은 확장된 탐구로 선택사항이 될 수 있다.

3. 오픈 데이터 활용 과학 탐구 모형 제안

문헌을 통하여 오픈 데이터 분석을 위한 탐구활동의 특징을 분석하고, 연구자가 직접 오픈 데이터 분석 활동을 수행하고, 그 과정에 대해 성찰한 내용을 바탕으로 개발한 오픈 데이터 활용 과학 탐구 모형은 Fig. 2와 같다.

Figure 2. A model of scientific inquiry using open data.

모형은 크게 3단계로 구성되었다. 먼저 I 단계(사전 준비)는 학생들이 탐구를 수행하기 전에 교사가 준비하는 단계이다. II 단계(탐구 실행 단계)는 학생이 직접 오픈 데이터를 분석하는 단계이다. III 단계(결과 공유 및 성찰 단계)는 서로의 분석 결과를 발표하고 공유하며 비교하거나 합치는 과정이고, 나아가 새로운 탐구 문제를 탐색하는 단계이다.

각 단계는 다시 세부 단계로 나뉜다. I 단계(사전 준비)는 I-1 단계(큰 질문 설정)에서 교육과정과 연결되는 큰 규모의 포괄적인 탐구 문제를 설정한다. 예를 들어, 2022 통합과학 교육과정의 성취 기준, ‘[10통과 2-02-06] 에너지 효율의 의미와 중요성을 이해하고, 지속 가능한 발전과 지구 환경 문제 해결에 신재생 에너지 기술을 활용하는 방안을 탐색할 수 있다’와 관련된 큰 질문으로는 ‘우리나라 신재생 에너지 생산량에 대해서 알아보자’가 될 수 있다. I-2 단계(데이터 추출)는 공공 데이터 포탈(www.data.go.kr) 같은 신뢰할 수 있는 기관에서 큰 질문에 관련된 오픈 데이터를 탐색하여 추출한다. 이 과정에서 큰 주제와 관련된 오픈 데이터는 하나가 아니고 여러 개일 수도 있다. I-3 단계(데이터 전처리)는 추출한 오픈 데이터를 학생용 활동에 접합한 수준과 규모로 정리하는 단계이다. 전 단계에서 추출된 오픈 데이터는 있는 그대로 학생이 분석하기에 너무 규모가 크거나, 너무 변인이 많을 수 있다. 즉 데이터의 수가 너무 많거나, 포함된 변인이 너무 세부적이고, 교육과정을 넘어서는 어려운 개념인 경우가 있을 수 있다. 또는 데이터가 너무 제한적이어서 2–3개의 오픈 데이터를 합쳐야 하는 경우가 있을 수 있다. 즉, 이 단계에서 학생 탐구를 위한 데이터 전처리가 필요하다.

II 단계(탐구 실행 단계)는 5개의 세부 단계로 나뉜다. II-1 단계(도입)에서는 먼저 큰 질문 관련하여 오픈 데이터 분석이 왜 중요하고 필요한지를 교육과정과 연계하여 안내해 주는 단계이다. 그리고 데이터가 어디에서 추출되었고, 기본적으로 어떤 변인들로 구성되어 있는지를 간단하게 안내해 준다. 오픈 데이터 분석을 위해 필요한 분석 도구의 기본적인 사용법을 간단히 연습하게 된다. 예를 들어, Excel의 경우에 평균값을 구하거나, 그래프를 그리는 방법, ChatGPT-4o에 Excel 파일을 업로드 후 간단하게 분석 명령을 주는 방법 등을 연습할 수 있다. 그러나 이러한 연습은 도구의 전문적인 사용보다는 도구 사용에 친숙해지기 위한 것이므로, 간단한 수준의 연습이면 충분하다. 만일, 이후 단계에서 데이터 분석을 할 때 추가로 필요한 기능이 있다면 그때그때 지원해 주는 것으로 충분할 수 있다. II-2 단계(데이터 특성 탐색)에서는 데이터에 변인들이 어떻게 제시되고 있는지 살펴보고, 변인에 대해 추가 정보가 필요하면 인공지능이나 인터넷 검색 등을 통해 알아보게 된다. 예를 들면, 데이터에 ‘바이오디젤’의 연간 생산량이 포함되어 있을 때, 바이오디젤이 무엇인지 알아보는 활동을 할 필요가 있다. 이 단계는 학생이 직접 추가로 정보를 탐색할 수도 있고, 교사가 미리 ‘참고 자료’로 준비하였다가 제시할 수도 있다. II-3 단계(세부 질문 설정)에서는 제공된 오픈 데이터에서 탐구할 세부 질문을 설정하게 된다. 이때 인공지능 도구(Clause 또는 ChatGPT-4o) 등을 이용하여 ‘이 데이터로 어떤 걸 분석해 볼 수 있을까?’ 같은 질문을 제시하고, 인공지능이 제안한 질문들을 참고해도 좋다. 이 단계에서 제안된 탐구 질문은 모둠별로 다를 수도 있으므로, 모둠별로 어떤 탐구 질문을 설정할 것인지를 탐구 수행 전에 발표를 통해 조정할 필요도 있다. II-4 단계(세부 질문에 관한 데이터 분석)에서는 설정된 탐구 질문에 따라 인공지능 도구를 활용하여 데이터를 분석하여 결과를 정리하고 시각화한다. 이때 인공지능이 수행한 분석 결과가 학생이 의도와 다르거나, 인공지능의 분석 결과에 오류가 포함될 수도 있으므로, 분석 결과를 점검하는 과정이 필요하다. 분석 결과를 유사한 다른 탐구 질문에 관한 결과와 교차점검해 볼 수도 있고, 일부 결과는 직접 엑셀 등으로 확인해 보는 과정이 필요할 수도 있다. II-3 단계와 II-4 단계는 순환적으로 반복될 수 있다. 즉 처음에 설정된 탐구 질문에 따라 데이터를 분석한 후에, 분석 결과를 보고 세부적으로 또는 다른 관점에서 다시 탐구 질문을 설정하여 분석해 볼 필요가 있을 수 있기 때문이다. II-5 단계(분석 결과 해석)는 분석한 결과를 정리하고 주요 결과를 조직화하여 제시하는 단계이다. 이 단계에서는 먼저 결과를 단순하고 명확하게 기술하는 것이 중요하다. 그리고 탐구의 범위와 성격에 따라 탐구 결과를 기술하는 것으로 마칠 수도 있다. 단, 시간이 확보되거나, 학년이 높은 경우, 또 동아리나 영재반 또는 과학고에서의 R&E와 같은 자율 탐구에서는 탐구 결과를 해석하거나 예측하는 활동까지 수행할 수도 있다.

III 단계(결과 공유 및 성찰 단계)는 2개의 세부 단계로 나뉜다. III-1 단계(결과 발표 및 성찰)는 앞서 언급한 바와 같이 동일 탐구 질문에 대해서도 서로 다른 결과를 얻거나, 인공지능이 잘못 분석하는 경우 이를 비교하면서 탐구 결과를 살펴보기 위한 단계이다. 또한 세부 탐구 질문이 서로 다른 경우에는 이를 공유하면서 서로 결과를 종합해 보는 단계이다. III-2 단계(새로운 탐구 문제 탐색)는 추가로 알아보기 위한 탐구 질문들을 탐색해 보는 단계이다. 오픈 데이터에서 미처 분석해 보지 못한 문제가 무엇인지, 또 확장된 탐구를 위해서는 어떠한 데이터가 더 필요한지 논의해 볼 수 있을 것이다.

위에 제안된 세부 단계는 실제 교수 학습 상황에 따라 생략되거나 변형될 수 있다. 특히 I 단계(사전 준비)는 교사가 학생을 위해 데이터를 미리 추출하고 정리하는 단계로 설정하였지만, 학생들이 오픈 데이터 탐구에 익숙하다면 학생이 직접 포괄적 탐구 문제를 설정하고 오픈 데이터를 추출하여 정리할 수도 있을 것이다.

다음은 협력적 워크숍에 참여한 20명의 교사의 개별 설문과 워크숍 진행 과정에서 논의된 주요 의견을 종합한 것이다. 사전 조사 결과 오픈 데이터 활용 탐구를 지도해 본 경험이 있는 교사는 없었으며 인공지능을 과학 수업에 활용해 본 교사는 2명이 있었는데 데이터 분석 활동에 해당하지는 않았다.

1. 오픈 데이터 활용 과학 탐구에 대한 전반적 의견

사전, 사후 설문 내용 및 전체 토론 과정에서 오픈 데이터 활용 탐구 도입에 대한 전반적인 의견을 살펴보았다. 사전 설문에서 교사들은 이미 오픈 데이터 활용 과학 탐구 도입에 대해 상당히 긍정적인 의견을 가지고 있었다. 즉, 90%의 교사가 도입이 필요하다고 응답했고 10%(2명)의 교사만이 ‘잘 모르겠다’라고 응답했다. 오픈 데이터 활용 과학 탐구가 도입되어야 한다고 생각하는 이유는, ‘대부분 미래 사회를 살아갈 학생들에게 필요한 역량 측면에 도움이 된다’라는 점이었고, ‘실제적인 데이터를 사용하면 학생의 능동적 참여가 가능하다’라는 의견도 있었다. 워크숍에서 탐구활동을 직접 수행한 직후 사후 설문에서는 필요성에 대한 인식이 더 높아졌다. 즉, 오픈 데이터 활용 과학 탐구의 필요성에 대해 더 확신하게 되었다는 응답이 많았다. 사전 설문에서 ‘잘 모르겠다’라고 응답했던 2명의 교사 또한 도입이 필요하다는 긍정적인 의견으로 바뀌었다. 다음은 교사 의견의 예시이다. 설문 내용은 특정 교사를 식별하여 기호로 나타냈지만(T1–T20) 토론 중 제기된 의견은 교사를 식별할 수 없어 별도로 표시하지 않았다.

(오픈 데이터 활용 탐구 도입이) 필요하다고 생각한다. 무에서 유를 창조하는 건 어려운 일이다. 데이터를 만들어 내는 것도 학생들뿐 아니라 일반인에게는 어려운 일이다. 오픈 데이터가 많이 있으니 이 데이터를 활용하여 유의미한 분석을 하고 그것을 통해 다양하고 참신한 아이디어를 얻을 수 있을 것 같아 학생들의 창의성 발전에 도움이 크게 될 것 같고, 인공지능 활용 능력을 신장하여 미래에 필요한 역량을 갖출 수 있을 것 같다. (T18, 사후 설문)

미래 사회에서 데이터 활용이 중요하므로 도입은 필요하고 오픈 데이터 활용의 가치가 충분히 있는 것 같습니다. (토론 중 의견)

학생들이 미래에 다양한 데이터를 분석하고 조직하는 데 도움이 될 것 같습니다. 더불어 과학적 분석력도 향상될 것 같습니다. (T8, 사후 설문)

학생 입장에서 교과서에 제시된 자료만 보는 것보다 직접 자신이 조사하고 분석하는 이런 활동이 훨씬 흥미를 유발할 것 같습니다. (사후 설문, T10)

위의 인용문처럼 교사들은 오픈 데이터 활용 탐구활동이 학생의 창의성 및 미래 역량(T18), 참여와 흥미(T10), 데이터 분석 능력(T8) 등에 도움이 될 것이라 말했다. 이처럼 전반적으로 탐구 도입의 필요성은 대체로 긍정적으로 인식했지만, 우려되는 점을 언급한 교사도 소수(4명) 있었다. 교사들은 먼저 ‘학생들의 인공지능 의존도 심화’에 대한 우려를 표명했다. 그러나 반대로 긍정적인 의견도 있었다. 즉, 탐구활동을 통해 학생의 인공지능 의존도가 심화할 것이라는 우려와 인공지능 활용 능력이 증진에 대한 기대가 공존했다.

AI의 강력한 성능을 제대로 활용하는 방법을 배우기에 좋은 것 같습니다. 다만 AI의 능력이 너무 강력하여 학생들이 고민 없이 AI에게 질문만 던지고 고민하는 과정 없이 AI의 답변을 그대로 복사하는 것에 익숙해질까 봐 조금 염려가 됩니다. (T12, 사후 설문)

학생들이 직접 해석하고 판단하지 않고 인공지능에 의존하게 되는 경우가 우려됩니다. (T14, 사후 설문)

실제 데이터를 AI를 통해 시각적으로 정리하는 과정이 간편하고 도움이 된다. (T9, 사후 설문)

위의 인용문에서 보듯 한 교사의 의견 내에서 인공지능 도입의 필요성과 이에 대한 우려가 공존하기도 했다(T12). 인공지능이 탐구 과정에 유용하고 도움이 된다는 의견(T9)과 학생이 스스로 사고하는 능력이 저하될 것을 우려하는 목소리(T14)가 공존하였다.

다음으로 교사들은 교육과정과 연계가 어려울 수 있음을 우려하였다(2명). 그러나 이 역시 기존 과학 교육과정과 연계가 어려울 것이라는 입장과 반대로 교과 간 융합이 가능하여 긍정적이라는 인식이 공존하였다.

수업의 구체적인 목표를 정하기 어려워 교육과정과 연계하기 어려울 수 있습니다. (토론 중 의견)

매우 즐겁고 흥미로워 프로젝트 및 교과 간 융합으로 활용할 가능성이 높아 재밌었습니다. (T15, 사후 설문)

위의 인용문에 나타난 의견처럼 오픈 데이터 활용 탐구는 교사가 수업의 목표를 교육과정과 연계하여 구체화하기가 어려울 수 있지만, 교육과정을 넘나들며 다양한 융합 탐구나 확장적 탐구로 발전될 가능성이 높다. 워크숍 참여 교사들은 짧은 시간이지만 오픈 데이터 활용 탐구의 가능성과 제한점에 대하여 높은 이해력과 통찰력을 보여 주었다.

2. 개발된 탐구 모형에 대한 의견

다음은 연구자들이 제안한 탐구 모형에 대하여 교사들이 제시한 구체적 의견을 종합한 것이다. 다수의 교사가 아니라도 적어도 2명 이상의 교사가 설문에 적거나 전체 토론에서 제기되었던 의견을 모두 포함하였다.

· 교사의 사전 준비 단계가 어렵다. 교사가 직접 사전에 원하는 데이터를 추출하기 어려우며 학생의 흥미에 맞는 주제를 찾기 어렵다.

· 도입 단계에서 학생이 데이터 활용 탐구의 필요성에 대해 이해하는 게 어려울 수 있다.

· 도입 단계에서 사전기능 연습에 시간이 든다.

· 세부 질문 설정 단계에서 학생의 탐구 질문이 주제를 벗어날 수 있다.

· 데이터 분석 단계에서 인공지능의 분석 결과의 신뢰성을 검토하는 게 어려울 수 있다.

· 전체 탐구활동에 대한 평가가 어렵다.

· 학교에서 유료 인공지능 도구를 활용하기 어렵다.

위의 여러 의견 중 가장 많았던 의견은 교사의 사전 준비 단계에 관한 것이었다. 워크숍에서 교사들이 분석했던 데이터는 연도별, 유형별 에너지 생산량에 관한 것이었는데, 탐구활동 이후 연구자는 오픈 데이터를 어떻게 검색해서 파일로 정리했는지 데이터의 추출과 전처리 과정을 안내하였다. 그러나 많은 교사가 필요한 데이터를 자신이 직접 추출하는 게 어렵다는 의견을 피력했다.

공공데이터 등 제시되어 있는 수많은 데이터 중 내가 정말 궁금하고 원하는 데이터를 찾아내는 데 어려움이 있다. 또 필요한 데이터를 직접 수집하기에는 개인 규모로는 어려움이 있을 것 같습니다. (사후설문 T15)

교수자의 역량이 중요할 것 같다. 교육과정에 맞는 주제 선정, 데이터를 찾고 전처리하는 과정, 예상치 못한 상황이 생길 때 대처 능력 및 컴퓨터 지식 등. 따라서 (탐구) 모형뿐 아니라 수업 내용별로 활용할 데이터를 찾을 수 있는 사이트, 파일, 주제 등도 연구가 많이 되어 배포되면 좋겠다. (사후 설문 T18)

사전에 데이터를 교사가 직접 추출한 후에, 전처리 과정을 통해 데이터를 정리하여 제공해야 하는 것은 대부분 교사에게 큰 부담으로 다가왔다. 교사 개인 수준에서 직접 적절한 데이터를 선별하고 수집이 어려우므로(T15), 수업에 활용할 데이터를 별도의 사이트에서 제공해 주기를 희망하였다(T18).

다음으로 도입 단계에서 예상되는 어려움에 대한 의견이 있었다.

학생들에게 빅데이터를 다루는 과정을 왜 배워야 하는지 동기부여 하는 과정(이 어려울 것이다) (T12, 사후 설문)

도입 단계에서 간단한 기능 연습을 하는 기회가 있어 좋으나 개인별 컴퓨터 활용 능력치가 달라서 수업 시간에 진행되기에는 설계보다 시간이 조금 걸리거나 많이 걸리는 등의 문제가 있을 것 같다. 정보 교과에서 기능을 익혀오면 좋을 것 같다(T18, 사후 설문)

도입 단계에서 학생의 동기 유발을 위해서는 오픈 데이터 탐구의 필요성이나 중요성을 알려주는 것이 필요한데 현재로는 그러한 자료가 제시되지 않았으므로 T12의 의견처럼 교사에게 그 과정이 어려울 수 있다. 또 T18의 의견처럼 학생들의 컴퓨터 활용 능력에 차이가 많은 경우 간단한 것이라도 사전 연습 시간이 문제가 될 것이다.

다음으로 세부 질문 설정 단계에서 학생들의 질문 내용이나 수준, 다양성에 대한 우려가 있었다.

학생들이 좋은 질문을 만들 수 있을까 하는 우려가 있습니다. (T15, 사후설문)

같은 데이터라도 질문에 따라 학생들이 알게 되는 정보가 다르기 때문에, 수업에 적합한지 의문이 든다. (T9, 사후설문)

위의 인용문에서 T15는 학생들의 질문 생성 능력에 대해 우려하고 있으며 T9은 세부 질문의 다양성에 대해 우려하고 있다. 세부 질문을 교사가 제시하지 않고 데이터 탐색 후 학생들이 정하게 되는데 이때 학생이 적절한 질문을 생성하지 못하거나 아예 주제를 벗어나는 질문을 하게 되면 교사는 곤란을 겪게 된다. 또 매우 다양한 세부 질문이 나오고 그에 따라 탐구활동이 너무 다양하게 일어난다면 교사는 수업을 정리하거나 수업의 방향성을 유지하기 어려울 수 있다.

다음으로 탐구 실행 단계에서 인공지능에 의한 분석 결과의 신뢰성을 어떻게 검토할지에 대한 우려가 있었다. 워크숍에서는 참여 교사들이 인공지능에 의한 분석 결과의 신뢰성을 점검하거나 논의하는 과정이 있었다. 예를 들어 매년 전년도에 비해 얼마나 증가하는지 알아보기 위해 ‘연도별 증가율’을 분석하도록 하였는데, 인공지능은 분석자의 의도와 다르게 전년도를 기준으로 증가율을 계산하지 않고, 데이터가 있는 첫 연도를 기준으로 증가율을 계산하는 경우가 있었다. 따라서 이것을 확인하고 프롬프트를 수정하는 과정이 필요했다. 그러나 이러한 과정은 실제 학생에게 지도하기는 어려운 것으로 여겨졌다.

(실행 시 어려운 점은) 데이터 분석의 오류를 확인해야 하는 것 (T17, 사후설문)

정보의 옳고 그름을 학생들이 파악할 수 있을 것인가, 이에 대한 교육은 어떻게 해야 할 것인가 (T19, 사후설문)

인공지능의 오류를 학생들이 확인하는 게 어려울 것이며(T17), 데이터의 신뢰성에 대해 교사가 지도하기도 어려울 것(T19)이라는 의견이다.

마지막으로 전체 탐구활동의 적절한 평가 방안이 필요하다는 의견이 제시되었다.

문제해결 능력이나 과학적 태도 등은 신장할 것 같으나 수행평가가 아닌 교육과정 내로 들어오게 된다면 지필평가에서 평가를 어떻게 해야 할지 고민이 많이 될 것 같다. (T18, 사후설문)

학교 현장에서 평가 방법과 내용은 교수-학습 과정에 많은 영향을 미친다. 실제 평가에 반영되지 않는다고 하면 학생들의 동기가 약해질 수 있고 수행평가로 진행된다면 루브릭이 필요하다. T18은 지필평가의 형태로 탐구활동에 관한 평가가 가능할 수 있을지 우려를 표명하고 있다. 그만큼 학교 현장에서 지필평가가 더 중시되고 있음을 방증하는 의견으로 해석된다.

마지막으로 탐구활동에서 인공지능 도구를 유료로 사용할 수 있는지가 현실적인 한계로 인식되었다.

실제 실행 시 무료 버전으로 해결하기는 어렵고 유료 버전이 필요한 데 이에 대해 적은 예산으로 실천할 수 있을지 우려가 됩니다. (T6, 사후 설문)

유료 프로그램의 사용 유무에 따라 데이터 분석 질적 차이 발생 (T1, 사후 설문)

이것은 실제적인 문제이다. 그러나 현재 인공지능-디지털 교과서를 개발하여 확산하고 있는 시점이므로 앞으로 학교에서 일정 수준 이상의 인공지능 도구를 사용할 가능성은 얼마간 있다고 생각된다.

이 연구에서는 문헌 고찰과 연구자들의 직접 수행 및 성찰을 통해 새로운 과학 탐구 유형으로서 오픈 데이터를 활용한 과학 탐구 모형을 제안하고, 과학 교사들과 함께 탐구활동을 수행해 보면서 그 실천적 가능성을 탐색하였다. 제안된 탐구 모형은 크게 ‘사전 준비’, ‘탐구 실행’, ‘탐구 결과 공유 및 성찰’ 3단계로 구성하였으며, 각 단계는 다시 여러 개의 세부 단계로 구성하였다. 협력적 워크숍에 참여한 교사들은 오픈 데이터 활용 탐구 도입의 필요성에 대해 높은 수준의 긍정적 인식을 보였다.

탐구 모형에 대해 교사들이 제기한 구체적 의견에 기초하여 연구자들은 오픈 데이터 활용 과학 탐구의 실천 및 확산을 위하여 다음과 같은 제언을 하고자 한다.

첫째, 사전 준비 단계는 교사에게 큰 부담이 될 수 있다. 따라서 오픈 데이터 중 과학과 교육과정과 연계될 수 있는 데이터를 탐색하고 추출하여 교사가 활용하기 좋은 형태로 전처리 된 자료가 제공되어야 한다. 과학 교육과정을 분석하고 이와 연계할 수 있는 큰 탐구 질문, 그에 따른 세부 탐구 질문을 목록화하는 후속 연구가 필요하며 과학교육 관련 기관에서 별도 사이트를 통해 제공할 필요가 있다. 교사들은 오픈 데이터 활용 탐구에 대해 상당히 긍정적인 인식을 하고 있으므로 교육과정과 직접 연계할 수 있거나 교육과정을 심화할 수 있는 오픈 데이터를 목록화하여 제공한다면 실천과 확산의 기폭제가 될 수 있을 것이다. 물리교육과 관련된 몇몇 주제의 예를 제안하면 다음과 같다.

성취 기준 [9과14-03] ‘저항의 직렬연결과 병렬연결의 특징을 비교하고, 일상생활에서 전기 에너지가 다양한 형태의 에너지로 전환됨을 소비 전력과 관련지어 설명할 수 있다’와 관련하여 각 지역의 소비 전력 현황에 관한 데이터 활용이 가능하다[25]. 성취 기준 [10통과1-03-04] ‘상호작용이 없을 때 물체가 가속되지 않음을 알고, 충격량과 운동량의 관계를 충돌 관련 안전장치와 스포츠에 적용할 수 있다’와 관련해서는 자동차 안전띠 혹은 카시트 착용 여부에 따른 교통사고 관련 데이터 활용이 가능하다[26]. 성취 기준 [12물리01-06] ‘열이 역학적 에너지로 전환되는 과정의 효율을 정성적으로 이해하고, 영구기관이 불가능함을 사례를 통해 논증할 수 있다’와 관련해서는 자동차 모델별로, 연료, 연비 및 등급 등의 데이터 활용이 가능하다[27]. 성취 기준 [12물리02-06] ‘전자기 유도 현상이 센서, 무선통신, 무선 충전 등 에너지 전달 기술에 적용되어 현대 문명에 미친 영향을 인식할 수 있다’와 관련해서는 지역의 와이파이 사용량에 관한 요일별, 연령대별 데이터 활용이 가능하다[28].

둘째, 탐구 실행 단계와 관련해서 교사들은 학생의 탐구 질문 설정 능력을 우려하였고 다양한 세부 질문으로 인하여 수업 목표가 초점을 잃을 수 있는 점을 우려하였다. 이것은 오픈 데이터 활용 탐구활동의 장점이면서 동시에 제한점이기도 하다. 학생이 직접 탐구 질문을 설정하여 다양한 수업 전개가 가능하지만, 탐구 질문이 주제를 벗어나거나 너무 다양하면 교사가 적절하게 대처하기 어려운 상황이 생길 수 있다. 즉, 제안된 모형은 교사가 이러한 상황을 조정하는 능력을 갖추기를 기대한다. 교사의 전문성은 계획된 시나리오로서 수업 지도안을 재현하는 데 있는 것이 아니며 유동적 교수 학습 상황에서 학생의 수준을 파악하고 즉각적인 피드백을 통해 탐구활동의 방향성을 안내하는 데 있다[29]. 이러한 전문성에는 교사 자신의 과학 탐구 경험이 필요하다. ‘과학 탐구’를 수행하거나 지도하는 것은 풍부한 경험을 통해 형성된 일종의 암묵적 지식이 관여된다. 따라서 교사들이 전문 학습 공동체 활동이나 워크숍 등을 통해 직접 탐구를 수행해 보는 과정이 필요하다. 본 연구에 참여한 교사들이 지적한 것처럼 학생이 세부 질문 설정을 어려워하는 경우, 혹은 주제와 관련 없는 질문인 경우, 교사가 대안적인 세부 질문을 제안하는 게 중요하다. 또 인공지능을 활용한 데이터 분석에 오류가 있는지 확인하는 과정 또한 중요한데 이는 모두 맥락적인 경험과 지식이 필요한 것이다. 따라서 교사 자신이 오픈 데이터 활용 탐구에 어느 정도 익숙한 것이 필요한데 현재는 교사들 또한 오픈 데이터 활용 탐구에 아직 익숙하지 않은 상황이다. 따라서 전문 학습 공동체 활동이나 워크숍 등을 통해 교사 스스로 다양한 세부 탐구 질문을 세워 분석해 봄으로써 학생의 탐구활동을 안내하기 위한 구체적이고 경험적인 지식을 얻을 수 있을 것이다.

셋째, 교사들은 탐구활동에서 학생들이 인공지능에 의존하는 것에 대한 우려를 표명하였다. 교사들이 지적한 바와 같이 학생들은 인공지능의 능동적 활용자가 되어야 하며, 수동적인 의뢰인이 되어서는 안 된다. 인공지능은 탐구의 도구이며 탐구를 수행하는 주체는 학생이다. 이를 위해서는 오픈 데이터 분석 탐구활동에서 인공지능을 사용할 때, 인공지능이 분석자의 의도에 맞게 분석하였는지, 분석 결과에 오류는 없는지, 제시된 정보가 신뢰할 만한지를 판단하는 게 중요하다. 인공지능에 너무 많은 질문을 하기보다는, 제시된 결과를 나름대로 이해하고 판단하여 정리하는 과정이 필요하고, 최종적으로 인공지능이 제시한 정보의 출처를 밝히는 것이 필요하다고 할 수 있다. 이러한 측면의 지도와 안내를 위한 실질적인 방법에 관한 연구가 후속해서 필요하다고 하겠다.

또 인공지능 활용 탐구에 대한 교사들의 우려는 기존 탐구에 비해 학생들이 직접 조작하거나 측정하거나 관찰하는 활동이 적은 데 기인하기도 한다. 과학자의 탐구 방법이 한 가지로 환원될 수 없듯이 학생의 과학 탐구 방법도 한 가지로 환원될 수 없으며 교육 목표와 주제, 상황에 따라 다양한 유형의 탐구활동이 가능하다. 과학 탐구의 핵심은 과학 지식이 증거에 비추어 조사되거나, 수정되거나, 재구성되는 것이다. 따라서 직접 관찰이 필요한 탐구, 변인 통제 실험이 필요한 탐구, 데이터 분석을 중심으로 하는 탐구, 조사 활동을 중심으로 하는 탐구, 모델을 중심으로 한 탐구, 공학적 설계를 중심으로 하는 탐구, 이들을 조합한 문제해결 중심 탐구 등 다양한 탐구활동이 가능하며 오픈 데이터 활용 탐구는 그러한 다양한 탐구 형태의 일환으로 인식될 필요가 있다. 예전에 과학 탐구 활동에서는 학생들이 데이터를 일일이 모눈종이에 점으로 표시하고 이것을 그래프로 그렸다면 요즘은 센서 기반 실험을 통해 자동으로 그래프가 그려지고 학생들은 이에 대한 해석과 토론에 좀 더 많은 시간을 사용할 수 있다. 그래프가 자동으로 그려진다고 해서 학생이 탐구 과정에 더 수동적이라고 단언할 수 없다. 마찬가지로 인공지능 도구를 활용하는 탐구도 이전에 없었던 새로운 도구를 과학 탐구에 더 효과적으로 활용하기 위한 것이라 보아야 하며 학생의 참여가 더 수동적인 것으로 귀결되지는 않는다. 새로운 탐구 도구로써 인공지능 도구를 어떻게 더 생산적으로, 능동적으로 활용할 수 있도록 하는가가 과학교육공동체의 과제가 되어야 한다.

넷째, 오픈 데이터 활용 탐구활동에 관한 수행평가 루브릭이 연구, 개발될 필요가 있다. 평가 루브릭은 단순히 탐구 수행 결과를 점수화하는 총괄 평가 아니라 더 나은 탐구 수행을 위한 피드백을 줄 수 있는 형성적 평가의 성격이 바람직할 것이다.

이 연구는 오픈 데이터를 분석하는 탐구활동의 구체적 모형을 제안하였으며 학생이나 교사가 사용법을 익히기 어려운 프로그램이나 프로그래밍 언어를 사용하였던 기존 연구와 달리 일반 학생 누구나 탐구할 수 있도록 하기 위한 목적으로 접근하였다는 점, 교사와의 협력적 워크숍을 통해 제안된 탐구 모형의 실천적 가능성을 탐색했다는 점에 의의가 있다. 후속 연구를 통해서 탐구 지도 자료가 보완되고 실제 학생의 수행을 모니터한다면 과학교육의 새로운 탐구 유형으로 학교 현장에 확산이 가능할 것으로 기대한다.

  1. G. Zängl, D. Reinert and F. Prill, Grid refinement in ICON v2.6.4, Geosci. Model Dev. 15, 7153 (2022).
    CrossRef
  2. H. Hirvonsalo, CERN Open Data Portal-Improving Usability and User Experience of CMS Open Data Research Tools, CERN-STUDENTS-Note-2015-174 (2015).
  3. R. Ferguson, et al., Innovating Pedagogy 2017 (The Open University, 2017), pp. 1-48.
  4. S. Salimpour, M. T. Fitzgerald, R. Tytler and U. Eriksson, Educational design framework for a web-based interface to visualise authentic cosmological “big data”, in high school J. Sci. Educ. Technol. 30, 732 (2021).
    CrossRef
  5. P. S. Buffum, et al., CS principles goes to middle school: Learning how to teach `Big Data', 2014 March (Proceedings of the 45th ACM Technical Symposium on Computer Science Education pp. 151-156).
    CrossRef
  6. M. Kim and J. Sohn, Development of ‘H-R Diagram’ Teacher Education Program Applying Data Science, Sch. Sci. J. 16, 59 (2024).
    CrossRef
  7. H. N. Yoon and H. Kim, Effects of Instructional Design and Implementation for Big Data Utilization Inquiry Instruction in High School Earth Science Subject, J. Learner-Centered Curric. Instr. 22, 497 (2022).
    CrossRef
  8. J. Park, A Comparative Study of Big Data, Open Data, and My Data, Korea J. Big Data 3, 41 (2018).
    CrossRef
  9. J. Lee and H. Jho, Analysis of Elements Related to Data Literacy Presented in Achievement Standards of 2022 Revised National Curriculum, Brain, Digit. Learn. 14, 85 (2024).
    CrossRef
  10. J. Manyika, et al., Big Data: The Next Frontier for Innovation, Competition, and Productivity (McKinsey Global Institute, 2011), p. 1.
  11. Y.-L. Yu, Analysis of media coverage on 2015 revised curriculum policy using big data analysis, Ph.D. thesis, Seoul National University, 2017.
  12. H.-S. Hwang, Exploring teaching and learning model in elementary social studies using Big Data, Soc. Stud. Educ. 58, 63 (2019).
    CrossRef
  13. P. Russom, Big Data Analytics, TDWI Best Practices Report, Fourth Quarter 19, 1 (2011).
  14. C. M. O'Reilly, et al., Using Large Data Sets for Open-Ended Inquiry in Undergraduate Science Classrooms, BioScience 67, 1052 (2017).
    CrossRef
  15. G. Benz, C. Buhlinger and T. Ludwig, `Big data' in physics education: discovering the stick-slip effect through a high sample rate, Phys. Educ. 57, 045004 (2022).
    CrossRef
  16. O.-S. Shun, Collaborative Inquiry between teachers and researchers, J. Elem. Educ. 11, 329 (1997).
  17. P. Adey, The Professional Development of Teachers: Practice and Theory (Springer Science & Business Media, 2004).
  18. J. R. Baird, P. J. Fensham, R. F. Gunstone and R. T. White, The importance of reflection in improving science teaching and learning, J. Res. Sci. Teach. 28, 163 (1991).
    CrossRef
  19. C. R. Lotter and C. Miller, Improving Inquiry Teaching through Reflection on Practice, Res. Sci. Educ. 47, 913 (2017).
    CrossRef
  20. J. J. Loughran, Effective Reflective Practice: In Search of Meaning in Learning about Teaching, J. Teach. Educ. 53, 33 (2002).
    CrossRef
  21. A. Samaras and L. Roberts, Flying solo: Teachers take charge of their learning through self-study research, Learn. Prof. 32, 42 (2011).
  22. R. W. Bybee, et al., The BSCS 5E Instructional Model: Origins and Effectiveness (BSCS, Colorado Springs, 2006), Vol. 5, pp. 88-98.
  23. T. Schubatzky, B. Bock and C. Haagen-Schützenhöfer, Physics pre-service teachers’ approaches to scientific investigations by data exploration, Eurasia J. Math. Sci. Technol. Educ. 16, 1893 (2020).
    CrossRef
  24. T. Schubatzky and C. Haagen-Schützenhöfer, Online data repositories as educational resources? A learning environment covering formal and informal inferential statistics ideas in scientific inquiry, Eur. J. Phys. 40, 045802 (2019).
    CrossRef
  25. M. M. Kennedy, How Does Professional Development Improve Teaching?, Rev. Educ. Res. 86, 945 (2016).
    CrossRef

Stats or Metrics

Share this article on :

Related articles in NPSM