Ex) Article Title, Author, Keywords
Ex) Article Title, Author, Keywords
New Phys.: Sae Mulli 2023; 73: 858-865
Published online October 31, 2023 https://doi.org/10.3938/NPSM.73.858
Copyright © New Physics: Sae Mulli.
Jibeom Seo1*, Gahyoun Gim2*, Soobin Kim3, Meesoon Ha3†, Sang Hoon Lee2,4,5‡
1Department of Physics, Sungkyunkwan University, Suwon 16419, Korea
2Department of Physics, Gyeongsang National University, Jinju 52828, Korea
3Department of Physics Education, Chosun University, Gwangju 61452, Korea
4Research Institute of Natural Science, Gyeongsang National University, Jinju 52828, Korea
5Future Convergence Technology Research Institute, Gyeongsang National University, Jinju 52849, Korea
Correspondence to:†msha@chosun.ac.kr
‡lshlj82@gnu.ac.kr
*These authors contributed equally to this work.
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Using a scaling analysis of statistical physics, this study quantitatively reveals the relationship between department and freshman densities by majors in Korean higher education institutions against the regional school-age population density. In particular, we define a scaling exponent that quantifies differences in department and freshman densities in accordance with the differences in the regional school-age population density. We also discuss the regional differences in higher education with the temporal change of the exponent. The scaling exponents of junior colleges are higher than those of universities. Moreover, the scaling exponents of basic natural science, education, and medical–pharmaceutical majors are smaller than those of others. The exponents of freshman density increase over time in all disciplines, implying increasing regional differences in higher education. Finally, the findings can be extended to a more systematic study to plan the coexistence of balanced development with regional communities.
Keywords: Statistical Physics, Complex System, Scaling Relation, Higher Education, Education Disparity
본 연구는 통계물리학의 스케일링 관계 분석을 이용하여, 국내 고등교육기관의 지역별 학령인구밀도에 따른 전공별 학과밀도 및 신입생 밀도의 관계를 정량적으로 보여주고 있다. 특히 학령인구밀도의 차이에 따른 학과밀도 및 신입생밀도의 차이 정도를 나타내는 스케일링 지수를 정의하여, 해당 지수의 시간적 변화에 따른 고등교육기관의 지역별 차이를 논의한다. 스케일링 관계 분석의 결과로 볼 때, 전문대학의 스케일링 지수가 대학교보다 높게 나타났다. 또한 기초자연과학, 교육, 의약 전공의 스케일링 지수가 다른 전공에 비해 작은 것을 관찰할 수 있다. 신입생밀도의 스케일링 지수는 모든 전공분야에서 시간이 지남에 따라 증가함을 보이는데, 이는 고등교육의 지역별 편차가 심화됨을 의미한다. 마지막으로 본 연구결과는 지역사회와 공존하는 균형발전을 계획하는 보다 체계적인 연구로 확장될 수 있음을 제언한다.
Keywords: 통계물리, 복잡계, 스케일링 관계, 고등교육, 교육편차
최근 보도자료[1]에 따르면, 교육부에 제출한 일반대학 학과 통폐합 현황 자료를 분석한 결과, 2019년에서 2021년까지 3년간 700개 학과가 통폐합되었다고 한다. 그중에서 지방대학 학과의 통폐합 사례는 77%(539개)였으며, 기초학문인 인문사회계열과 자연과학계열은 3년간 통폐합 건수가 2배 이상 증가했다. 이러한 지역별, 전공계열별 편차나 경향성 등이 교육통계서비스 데이터[2]의 통계물리학적 분석에서도 과연 정량적으로 나타나는지 확인해 보는 것이 본 논문의 연구목적이라 할 수 있다.
도시별 시설입지 선정 최적화 문제를 다룬 통계물리학 연구 결과[3-5]에 따르면, 시설의 입지 선정에서 중요한 고려사항은 그 시설이 위치하게 될 주변 지역 인구 분포와 시설의 목적이다. 상업시설 입장에서는 방문하는 사람 수를 최대화해야 하고, 시설을 이용하는 개인(또는 공공시설을 관리하는 정부 기관) 입장에서는 가능하다면 방문 거리가 가까운 곳에 시설을 위치해야 한다. 모든 지역에서 이러한 최적화 조건을 고려해서 그것들을 공평하게 조절할 경우에 나타나는 인구밀도에 대한 시설밀도의 수학적 함수 관계가 이미 밝혀진 바 있다[3, 4, 5]. 인구밀도가 높은 지역이 시설밀도도 높기 때문에, 시설밀도와 인구밀도라는 두 가지 변수가 같은 방향으로 움직이는 경향이 있는 정적상관관계(positive correlation)라는 사실은 직관적으로 쉽게 이해할 수 있다. 또한 두 데이터의 상관성이 시간의 흐름이나 외적 변수의 변화에 의해 변화할 수 있다는 것도 주목할 필요가 있다. 일례로, 인터넷 발전에 대한 각 국가의 지역별 분석에 따르면, 인터넷 보급률 증대에 따라 인터넷 라우터가 골고루 분포된다고 한다[5].
흥미롭게도 최적화 목적에 따라 시설밀도와 인구밀도의 상관관계를 나타내는 함수 형태는 서로 다르게 관측되었다. 시설밀도 D와 인구밀도 ρ는 각 시설을 방문하는 사람 수를 지역에 공평하게 만드는 최적화, 상업시설의 목적과 일치한 경우에는
일반적으로는
본 연구에서는 교육통계서비스 데이터[2]를 활용한 스케일링 분석으로 국내고등교육기관의 지역별 학령인구밀도에 따른 전공별 학과밀도와 신입생밀도의 거듭제곱(스케일링) 관계 및 그 거듭제곱 지수를 정량적으로 분석하고자 한다. 또한 전공별 학과 및 신입생의 밀도분포와 해당 기관의 소재지역 학령인구밀도의 스케일링 관계에 대한 시계열 분석을 바탕으로 지역 및 전공계열별 교육편차 여부와 그 경향성을 조사한다. 연구 결과로서, 교육편차 양상이 학제와 전공에 따라 차이가 있음을 확인할 수 있으며 시간에 따른 변화도 관찰할 수 있다. 해당 결과를 바탕으로 한 의미 도출과 제언으로 논문을 마무리하게 될 것이다.
본 연구는 2012년부터 2022년까지 11개 연도의 공시데이터를 활용한다. 학령인구 데이터는 국가통계포털(KOSIS)의 지역별 만 6세부터 17세 인구(이하 학령인구로 통칭) 데이터[6], 학과·신입생 데이터는 교육통계서비스(KESS)의 데이터셋에서 지역별 및 전공계열별로 구분된 학과와 신입생 데이터[2]를 사용한다. 학령인구밀도, 학과밀도, 신입생밀도의 계산식은 Table 1과 같으며, 밀도변수의 단위는 모두 1/km2이다[7]. 여기서 고등교육기관에 관한 학생 데이터로 신입생 데이터을 선정한 이유는, 해당 데이터가 매년 변화하는 학생의 전공 및 지역 선호도를 잘 나타내고 최근에 대두되는 지방대학별 미충원 사태와도 직접적으로 관련될 수 있기 때문이다. 인구 데이터로 전체 인구에 대한 인구밀도가 아닌 학령인구밀도 데이터를 이용한 이유 역시, 현재 고등교육기관 진학 대상인 학생들의 밀도가 가장 유의미하기 때문이며, 특히 미성년 학령인구의 경우는 실제 주소지에 거주하면서 향후 진학에 있어 거주지로부터의 거리를 고려할 가능성이 높기 때문이다[8].
Table 1 Definitions of Densities: School-age population, Department, and Freshman.
Category of Densities | Definitions |
---|---|
School-age population | The population aged 6–17 in a specific region divided by the area |
Department | The number of departments in a specific type of major divided by the area |
Freshman | The number of freshmen in a specific type of major divided by the area |
연구에 사용한 데이터와 데이터 분류기준은 Table 2와 같다. 소재지역은 각 지역 고등교육을 담당하는 지역 교육청의 분할단위인 광역자치단체(특별시·광역시·도)를 기준으로 한다. 초중등교육기관은 대다수의 기초자치단체(시·군·구)에 설립되어 있으나, 고등교육기관(본 연구에서는 대학교, 전문대학, 교육대학을 의미하며, 추후 상세 언급)이 존재하지 않는 기초자치단체는 전체 기초자치단체의 절반 가까이 된다(2022년 기준 226개 중 89개). 따라서 기초자치단체를 기준으로 분석할 경우, 고등교육기관이 존재하지 않는 기초자치단체에 대한 분석에 어려움이 발생하므로 광역자치단체를 소재지역으로 선정한다. 또한 고등교육기관이 소재한 광역자치단체에 교육자원을 공급하고 서비스를 제공하는 영향력을 행사하기에 광역자치단체를 기준으로 소재지역을 선정한다[9].
Table 2 Data classification.
Category | Classification |
---|---|
Region | Gangwon, Gyeonggi, Gyeongnam, Gyeongbuk, Gwangju, Daegu, Daejeon, Busan, Seoul, Sejong, Ulsan, Incheon, Jeonnam, Jeonbuk, Jeju, Chungnam, Chungbuk |
School System | Junior College, University |
Academic Field | Humanities, Social Sciences, Basic Natural Sciences, Applied Natural Sciences, Engineering, Education, Medical Sciences & Pharmacy, Arts & Physical Education |
전공계열 분류 기준은 기본적으로 교육부에서 매년 발간하는 교육통계연보의 대계열 구분을 따른다[10]. 본 연구에서는 학과들을 전공계열 대분류로 `인문(Humanities)', `사회과학(Social Sciences)', `자연과학(기초)(Basic Natural Sciences)', `자연과학(응용)(Applied Natural Sciences)', `공학(Engineering)', `교육(Education)', `의약(Medical Sciences & Pharmacy)', `예체능(Arts & Physical Education)'로 분류한다. 다만 자연과학 전공계열의 경우, 분석 결과 뚜렷하게 다른 경향성을 보이는 중분류(세부전공 특성별) 구분을 추가하여 `수학·물리·천문·지리' 및 `생물·화학·환경'에 해당하면 `자연과학(기초)'계열로, 중계열이 `생활과학' 및 `농림·수산'에 해당할 경우는 `자연과학(응용)계열'로 재분류했다. %전공계열 분류 기준에 대한 전체 정보는 Table 3과 같다.
Table 3 Scaling exponent α and R2 values (in the parentheses) shown for departments and freshmen, divided by school systems and major in 2022. In each row, the largest and the smallest among α values are marked as * and **, respectively.
Majors | Humanities | SocialSciences | Basic Natural Sciences | Applied Natural Sciences | Engineering | Education | Medical Sciences & Pharmacy | Arts & Physical Education | |
---|---|---|---|---|---|---|---|---|---|
Univ. | Dept. | 0.96* (0.78) | 0.83 (0.75) | 0.73 (0.64) | 0.85 (0.78) | 0.82 (0.81) | 0.87 (0.83) | 0.68** (0.50) | 0.86 (0.75) |
Freshman | 1.08* (0.85) | 0.97 (0.84) | 0.80 (0.85) | 1.02 (0.85) | 0.98 (0.86) | 0.90 (0.82) | 0.69** (0.51) | 0.98 (0.79) | |
Junior college | Dept. | 0.99* (0.72) | 0.92 (0.89) | 0.89 (0.78) | 0.87 (0.75) | 0.99 (0.96) | 0.96 (0.90) | 0.68** (0.65) | 0.98 (0.84) |
Freshman | 1.07 (0.61) | 1.00 (0.82) | 0.89 (0.85) | 1.06 (0.86) | 1.11 (0.93) | 1.12* (0.95) | 0.77** (0.74) | 1.06 (0.85) |
덧붙여, 본 연구는 학령인구의 영향을 많이 받는 대학교(University), 전문대학(Junior College)을 분석하고, 학제가 `대학교', `전문대학', `교육대학'(대학과정으로 분류)에 해당하는 학과 데이터를 사용한다. 사이버대학, 원격대학 등을 포함한 다른 학제의 경우에는 해당 학제에 포함되는 대학의 수, 학과 또는 학생 수가 적어 이상치(outlier)에 해당하기에 제외한다. 또한 분석기간 중 폐교되었거나 폐과된 경우의 데이터는 삭제한다.
서론에서 언급한 것과 같이, 본 연구는 인구밀도와 시설밀도의 스케일링 관계가 거듭제곱 꼴에 맞춰 거듭제곱(스케일링) 지수 α를 추정했을 때 그 값이 시설의 종류에 따라 달라진다는 선행연구결과[3, 4, 5]를 이용한다. 선행연구결과에 따르면 보건소나 초등학교 등과 같이 공공시설의 경우에는 α 값이 1 미만의 준선형(sublinear) 관계로 나타났다. 준선형 관계란 각 지역의 공공시설밀도가 인구밀도에 비해 차이가 적다는 것을 나타내며, 이는 사회적 기회비용의 최적 분배 및 사용자(수요자)들의 이동거리의 최적화 및 편의가 고려된 공공시설과 같은 결과를 의미한다. 이와 반대로 이윤을 추구하는 상업시설의 α 값은 대체로 1 근처 또는 1 이상이며, 선형(linear) 또는 초선형(superliner) 스케일링 관계를 따른다. 초선형 관계는 상업시설의 밀도가 인구밀도보다 지역별 차이가 크다는 것을 의미한다. 즉, 같은 면적의 두 지역에서 어떤 한 지역에 인구가 더 많을 때, 두 지역의 인구비율보다 더 크게 인구가 많은 지역에 상업시설이 존재한다는 의미이다.
초선형, 선형, 준선형에 해당하는 거듭제곱 꼴의 관계는 일반적인 선형 축척(linear scale)으로 함수를 나타냈을 때, 각각 아래로 볼록한 형태, 곧은 직선, 위로 볼록한 형태로 나타난다. 하지만 데이터가 어떤 꼴에 더 잘 맞는지를 확인하려면, 가로 및 세로축을 모두 로그 축척(log scale)으로 나타낸 로그-로그 도표로 나타내는 것이 편리하고, 이 연구에서도 알아보기도 쉽고 분석하기도 편한 로그-로그 축척으로 나타낼 것이다.
본 연구에서는 각 지역별 학령인구밀도 ρ를 독립변수로, 학과밀도 Dd와 신입생 밀도 Df를 종속변수로 취급하여, 거듭제곱 꼴
거듭제곱 지수
여기서 아래첨자 i는 Fig. 1와 분석할 때, d (학과밀도의 경우)나 f (신입생밀도의 경우)이다.
앞선 스케일링 관계에서 언급한 바와 같이 Eq. (1)에서 Ci는 로그를 취한 다음 선형모형으로 피팅할 때 y축의 절편에 해당하기 때문에, 거듭제곱 꼴 지수 추정에 필요한 기울기
본 연구에서는, 이 최소자승법 피팅을 위해 python의 numpy 패키지를 사용한다.
학과밀도-학령인구밀도 및 신입생밀도-학령인구밀도의 산포도(scatter plot)와 모형의 예측결과인 선형회귀선은 Fig. 1과 같다. 산포도는 데이터(검은 사각형은 대학교, 빨간 삼각형은 전문대학), 직선(검은 실선은 대학교, 빨간 파선은 전문대학)은 Eq. (1)로 주어지는 선형회귀식에 해당한다. 학과밀도 또는 신입생밀도와 학령인구밀도가 모두 높은 지역이라면 해당 데이터는 도표의 우측 상단에 위치하고, 그 반대의 경우는 좌측 하단에 위치한다. 따라서 우측 상단에 위치한 점은 서울, 부산, 광주, 대전 등에 대응하고, 좌측 하단에 위치한 점은 강원, 경북, 전남 등에 대응한다.
공학계열에서 Eq. (2)로 주어지는 R2 값은 모두 0.8 이상(구체적인 수치는 Table 3 참고)으로 학령인구밀도와 학과밀도, 신입생밀도가 강한 정적상관관계가 성립함을 알 수 있다. 반면에 2022년 대학교 의약계열 학과밀도-학령인구밀도와 신입생밀도-학령인구밀도 관계를 나타내는 Fig. 1(b)에서의 R2 값은 약 0.5(구체적인 수치는 Table 3를 참고)로 두 밀도 간의 연관성이 비교적 약하며, 선형회귀선에서 벗어난 데이터가 많다는 것이 이를 뒷받침한다. 또한 α 값도 0.7 미만(준선형 관계)으로, 대학교 의약계열 학과의 분포가 지역별 인구밀도 분포에 비해 차이가 작다. 이는 대학교 의약계열 학과가 전국적으로 비교적 골고루 분포되어 있음을 나타낸다.
Table 3는 2022년 전공계열별 학과밀도-학령인구밀도와 신입생밀도-학령인구밀도의 선형회귀식의 거듭제곱 지수 α와 결정계수 R2을 정리한 것이다. 먼저, 학과밀도와 신입생밀도에 대한 α 값은 신입생밀도의 α 값이 더 크며, 대학교와 전문대학을 비교하면 두 종속변수 모두 거의 모든 계열에 대해서 전문대학의 α 값이 더 크다. 이는 전문대학이 학령인구밀도에 더 민감하게 영향을 받으며, 지역 간 학령인구밀도에 따른 신입생밀도의 격차 또한 더 크다는 것을 나타낸다.
전공계열별 α 값을 살펴보면, 학과밀도에 대한 α 값은 모두 1 미만으로 준선형 관계였다. 그러나 대학 신입생의 경우에는 자연과학(기초)계열, 교육계열, 의약계열을 제외한 전공계열들의 α 값이 1에 근접하거나 그 이상으로 선형 또는 초선형 관계에 해당하여 지역별 신입생밀도 차이가 학령인구밀도 차이에 더 민감하게 반응하는 것으로 보인다. 그리고 전문대학 신입생의 경우에는 자연과학(기초)계열과 의약계열만이 준선형 관계였다. 준선형 관계에 해당하는 3개의 전공계열들의 경우에는 자연과학(기초)계열은 과학기술원을 포함한 기초과학연구시설이 전국에 위치하여 발생한 결과임을 유추할 수 있으며[11], 교육계열과 의약계열도 전국에 걸쳐 교육대학 및 의과대학이 골고루 분포되어 있고, 또한 다른 전공계열들에 비해 지역에 따른 선호도나 신입생의 선발에 입학성적이 주는 영향이 적기 때문이라고 판단할 수 있다. 마지막으로 교육계열의 신입생밀도에 대한 분석에서는 대학(
학과밀도-학령인구밀도 및 신입생밀도-학령인구밀도 스케일링 관계의 시간에 따른 변화 분석결과는 Fig. 2와 같고, 시간적 변화는 α 값으로 살펴본다. Figure 2의 검은 사각형은 대학교, 빨간 삼각형은 전문대학을 의미한다. 학과밀도-학령인구밀도의 관계는 전공계열과 학제와는 무관하게 대다수의 경우
신입생밀도-학령인구밀도의 관계에서는 교육계열과 의약계열을 제외한 다른 전공계열들에서 α 값이 상승하고 있음을 확인할 수 있다. 특히 인문계열, 공학계열(전문대학), 그리고 교육계열(전문대학)은 초선형 관계로 해당 전공계열이 지역에 따른 신입생 수 격차가 더욱 커지고 있음을 시사한다. 반면에, 자연과학(기초)계열, 교육계열(대학), 의약계열은 α 값의 변화가 적거나 준선형 관계로, 자연과학(기초)계열은 %한국과학기술원(KAIST), 광주과학기술원(GIST), 대구경북과학기술원(DGIST), 울산과학기술원(UNIST) 등을 포함한
III1절에서 언급한 바 있듯이 지방에서의 과학기술특성화대학, 기초과학연구실 신설 및 기초과학 지원으로 해석할 수도 있으며[11], 교육계열과 의약계열은 전국적으로 교육대학 및 의과대학이 고르게 분포되어 있고 정원 또한 유지 관련 규정이 있으므로, 다른 전공계열에 비해 입학정원의 변동 폭이 작기 때문일 것이라고 유추할 수 있다.
본 연구에서는 한국교육학술정보원 교육공공데이터를 통계물리학적 스케일링 분석을 통해 도시역학 시설입지선정 최적화 문제와 연계하여 국내 고등교육기관의 지역별 교육편차를 비교분석하였다. 거듭제곱 꼴이라는 스케일링 관계를 활용하여 정량적으로 분석한 교육관련데이터의 시간에 따른 변화 분석에서 지역별, 전공별 교육편차의 경향성을 확인할 수 있었다.
본 연구결과는 자연과학(기초), 교육, 의약계열을 제외한 타전공들의 신입생밀도는 지역별 학령인구밀도에 많은 영향을 받고 있음을 시사하며, 그중에서도 전문대학 신입생밀도는 그 정도가 더 크다는 사실을 스케일링 지수로 확인하였다. 또한 시간이 지남에 따라 신입생밀도-학령인구밀도 관계에 대한 선형회귀식의 스케일링 지수 α 값이 증가한다는 사실로 최근 대학별 신입생충원 편차와도 연관지어 이해해 볼 수 있었다[12].
이는 자연과학(기초), 교육, 의약계열의 신입생밀도-학령인구밀도의 스케일링 관계식에서 α 값이 다른 전공계열들보다 작다는 분석결과와 관련이 있다. 특히, 교육, 의약 전공계열의 분석결과는 정부가 해당 전공계열의 입학정원을 통제한다는 사실과 관련 있으며, 자연과학(기초) 전공계열의 분석결과는 정부 정책 및 지원 증대와 연관하여 해석할 수 있다.
마지막으로 본 연구의 후속연구를 위해 몇 가지 제언과 함께 요약하면서 논문을 마무리하고자 한다. 첫째, 스케일링 관계를 활용해 양극화/격차 및 편차 등의 분석은 용이하게 할 수 있으나, 단순한 학과 또는 신입생 수의 증감추이 파악에는 어려움이 있음을 인지해야한다. 둘째, 대학의 영향범위를 시/도(광역자치단체) 지역으로 구분하였는데, 실제 대학 진학에서 학생의 시/도 간 이동 패턴이 존재하며[13], 전공계열마다 이동형태가 다를 수 있으므로 이 점도 함께 면밀히 조사해야 한다. 셋째, 단순 데이터에 대한 스케일링 분석을 넘어, 학과분포와 신입생 유치에 영향을 줄 수 있는 추가 요인까지 분석해야 하므로, 이를 적절히 고려한 방사 모형(radiation model)[14]이나 중력 모형(gravity model)[15] 등을 활용한 모형연구의 전산모사(simulation) 결과와 비교분석하여 더 유의미한 결과를 도출할 수 있다. 따라서, 본 연구결과와 연구방법이 지역사회와 상생하는 균형발전을 계획하기 위해 더 체계적으로 확장되거나 다양한 분야들의 데이터 연구의 기초자료로 활용되기를 기대한다.
이 논문은 2023년 교육부 한국교육학회 연차학술대회 한국교육학술정보원 2023년 교육 공공데이터 학술대회 논문발표 [16]를 기반으로 작성되었고, 이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단(NRF)의 지원을 받아 수행된 연구입니다[NRF-2019R1A2C2089463(JS); NRF-2021R1C1C1004132(GG, SHL); NRF-2020R1A2C1007703(SK, MH)].