npsm 새물리 New Physics : Sae Mulli

pISSN 0374-4914 eISSN 2289-0041
Qrcode

Article

Research Paper

New Phys.: Sae Mulli 2023; 73: 571-576

Published online July 31, 2023 https://doi.org/10.3938/NPSM.73.571

Copyright © New Physics: Sae Mulli.

Feature Selection for Classifying Magnetic Order from Electronic Structure with Strain

변형이 있는 전자 구조로부터 자기 질서 분류를 위한 속성 선택

Yerin Jang1, Ara Go1*, Jeongwoon Hwang2†

1Department of Physics, Chonnam National University, Gwangju 61186, Korea
2Department of Physics Education, Chonnam National University, Gwangju 61186, Korea

Correspondence to:*E-mail: arago@jnu.ac.kr
E-mail: phyjhwang@jnu.ac.kr

Received: May 18, 2023; Revised: June 16, 2023; Accepted: June 17, 2023

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Appropriate feature selection is crucial for optimizing the performance of machine learning models. Herein, we analyzed the influence of feature selection on a supervised learning model designed for magnetic order classification based on the electron–hole excitation spectrum. Initially, the Hamiltonian for the target lattice was obtained using first-principles calculations for the BaOsO3 material. The Hartree–Fock approximation was used to obtain self-consistent solutions for various electron counts, interaction strengths, and antiferromagnetic ordering. The momentum-resolved density of states of the solutions with corresponding antiferromagnetic orders was used to create a dataset for magnetic order classification. We utilized unsupervised learning for data preprocessing to identify features that improve the performance of the magnetic order classifier, with a particular emphasis on examining the effect of introducing lattice distortions on the significance of symmetry in the feature set.

Keywords: Machine learning, Magnetism, Electronic structures, Strain, Hartree-Fock approximation

학습 목표에 적합한 속성 선택은 기계학습모형의 성능을 향상하는 데 중요한 요소이다. 본 논문에서는 전자-홀 들뜸 스펙트럼 기반 자기질서 분류 지도학습 모형에서 속성 선택의 영향을 분석한다. 먼저 제일원리 계산을 통해 BaOsO3 물질을 목표계로 하는 해밀토니안을 추출하고, 하트리-폭 근사를 통해 다양한 전자수와 상호작용 세기, 반강자성 자기질서에 대해 자체모순없는 해를 수집하였다. 하트리-폭 계산 결과의 각 반강자성 자기질서에 대응하는 전자구조로부터 상태밀도 대비 자기질서 자료집합을 구축하여 자기질서 분류기를 위한 지도학습을 수행하였다. 이때 지도학습을 위한 데이터 전처리 과정에 비지도학습을 활용하여 자기질서 분류기의 성능을 향상하는 속성을 규명하되, 특히 격자구조에 변형을 도입하여 공간 대칭성이 속성 중요도에 미치는 영향을 관찰하였다.

Keywords: 기계 학습, 자성, 전자 구조, 변형, 하트리-폭 근사법

최근 기계 학습 알고리듬의 발전으로 정확한 예측과 빠른 분석이 가능해지면서 다양한 물리적 현상을 이해하는데 중요한 도구로 활용되고 있다. 기계 학습의 한 종류인 지도 학습은 입력과 출력 자료를 함께 제공하여 이들간의 관계를 학습하는 방법이며, 주로 회귀와 분류 문제를 해결하는 데 사용한다. 회귀 분석은 연속적인 출력을 예측하며 매개변수 등을 추정한다[1-5]. 분류 분석은 미리 정의된 범주로 출력을 구분하며 실험 자료나 이론적 모사 결과를 물리적 특성이나 과정에 따라 분류할 수 있다[6-8]. 지도 학습 알고리듬인 결정나무 앙상블 기법으로 하트리-폭 근사법(Hartree-Fock approximation)으로 생성된 입방정계 BaOsO3의 상태 밀도를 학습하여 반강자성 자기 질서 분류가 가능함이 알려져있다[9]. 이 물질은 자연상태에서 금속상을 보이지만[10], 높은 대칭성을 가져 다양한 반강자성 질서를 유도할 수 있어 자기질서 분류 모형 연구에 적합하다. 선행 연구에 따르면 국소 상태 밀도(local density of states)에 비해 모멘텀 투영된 상태 밀도(momentum projected density of states)를 이용한 모형의 예측 정확도가 더 우수한데, 이는 속성 선택(feature selection)의 중요성을 보여주는 사례이다. 이처럼 적합한 속성 선택을 통해 기계 학습 모형의 복잡도를 낮추어 성능과 연산 속도를 개선할 수 있는데, 비지도 학습을 통해 최적 속성을 고르는 방법이 알려져 있다. 비지도 학습은 입력 자료만을 제공하여 자료들간의 유사성, 차이, 패턴 등을 파악하는 방법이다. 이를 속성 선택에 이용하면 자료를 군집화(clustering)하여 각 군집을 대표하는 속성을 추출하거나 차원 축소 기법을 통해 기존 속성들을 조합하여 새로운 속성을 만들 수 있다[11-13]. 이 논문에서는 지도 학습의 자료 전처리 과정에 비지도 학습을 활용하여 변형이 있는 BaOsO3의 반강자성 질서 분류 정확도를 높이는 속성을 추출하고 그 결과를 분석한다.

입방정계 BaOsO3는 세 격자 상수 a=b=c=a0로 같다. 격자 변형(strain)이 기계학습에 미치는 영향을 시험하기 위해 단위격자의 부피는 a03으로 유지한 채 두 격자 상수 a=b를 -5%에서 5% 범위에서 1% 간격으로 변화시킨다. 이때 부피를 유지하기 위해 격자 상수 c 또한 변하게 된다. 변형된 격자에 대해 VASP(Vienna Ab initio Simulation Package)에서 구현된 PBE (Perdew–Burke–Ernzerhof) 교환-상관 함수(exchange-correlation functional)와 PAW (Projector Augmented Wave potentials)을 이용하여 제일 원리 계산(first-principles calculation)을 수행한다[14,15]. BaOsO3의 페르미 준위는 Os의 t2g 준위에 놓이는데, 결정장으로 인해 t2g 에너지 띠가 분리되므로 Wannier90을 사용하여 최대로 국소화된 바니에르 함수(maximally-localized Wannier functions)를 통해 꽉묶은 해밀토니안을 추출할 수 있다[16].

추출한 해밀토니안은 t2g 궤도 전자의 건너뜀(hopping) 항으로 표현된다.

H0= ijllσ t ij llc ilσc jlσ,

이때 cilσcilσ는 각각 i번째 위치의 궤도 l에 스핀 σ를 가지는 전자를 생성, 소멸하는 연산자이다.

t2g 궤도 전자간 국소적 이체 상호 작용은 다음 해밀토니안으로 나타낼 수 있다.

Hint=12Uilσnilσnilσ¯+12U2Ji llσnilσnilσ¯+12U3Ji llσnilσnilσ¯+12Ji llσcilσc il σ¯ cil σ¯ cilσ+12Ji llσcilσcil σ¯ c il σ¯ cilσ,

nilσcilσcilσ는 전자수 연산자이고, σ¯σ의 반대 방향 스핀을 의미한다. UJ는 각각 쿨롱 상호작용(Coulomb interaction)과 훈트 결합(Hund's coupling)이다.

전체 해밀토니안은 H=H0+Hint로 기술한다. 반강자성 질서를 가지는 해를 얻기 위해 다음 평균장 근사를 차용하여 하트리-폭 계산을 수행한다.

cjlσcjlσ=12(nl+σmleiqαrj)δjjδllδσσ,

nlml은 각각 궤도 l에서 전자수와 비틀거리는 자화율(staggered magnetization)이다. rjj번째 위치의 위치 벡터이고 qα는 모멘텀 공간에서 스핀의 주기적인 배열을 기술하는 파동 벡터이며 본 연구에서는 α= A, C, G형 반강자성 질서의 스핀 배열을 고려하였다. A형 질서는 스핀이 kx 방향에 대해 반강자성, 나머지 방향에 대해 강자성으로 정렬하며 qA=(π,0,0)로 나타낼 수 있다. C형 질서는 스핀이 kx, ky 방향에 대해 반강자성, 나머지 방향에 대해 강자성으로 정렬하며 qC=(π,π,0)로 나타낼 수 있다. 마지막으로 G형 질서는 스핀이 모든 방향에 대하여 반강자성으로 정렬하며 qG=(π,π,π)로 나타낼 수 있다. 질서별 스핀 배열과 첫번째 브릴루앙 영역(first Brillouin zone)의 변화는 선행연구에서 확인할 수 있다[9].

반강자성 질서와 격자 변형의 영향을 관찰하기 위해 모멘텀 공간의 대칭성 높은 점(high-symmetry point) Γ=(0,0,0), Z=(0,0,πc), S=(πa,πa,0), X=(πa,0,0), U=(πa,0,πc), R=(πa,πa,πc)을 잇는 경로를 따라 에너지 띠 구조(band structure)를 Fig. 1과 같이 그렸다. 이때 t2g 궤도 내 전자 수 N은 4로 두었다. 격자 변형은 건너뜀 진폭에 영향을 주어 전자구조에 변화를 일으킨다. 가령 a/a0>1인 경우 부피를 유지하기 위해 c축 격자상수가 줄어드는데, 이는 해당 방향으로의 건너뜀 진폭을 증가시키므로 Γ-Z 경로의 띠 폭이 Γ-X에 비해 넓어짐을 볼 수 있다. Figure 1에 함께 주어진 상그림은 유형 G 질서에 대한 것으로 공간 대칭성의 변화가 자기질서의 안정화 여부에 미치는 영향을 보여준다. 반강자성 질서 G가 적용된 입방정계 BaOsO3는 입방체 대칭성이 존재하여 각 t2g 궤도가 모두 동일한 개수의 전자를 가지므로 절반 채움(half-filling)에서만 절연체 상태가 된다. 그러나 정방정계 격자에서는 z 방향에 대한 회전 대칭성만 존재하므로 다른 정수 채움에서도 절연체 상태가 가능해진다. Figure 1(b)는 x, y 방향에 비해 z 방향으로 건너뜀이 불리하므로 dyzdzx에 우선적으로 전자를 채워 N=5에서 dxy의 갈라짐에 의해 절연체가 된다. 반면 Fig. 1(c)는 z 방향으로 건너뜀이 유리해 dxy부터 전자가 채워지기 때문에 N=5에서 절연체가 되지 않는다.

Figure 1. (Color online) Typical band structures, orbital projected density of states, and phase diagrams of BaOsO3 Hamiltonian with G-type antiferromagnetic order for (a) a/a0 = 1.00 (unstrained), (b) a/a0 = 0.95, and (c) a/a0 = 1.05. The band energies are computed with U = 2 eV, J = 0 eV, and N = 4. The bands are unfolded to restore the original periodicity, and the size of circles is proportional to the band weights. The phase diagram is colored by staggered magnetization, and the black bars indicate insulating phases.

격자 상수 a에 변형을 -5%에서 5%까지 1% 간격으로 가하여 입방정계 격자 한 개와 정방정계 격자 열 개, 총 11개의 격자를 생성한다. 주어진 격자에 대하여 반강자성 질서 A, C, G를 적용하고 각 질서에 대해 하트리-폭 계산을 수행한다. 이때 N=0.1,0.2,,5.9, U=0,1,,8 eV, J/U=0,0.1,0.2 eV와 같이 변화시켜 주어진 격자와 자기질서에 대한 자료집합은 59×9×3 = 1593개의 변수쌍에 대한 하트리-폭 계산 해로 구성된다. 따라서 11개의 격자계와 3가지 반강자성 질서에 대한 전체 자료집합은 33×1593개이다. 단, 기계 학습 모형의 혼란을 감소시키기 위해 m < 0.1인 결과를 삭제하여 자성 영향이 없는 자료를 배제할 때, 전체 자료집합의 크기는 그보다 다소 작은 33577개가 된다.

자료 가공 방식은 선행 논문과 동일하나 모멘텀이 투영된 상태 밀도를 생성할 때 대칭성 높은 점뿐만 아니라 띠 경로점이 모두 투영된 상태 밀도도 추가로 구성하였다[9]. 이때 띠 경로점의 개수는 대칭성 높은 점들간의 거리에 비례하며 주어지되 전체 점의 개수는 128개이다. 모든 상태 밀도는 -8에서 8까지 128개의 등간격으로 쪼갠 에너지 점에 대하여 계산되었다. 따라서 자료집합을 이루는 견본 하나에 대한 속성 개수는 대칭성 높은 점에 투영된 상태 밀도만 고려할 때 6×128개이고, 전체 띠 경로점 각각에 투영된 상태밀도를 모두 포함할 때에는 128×128개가 된다.

Figure 2. (Color online) First Brillouin zone and feature production for machine learning. (a) First Brillouin zone, where high-symmetry points are marked in red. The red lines indicate the momenta where the features are collected. (b--c) Feature production from the selected momenta. We used 128 energy grids and 128 momenta along the band paths. Three of them are shown in (b) and (c) for visualization purposes.

우리는 먼저 속성 선택의 영향을 확인하기 위해 앞에서 다룬 두 종류의 속성, 즉 대칭성 높은 점에 투영된 상태밀도, 그리고 전체 띠 경로점 각각에 투영된 상태밀도를 이용하여 반강자성 질서의 범주를 분류하기 위한 지도학습을 수행하였다. 학습은 랜덤 포레스트 분류기[17]를 통해 진행하였고, 자료 표본의 70%를 학습에, 30%를 검증에 사용하였다.

Figure 3에 띠 경로점이 투영된 상태 밀도와 대칭성 높은 점이 투영된 상태 밀도를 학습한 랜덤 포레스트 분류기의 혼동행렬(confusion matrix)이 나타나있다. 혼동행렬의 성분 Cαβ = (실제 범주가 α인 표본을 β라고 예측한 자료의 개수)로 정의한다. 혼동행렬의 대각성분은 올바르게 반강자성 질서를 분류한 사례, 비대각성분은 틀리게 예측한 사례를 의미한다. 대칭성 높은 점이 투영된 상태 밀도의 속성 개수가 현저히 적음에도 띠 경로점이 투영된 상태 밀도보다 더 높은 정확도를 보이는 것을 통해 속성 선택의 중요성을 확인할 수 있다.

Figure 3. (Color online) Confusion matrices of Random Forest models trained on: (a--c) spectra at high-symmetry points, (d--f) spectra on the band paths shown in Fig. 2. The strains are (a),(d) a/a0=1.00 (unstrained), (b),(e) a/a0=0.95, and (c),(f) a/a0=1.05. The colors represent the accuracy, calculated as the ratio of the matrix elements to the sum of each row.

우리는 자료 전처리 과정에 비지도학습을 이용한 속성 선택을 추가하여 자성 예측에 중요한 속성들을 분석하고 기계 모형의 정확도를 높이고자 하였다. scikit-learn의 SelectFromModel[17] 모듈을 이용하였으며 이때 추정기(estimator)로 랜덤 포레스트를 사용하여 평균 불순도 감소를 기반으로 가장 판별력이 좋은 속성을 추출하였다.

Figure 4에서 서로 다른 변형을 가진 자료에 대하여 랜덤 포레스트 속성 선택기로 추출된 결과를 확인할 수 있다. 속성 공간에 표시된 점은 속성 선택기에 의해 해당 위치의 스펙트럼 정보가 중요할 가능성이 높다고 판별되었음을 의미한다. 전체 공간에서 중요한 점의 분포는 몇 가지 특징을 보인다. 첫째, 실제 스펙트럼이 존재하는 부분이 중요하다고 판별되었다. 대부분의 모멘텀 영역에서 페르미 준위 부근에 중요한 속성이 다수 분포하는데, 상호작용 없는 극한에서 금속인 BaOsO3의 전자구조를 생각할 때 자연스러운 결과이다. 둘째, 대칭성이 높은 점이 선택된 비율이 높다. 대칭성이 높은 점이 중요하다고 판별되는 비율을 정량적으로 나타내기 위해 전체 띠 경로점 중 대칭성 높은 점 부근의 모멘텀이 선택되는 비율을 조사하였다. 전체 속성 가운데 대칭성이 높은 점이 차지하는 비율은 (6×128)/(128×128) 0.047이고, 선택된 속성 중 대칭성 높은 점의 비율은 평균 243/3546 0.069이어서 선호되는 경향을 보인다. 모멘텀 공간에서 극대점과 극소점이 대칭성 높은 점에서 나타나므로, 다른 모멘텀에 비해 상대적으로 넓은 범위의 에너지 영역에서 0이 아닌 스펙트럼을 가지기 때문으로 추측된다. 대칭성 높은 점과 가장 가까운 점 두 개를 추가로 고려할 때에는 이 비율이 각각 (3×6×128)/(128×128) 0.14, 727/3546 0.21이 되어 격차가 더욱 벌어진다.

Figure 4. (Color online) Features selected by the Random Forest classifier trained on data with strain: (a) a/a0=0.95, (b) a/a0=1.00, and (c) a/a0=1.05. The selected features are focused on the high-symmetry points and the Fermi level.

공간 대칭성에 따라 변형된 전자구조는 속성 선택에도 영향을 미친다. Figure 5는 격자 변형 정도에 따라 전체 속성 중 대칭성 높은 점과 그 주변 모멘텀이 중요한 속성으로 선택될 확률을 보여준다. 입방정계와 정방정계에서 가장 큰 차이를 보이는 점은 Γ와 R인데, 둘 모두 정방정계에서 중요도가 크게 상승하였다. 이 두 점은 입방정계에서는 분류를 위한 유효한 정보를 제공하는 것이 상대적으로 어려운데, 모멘텀의 세 공간 성분이 모두 같기 때문에 반강자성 질서의 유형에 따라 t2g 궤도 중 둘 이상이 같은 에너지를 가지게 되기 때문이다. 특이한 거동을 보이는 다른 모멘텀은 U로, 이 점의 중요도는 낮은 편이지만 a/a0가 증가할수록 상승하는 경향이 관찰되는데, 그 이유는 규명할 수 없었다.

Figure 5. (Color online) The proportion of momentum points selected near high-symmetry points among all momentum points (N<bold>k</bold>/Ntotal) along the band paths.

지도 학습의 자료 전처리 과정에 비지도 학습을 활용하여 변형이 있는 BaOsO3 격자계에서 반강자성 질서 분류 성능을 향상하는 속성을 분석하였다. 하트리-폭 근사를 통해 각 변형과 반강자성 질서에 대해 자료집합을 구성하였으며, 기계학습 수행을 위한 전처리 과정에서 전자구조를 띠 경로점이 투영된 스펙트럼과 대칭성 높은 점에 투영된 스펙트럼 형태로 가공하였다. 우리는 랜덤 포레스트 모형으로 두 가지 다른 속성에 대한 기계학습 모형의 성능을 검증하여, 중요한 정보만 선별할 경우 현저히 적은 수의 속성으로 같은 정확도를 구현할 수 있음을 보였다. 나아가 비지도학습을 통한 속성 선택을 통해 격자계의 공간대칭성이 변함에 따라 중요한 속성에 차이가 있는지를 관찰하였다.

선택된 속성은 에너지 값으로는 페르미 준위 부근, 모멘텀 기준으로는 대칭성이 높은 점 근처에서 높은 분포를 보인다. 실제 물리적 직관에 기반을 두고 스펙트럼을 분석하여 반강자성 질서를 분류코자 할 때 페르미 준위에서의 띠 에너지 구조와 대칭성이 높은 모멘텀에서의 띠 에너지 준위를 관찰하는 것이 일반적이다. 따라서 속성 선택 알고리듬이 이러한 속성을 선택하는 것이 물리적으로 새로운 발견은 아니다. 그러나 다른 정보가 주어지지 않은 상태에서 단순 비지도학습을 수행하였을 때 실제 물리적으로 중요한 속성이 선택되었다는 점에 기대어, 직관에 의지하기 어려운 복잡한 계에 대해서도 이러한 방식의 속성 선택을 통해 효율적인 기계학습이 가능할 것이라 예상할 수 있다. 따라서 결정 나무 알고리듬을 이용하여 자성 분류 모형 학습을 수행한다면 페르미 준위 부근과 대칭성 높은 점을 중심으로 스펙트럼 자료를 수집하는 것이 바람직할 것이다. 다만 이 연구 결과에 따르면 대칭성에 따라 중요한 속성이 달라질 수 있으므로 다양한 대칭성과 구조에 대한 후속 연구가 필요하다.

본 연구는 한국연구재단의 지원을 받아 수행된 연구입니다(No. NRF-2021R1C1C1010429).

  1. L. B. Oftelie et al, npj Comput. Mater. 4, 74 (2018).
    CrossRef
  2. V. Stanev et al, npj Comput. Mater. 4, 29 (2018).
    CrossRef
  3. J. Nelson and S. Sanvito, Phys. Rev. Mater. 3, 104405 (2019).
    CrossRef
  4. N. C. Frey et al, Sci. Adv. 6, 1076 (2020).
    Pubmed KoreaMed CrossRef
  5. D. Lee et al, J. Phys. Chem. Lett. 12, 6211 (2021).
    Pubmed CrossRef
  6. G. A. Landrum and H. Genin, J. Solid State Chem. 176, 587 (2003).
    CrossRef
  7. C. M. Acosta et al, ACS Appl. Mater. Interfaces 14, 9418 (2022).
    Pubmed CrossRef
  8. S. Tibaldi et al, SciPost Phys. 14, 005 (2023).
    CrossRef
  9. Y. Jang et al, arXiv:2302.13329 (2023).
    CrossRef
  10. M.-C. Jung and K.-W. Lee, Phys. Rev. B 90, 045120 (2014).
    CrossRef
  11. G. Pilania et al, Sci. Rep. 6, 19375 (2016).
    Pubmed KoreaMed CrossRef
  12. L. Ward et al, npj Comput. Mater. 2, 16028 (2016).
    CrossRef
  13. P. V. Balachandran et al, in Materials Discovery and Design. (Springer International Publishing, 2018), pp. 59-79.
    CrossRef
  14. G. Kresse and J. Furthmüller, Phys. Rev. B 54, 11169 (1996).
    Pubmed CrossRef
  15. G. Kresse and D. Joubert, Phys. Rev. B 59, 1758 (1999).
    CrossRef
  16. A. A. Mostofi et al, Comput. Phys. Commun. 185, 2309 (2014).
    CrossRef
  17. F. Pedregosa et al, J. Mach. Learn. Res. 12, 2825 (2011). https://www.jmlr.org/papers/v12/pedregosa11a.html.

Stats or Metrics

Share this article on :

Related articles in NPSM