기말고사는 아직 안 왔지만, 알고리즘에 따르면 물리학은 꼭 떨어질 것 같다.

대학 물리학은 과학과 공학을 전공하는 학생들에게는 기본 필수 과목이지만, 매우 어렵기 때문에 많은 학생들이 낙담합니다. 연구진은 AI 알고리즘을 사용하여 물리 수업에서 낙제할 위험이 있는 학생을 예측하는 방안을 제안했습니다. 이를 통해 교사가 수업 지도를 보다 효과적으로 제공하고 교육 자원의 배분을 조정할 수 있게 됩니다.
알고리즘의 예측 능력은 점점 더 강력해지고 있다는 점을 언급해야겠습니다. 부부가 다툴지 예측하는 것부터 지진이나 홍수 등이 언제 발생할지 예측하는 것까지 말입니다.
알고리즘을 이용하면 이제 물리학 수업에서 낙제할지 여부도 예측할 수 있습니다.
이는 웨스트버지니아 대학과 캘리포니아 공과대학의 학자들이 arxiv.org에 발표한 최근 연구입니다.

그들은 흥미로운 논문을 발표했습니다."물리학 수업에서 가장 위험에 처한 학생을 식별하기 위한 머신 러닝 활용"
이 논문에서는 기계 학습 알고리즘을 통해 기초 물리학 과목을 수강하는 학생들의 졸업 성적을 평가할 수 있다고 주장합니다. 예측 모델은 학생을 A, B, C, D, F, W(중단) 등급으로 분류합니다.
참고사항: 미국 대부분의 대학에서 채택한 평가 등급과 백분율 점수는 대략 다음과 같습니다: A: 90+; B: 80+; C: 70+; D: 60+; F: 실패; W: Withdrawal (Withdrawal의 약자).
예상 결과: 알람을 울리면 여전히 저장할 수 있습니다.
대학 물리학에 지배당했던 공포를 기억하시나요?
많은 과학 및 공학 전공 학생들에게 대학 물리학은 고급 수학만큼이나 어렵고 가장 두려운 과목 중 하나입니다.
외국의 한 연구에 따르면 한때 공학과 과학(STEM)을 전공했지만 결국 전공을 바꾸거나 학위를 취득하지 못한 학생들 중그들 중 절반은 물리학이나 수학과 같은 전공 과목이 너무 어려워서 그렇게 했습니다.

STEM 학생, 특히 기초 학문 분야의 학생 중도 포기율은 해마다 증가하고 있습니다. 동시에, 이들에 대한 사회적 수요는 여전히 높아서 상당한 인재 격차가 발생합니다.
따라서 웨스트버지니아 대학과 캘리포니아 공과대학의 연구자들은AI 알고리즘을 사용해 이 학생들을 구해보자.
그들은 머신 러닝 알고리즘을 사용하면 과목에서 낙제할 위험이 있는 학생을 식별할 수 있다고 믿습니다. 이런 방식으로 교사는 예측 결과에 따라 타겟팅된 지도를 제공하여 학생의 합격률을 높이고 시기적절하게 지식 습득 정도를 파악할 수 있습니다.
알고리즘: 과거 성과를 참조하여 미래 결과를 예측합니다.
샘플 추출
연구진은 두 대학의 3개 샘플을 사용하여 학생 성취도를 예측하는 AI 알고리즘을 훈련시켰습니다.
샘플 데이터에는 다음이 포함됩니다.학생들의 ACT(미국 대학 입학 시험) 점수, 대학 GPA, 물리학 수업에서 수집한 데이터(숙제 성적, 시험 점수 등)입니다.
그 중 샘플 1과 샘플 2는 미국 동부에 있는 대학에서 물리 과학과 공학을 전공하는 학생들에게서 나왔습니다.
샘플 1:2000년부터 2018년까지 대학 물리학 1 과정을 이수한 모든 학생이 포함되었으며, 표본 크기는 7,184명입니다.
샘플 2: 이 데이터는 2016년 가을부터 2019년 봄 학기를 다루며, 표본 크기는 1,683명의 학생입니다. 샘플에는 평균 질문 수, 숙제 평균 성적, 학기말 시험 점수 등의 교실 성과 데이터가 포함되어 있습니다.
샘플 3:이 데이터는 2017년 학년 전체의 입문 기계학 과정에서 얻은 것입니다. 샘플 3은 미국 서부에 위치한 다른 대학에서 수집되었습니다.
변하기 쉬운
이 연구에 사용된 변인들은 모두 대학과 학급 내에서 발견된 변인들입니다. 동시에 성별, 민족 등의 인구통계학적 정보도 포함됩니다.

랜덤 포레스트 알고리즘 예측
연구에서는랜덤 포레스트 머신 러닝 알고리즘을 사용하여 입문 물리학 과정에서 학생들의 최종 성적을 예측했습니다.이 알고리즘은 최종적으로 학생들을 A, B 또는 C를 받은 학생(ABC 학생으로 분류)과 D, F 또는 W를 받은 학생(DFW 잠재적 낙제 학생으로 분류)으로 구분합니다.
알고리즘의 성능을 파악하기 위해 데이터 세트를 테스트 데이터 세트와 학습 데이터 세트로 나누었습니다. 학습 데이터 세트는 분류기를 학습시키기 위한 분류 모델을 개발하는 데 사용됩니다.
테스트 데이터 세트는 모델 성능을 특성화하는 데 사용됩니다.
분류 모델이 테스트 데이터 세트에 있는 각 학생의 테스트 결과를 예측한 후, 예측 결과를 실제 결과와 비교합니다.
결과: 어색함, 정확도 57 %
연구진은 모델을 조정하고 검증한 후 예측 결과를 얻었지만 정확도는 그다지 낙관적이지 않습니다...

그들은 전체 샘플에 대한 예측 결과에서 다음과 같은 점을 지적했습니다.여성과 소수 민족 학생이 더 많은 표본의 경우 DFW 정확도는 낮습니다.그들은 이를 위해서는 인구 통계에 따른 모델 조정이 필요하다고 지적합니다.
첫 번째 샘플에서훈련된 알고리즘은 16%의 정확도로 "DFW 유형 학생"만을 예측합니다.연구자들은 이것이 훈련 세트에서 DFW 점수를 받은 학생의 비율이 낮기 때문일 수 있다고 분석했습니다(12%).
샘플 1에서,해당 모델의 가장 좋은 성능은 57%에 불과했는데, 이는 무작위 확률보다 약간 더 나은 수준일 뿐입니다.
결과의 정확도가 낮고 모델에 대한 논란이 있습니다.
이러한 결과를 바탕으로, 연구팀은 이러한 유형의 머신 러닝 분류 모델이 학습에 어려움을 겪고 있는 교육자와 학생들에게 강력한 도구가 될 수 있다고 믿고 있습니다.이를 통해 교육 개입과 교육 자원의 배분을 보다 효과적으로 안내할 수 있습니다.
네티즌: 그런데... 57%는 좀 낮은 거 아닌가요?
그러나 일부 비평가들은 다음과 같이 믿습니다.이러한 기술은 학생들에게 해를 끼칠 수 있는 편향되거나 오해의 소지가 있는 예측으로 이어질 수 있습니다.
연구에 따르면, 대규모 코퍼스를 사용하여 학습한 경우에도 인공지능은 복잡한 결과를 예측하는 데 여전히 편향 문제가 있을 수 있다는 사실이 지속적으로 입증되었습니다.
이전에는 Amazon의 내부 AI 채용 도구가 여성에 대한 편견을 보여 비활성화되었습니다.
따라서 사람들은 이러한 성적 예측 알고리즘이 STEM 학생들의 유지율을 높이는 데 실패할 뿐만 아니라 불평등을 심화시킬 것이라는 우려도 가지고 있습니다.
물론, 모든 결과는 단지 예측일 뿐입니다. 시험에 있어서 30%는 운명에 달려 있고, 70%는 노력에 달려 있으며, 나머지 90%는 선생님의 기분에 달려 있습니다.
-- 위에--