판링: 박사과정 공부는 고난과 기쁨이 공존하는 여정입니다.

올해 IJCAI-SAIA YES 컨퍼런스의 젊은 저자 원탁 포럼은 상하이 교통대학교 컴퓨터 과학 및 공학과의 얀 준치 부교수가 주최했으며, IJCAI 2020에서 선정한 논문의 첫 번째 저자 6명이 초대되었습니다.
그 중에서도 판령은 모든 사람의 주목을 받는 인물이 되었다.
4년 연속 전공 1등
판링은 이 세션에서 유일한 여성이라는 점뿐만 아니라, 그녀의 과거 학업 성취로 인해 주목을 받았습니다.

2013년, 판링은 중산대학 데이터 과학 및 컴퓨터 과학부에 입학하여 소프트웨어 공학을 전공했습니다.저는 대학 재학 시절 4년 연속 1위(전체 435명 중)를 차지하였고, 3년 연속 국가장학금을 받았습니다.
그녀는 3학년 2학기에 청화대학교 학제간정보과학원에 합격하여 황룽보 부교수의 지도를 받으며 직접 박사학위를 취득할 기회를 얻었습니다.
팬 링은 박사 학위를 마친 후 Microsoft Research Asia의 머신 러닝 그룹에서 인턴으로 일했고 옥스퍼드 대학의 시몬 화이트슨 교수 연구 그룹을 방문했습니다.그는 마이크로소프트 장학금, 청화대학교 1등 장학금, 학제간 정보과학원 1등 장학금 등을 수상했습니다.
과학 연구의 길에서 선택은 끈기보다 더 중요합니다.
현재 팬 링은 심층 강화 학습, 다중 에이전트 시스템, 계산적 지속 가능성 분야의 과학 연구에 집중하고 있습니다.
지금까지 그녀는 NeurIPS, AAAI, IJCAI, AAMAS 등 주요 학회에 포함된 여러 편의 첫 번째 저자 논문을 발표했습니다. 그중 그녀의 논문은 AAMAS 2020(구 5%)에 게재되었으며, JAAMAS의 신속 심사 채널에 제출되도록 초대되었습니다. 또한, 팬 링은 최근 몇 년 동안 ICML, NeurIPS, ICLR 등의 학회에서 리뷰어로 활동했습니다.

이러한 영예를 받기 전에 판링은 컴퓨터 과학의 길을 계속 가야 할지 고민했습니다.
팬링은 대학에 진학하기 전 경제학과 경영학 전공에 관심이 많았지만 우연히 중산대학 데이터 과학 및 컴퓨터 과학 학부에 입학했습니다.
2학년 2학기 때 그녀는 컴퓨터공학을 계속 공부할지 말지 여전히 망설이고 있었고, 심지어 전공 변경 시험도 준비하고 있었습니다. 저는 선생님과 심도 있는 토론을 하고, 깊은 개인적 성찰을 한 후에야 제 전공과 미래에 대한 새로운 이해를 얻었습니다.또한 이를 통해 그녀는 컴퓨터 과학을 계속 공부하겠다는 결심을 더욱 굳건히 했습니다.
2016년에 알파고는 바둑의 왕 이세돌을 4:1로 이겼습니다. 이 전투는 전 세계를 충격에 빠뜨렸고, 심층 강화 학습이 모든 사람에게 알려지게 되었습니다.
같은 해, 당시 대학 3학년이던 판링은 대학원에 입학하기 위해 학교를 선택하는 단계에 들어갔습니다. 그녀는 박사학위를 위해 직접 공부하기로 결정했습니다. 청화대학교 학제간 정보과학 연구소에서.
지도교수인 황룽보 부교수의 제안으로 판링은 처음으로 강화 학습에 관한 논문을 읽었습니다.
팬 링은 강화 학습에 대한 그녀의 이해에 대해 이야기했습니다.그녀는 강화 학습을 통해 실제 생활에서 타이밍 문제에 대한 다양한 시나리오를 모델링하고 학습할 수 있다고 믿습니다.
예를 들어, 우리가 어렸을 때 걷는 법을 배웠던 것이 매우 전형적인 예입니다. 다양한 상황에서 우리는 보상을 받기 위해, 즉 넘어지지 않고 성공적으로 걷기 위해 어떤 행동을 취해야 하는지 알아야 합니다.
강화 학습은 실제 문제를 해결하기 위한 매우 일반적인 프레임워크입니다.따라서 판링은 강화 학습이 큰 응용 가치를 가지고 있으며, 탐구할 가치가 있는 분야가 많이 있다고 믿습니다.
논문이 5번이나 거절당했어요? 정신을 잃지 마세요
팬 링은 과학 연구를 하는 동안 논문이 여러 번 거부되는 상황을 겪었습니다. IJCAI 2020에서팬 링의 첫 번째 저자 논문인 "동적 볼츠만 소프트맥스 업데이트를 통한 강화 학습"은 5번이나 거절당했지만 마침내 선정되었습니다(승인율은 12.6%였습니다).

https://www.ijcai.org/Proceedings/2020/0276.pdf
판링에 따르면, 이 논문의 연구 방향은 강화 학습에서 중요한 과제인 가치 함수 추정의 정확성을 연구하는 것입니다. 논문의 조사와 작성 과정은 순조롭게 진행되었지만, 논문이 완성된 후에는 계속해서 거절당했고, 계속해서 수정해야 했습니다.마침내 논문이 포함되기까지 거의 2년이 걸렸습니다.
제안서와 초안을 순조롭게 시작했지만, 검토와 수정 과정이 길었기 때문에 판링에게는 큰 공백이 생겼고, 이를 통해 그녀는 숙고할 시간을 가질 수 있었습니다.
과학 연구에서 '주제의 충돌'이라는 문제에 대해, 그녀는 한편으로는 연구 방향에 대한 보다 세부적인 연구가 필요하다고 생각하지만, 주제의 충돌이 불가피하다면 낙담할 필요는 없다고 말한다.주제가 겹치는 이유는 이 연구 방향이 더 많은 사람들에게 알려져 있고, 인기 있는 방향일수록 더 가치 있는 응용 프로그램을 만들어낼 수 있기 때문입니다.
모든 문제에는 다양한 해결책이 있습니다.우리는 이전 방법들을 더욱 자세히 비교하고 혁신적이고 영향력 있는 접근 방식을 찾아야 합니다.
사회 전반에 걸쳐 뜨거운 논쟁이 벌어지고 있는 '퇴행' 현상에 직면하여, 판링 역시 자신의 견해를 밝혔다. 오늘날의 학문적 분위기에서는 사람마다 출판물의 양과 질에 대한 추구가 다릅니다.
판링은 학업의 길을 계속 가기 위해 자신에게 명확한 학업적 질적 요구 사항을 요구했습니다. 그녀는 다른 사람들과 너무 많은 비교를 하지는 않겠지만, 강화 학습이 진정으로 성공할 수 있도록 강화 학습에 대한 더욱 가치 있는 탐구를 하기를 바라고 있습니다.
선배의 팁
젊은 학자들이 가져야 할 자질이 무엇인지 물었을 때, 판링은 엄격함과 책임감을 강조했습니다.그녀는 과학 연구에는 절대적인 엄격성과 전문성이 필요하다고 믿으며, 자신이 완료한 작업에 대한 책임을 져야 합니다.
학업은 쉬운 길이 아니다. 처음에는 큰 야망을 품고 무언가를 성취하고 싶어 할지 몰라도, 그 과정은 우리가 상상했던 것만큼 쉽지 않을 것입니다.
원고가 거절당하거나 막혔을 때, 압박감에 낙담하지 마세요. 동시에 유혹에 직면했을 때 우리는 원래의 학문적 열망을 고수할 수 있습니다.가장 중요한 네 단어는 '포기하지 마라'입니다.

박사과정 학생 학술 포럼 및 학술 보고서
판링은 트위터를 통해 자신의 분야에서 큰 이름을 가진 사람들의 발전 상황을 직접 지켜보곤 했습니다.강화 학습의 새로운 개발에 대한 최신 업데이트를 받아보세요. 동시에, 스트레스를 해소하고 몸과 마음의 균형을 맞추기 위해 파멜라의 영상을 따라 운동할 거예요.
인터뷰가 끝나고,판링은 자신이 항상 마블 영화를 좋아했다고 말했습니다.모든 영화에서 슈퍼히어로는 엄청난 고난을 겪지만, 결국에는 항상 상황을 역전시켜 세상을 구합니다.
판링이 박사과정을 공부하는 동안 자신감과 열정, 끈기를 유지하고, 미래의 학업의 길을 확고하고 자신 있게 걸어갈 수 있도록 격려해 준 것은 바로 용감하고 강인한 마블 영웅들이었습니다.
