Discord에서 논의하기

9시간 전

자연어 처리

Fernando Ortega Raúl Lara-Cabrera Jorge Dueñas-Lerín Alejandro de la Torre-Luque Mercé Salvador Robert Enrique Baca-García

초록

정신 건강은 전 세계적 우선순위로 부상했으며, 이는 임상 진단 코딩에서 막대한 행정적 부담을 초래하고 있습니다. 본 연구는 자연어 처리(NLP) 및 머신러닝(ML) 기법을 활용하여 자유 텍스트 설명을 질병의 국제 분류(ICD)에 매핑함으로써 정신과 진단 분석의 자동화를 제안합니다. 145,513건의 스페인어 정신과 설명으로 구성된 전문 데이터셋을 활용하여, 고전적인 빈도 기반 모델(Bag-of-Words, TF-IDF)부터 e5_large, BioLORD, Llama-3-8B와 같은 최첨단 대규모 언어 모델(LLM)에 이르기까지 다양한 텍스트 표현 패러다임을 평가했습니다. 결과에 따르면, 트랜스포머 기반 임베딩은 암묵적 의미 단서와 미묘한 의학 용어를 포착함으로써 전통적인 방법론을 일관되게 상회하는 성능을 보였습니다. 엔드투엔드 파인튜닝을 통해 e5_large 모델은 $F1_{micro}$ 점수 0.866으로 가장 높은 성능을 달성했습니다. 본 연구는 LLM을 특정 임상 명명법에 적응시키는 것이 ``긴 꼬리'' 라벨 분포의 도전 과제와 정신과 담론의 본질적 모호성을 극복하는 데 필수적임을 보여줍니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

9시간 전

자연어 처리

Fernando Ortega Raúl Lara-Cabrera Jorge Dueñas-Lerín Alejandro de la Torre-Luque Mercé Salvador Robert Enrique Baca-García

초록

정신 건강은 전 세계적 우선순위로 부상했으며, 이는 임상 진단 코딩에서 막대한 행정적 부담을 초래하고 있습니다. 본 연구는 자연어 처리(NLP) 및 머신러닝(ML) 기법을 활용하여 자유 텍스트 설명을 질병의 국제 분류(ICD)에 매핑함으로써 정신과 진단 분석의 자동화를 제안합니다. 145,513건의 스페인어 정신과 설명으로 구성된 전문 데이터셋을 활용하여, 고전적인 빈도 기반 모델(Bag-of-Words, TF-IDF)부터 e5_large, BioLORD, Llama-3-8B와 같은 최첨단 대규모 언어 모델(LLM)에 이르기까지 다양한 텍스트 표현 패러다임을 평가했습니다. 결과에 따르면, 트랜스포머 기반 임베딩은 암묵적 의미 단서와 미묘한 의학 용어를 포착함으로써 전통적인 방법론을 일관되게 상회하는 성능을 보였습니다. 엔드투엔드 파인튜닝을 통해 e5_large 모델은 $F1_{micro}$ 점수 0.866으로 가장 높은 성능을 달성했습니다. 본 연구는 LLM을 특정 임상 명명법에 적응시키는 것이 ``긴 꼬리'' 라벨 분포의 도전 과제와 정신과 담론의 본질적 모호성을 극복하는 데 필수적임을 보여줍니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp