HyperAI초신경

대규모 언어 모델

대규모 언어 모델(LLM), 대규모 언어 모델로도 알려져 있으며, 인공지능 알고리즘입니다. 많은 수의 매개변수를 갖는 신경망 기술을 적용하고 자기 감독 학습 기술을 사용하여 인간의 언어나 텍스트를 처리하고 이해합니다. 텍스트 생성, 기계 번역, 요약 작성, 텍스트에서 이미지 생성, 기계 인코딩, 챗봇 또는 대화형 AI와 같은 작업은 모두 대규모 언어 모델의 응용 프로그램입니다. 이러한 LLM 모델의 예로는 Open AI의 Chat GPT, Google의 BERT(Bidirectional Encoder Representation of Transformer) 등이 있습니다.

LLM은 규모가 크고, 수십억 개의 매개변수를 통해 언어 데이터에서 복잡한 패턴을 학습하는 것이 특징입니다. 이러한 모델은 종종 Transformers와 같은 딥 러닝 아키텍처를 기반으로 하며, 이를 통해 다양한 NLP 작업에서 뛰어난 성능을 달성할 수 있습니다.

다음 그림은 최근 몇 년간의 대규모 언어 모델의 개발 타임라인을 보여줍니다.노란색으로 강조된 것은 오픈 소스화된 대규모 언어 모델입니다.

참고문헌

https://www.geeksforgeeks.org/large-language-model-llm/?ref=lbp