HyperAI초신경

LFM2-1.2B: 효율적인 에지 배포를 위한 텍스트 생성 모델

1. 튜토리얼 소개

LFM2-1.2B는 Liquid AI가 2025년 7월 10일에 출시한 2세대 Liquid Foundation 모델(LFM)입니다. 하이브리드 아키텍처를 기반으로 하는 생성 AI 모델입니다. 업계에서 가장 빠른 온디바이스 생성 AI 경험을 제공하는 것을 목표로 하며, 저지연 온디바이스 언어 모델 워크로드를 위해 설계되었습니다.

새로운 하이브리드 아키텍처를 사용하는 모델인 LFM2-1.2B는 곱셈 게이팅과 짧은 합성곱을 혁신적으로 결합하고, 16개의 블록(이중 게이팅 단거리 LIV 합성곱 블록 10개와 그룹 쿼리 어텐션 블록 6개)을 포함하여 기존 모델의 처리 효율 및 성능 단점을 해결합니다. 10조 토큰의 사전 학습 코퍼스를 기반으로 학습하며, 지식 증류, 대규모 지도 학습 미세 조정(SFT), 맞춤형 직접 선호 최적화(DPO)와 같은 다단계 학습 전략을 채택합니다. 지식, 수학, 명령어 추종, 다국어 기능 등 여러 벤치마크 범주에서 동일 규모의 모델보다 우수한 성능을 발휘하며, 더 큰 매개변수 규모를 가진 모델과도 경쟁할 수 있습니다. 동시에 CPU 디코딩 및 사전 채우기 속도는 Qwen 3보다 2배 빠르며, 학습 효율은 이전 세대 LFM보다 3배 높습니다. CPU, GPU, NPU 하드웨어에서 효율적으로 실행될 수 있어 에지 장치 배포를 위한 유연하고 효율적인 솔루션을 제공합니다.

이 튜토리얼에서는 데모로 LFM2-1.2B를 사용하고, 컴퓨팅 리소스에는 RTX 4090을 사용합니다. 지원 언어: 영어, 아랍어, 중국어, 프랑스어, 독일어, 일본어, 한국어, 스페인어.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

4. 토론

좋은 프로젝트를 발견하시면 배경 메시지로 추천해 주세요! 또한, 튜토리얼 교환 그룹도 개설했습니다. QR 코드를 스캔하여 [SD 튜토리얼]에 댓글을 남겨주시면 그룹에 참여하여 다양한 기술적인 문제를 논의하고 지원 결과를 공유해 드리겠습니다.↓