HyperAI超神经

마이크로소프트는 오늘 새벽, 최신 혁신 소규모 매개변수 모델인 'Mu'를 공식적으로 출시했습니다. 이 모델은 매개변수가 3억 3천만 개에 불과하지만, 마이크로소프트가 이전에 발표한 Phi-3.5-mini와 맞먹는 성능을 자랑합니다. 더욱 놀라운 점은 Mu가 Phi-3.5-mini의 10분의 1 크기임에도 불구하고, 오프라인 NPU 노트북 장치에서 초당 100토큰 이상의 응답 속도를 제공한다는 것입니다. 이는 소규모 매개변수 모델 분야에서 매우 드문 성취입니다. Mu 모델의 가장 큰 특징 중 하나는 Windows에서 인텔리전트 에이전트를 설정할 수 있다는 것입니다. 사용자는 자연어 명령을 통해 인텔리전트 에이전트를 실시간으로 시스템 조작으로 변환할 수 있습니다. 예를 들어 "마우스 포인터를 좀 더 크게 하고 화면 밝기를 조정해주세요"라는 한 문장으로 인텔리전트 에이전트가 정확히 위치를 파악하여 설정 조정을 한 번에 완료할 수 있습니다. 이 기능은 Windows 시스템의 사용 편의성을 크게 향상시킵니다. Mu 모델의 아키텍처는 마이크로소프트가 이전에 발표한 Phi Silica 모델에서 영감을 얻었으며, 특히 Copilot+ PC와 같은 NPU 장비를 갖춘 장치에서 최적화되어 작동하도록 설계되었습니다. Mu 모델은 디코더만으로 구성된 Transformer 아키텍처를 기반으로 하며, 이에 세 가지 주요 혁신을 소개하였습니다. addition, Mu 모델은 고급 훈련 기술인 예열 안정화 감소 시간표와 Muon 옵티마이저를 사용하여 성능을 더욱 최적화했습니다. 마이크로소프트는 A100 GPU를 사용해 Mu를 훈련시키며, 먼저 수십억 개의 고품질 교육 토큰에서 언어의 문법, 의미론, 그리고 세계 지식을 학습하기 위해 사전 훈련을 수행했습니다. 이어서, Phi 모델에서 지식을 증류하여 매개변수 효율성이 크게 향상되었음을 확인했습니다. 결과적으로, Mu는 Phi-3.5-mini의 10분의 1 매개변수로 유사한 성능을 달성하게 되었습니다. Windows 인텔리전트 에이전트 강화: 저지연과 높은 정밀도의 완벽한 결합 마이크로소프트는 Windows 시스템의 사용 편의성을 향상시키기 위해 자연어를 이해하고 시스템 설정을 원활하게 변경할 수 있는 AI 인텔리전트 에이전트 개발에 주력해왔습니다. 이를 위해 마이크로소프트는 기존 검색 상자에 Mu 모델을 구동하는 인텔리전트 에이전트를 통합하려는 계획을 세웠습니다. 이는 사용자가 다양한 설정에 대해 매우 낮은 지연 시간 내에 응답할 수 있도록 하는 것이 필수적이었습니다. 여러 모델을 테스트한 후, 마이크로소프트는 Mu의 적합한 특성 덕분에 이를 선택하였습니다. 초기 Mu 모델은 미세 조정 없이 정밀도가 50% 감소하였지만, 마이크로소프트는 훈련 규모를 360만 개 샘플(1300배 증가)로 확대하고, 처리 가능한 설정 항목을 약 50개에서 수백 개로 확장하여 이 문제를 해결하였습니다. 이를 위해 자동 라벨링 합성 방법, 메타데이터를 포함한 프롬프트 조정, 다양한 표현 방식, 잡음 주입, 그리고 지능형 샘플링 기술을 도입하였습니다. 이러한 기술을 적용한 결과, Mu를 기반으로 한 설정 인텔리전트 에이전트가 품질 목표를 성공적으로 달성하였습니다. 테스트에서는 Mu 인텔리전트 에이전트가 Windows 설정을 이해하고 실행하는 데 있어 우수한 성능을 보였으며, 응답 시간은 500밀리초 이내로 제어되었습니다. 업계 전문가들은 Mu 모델의 출시를 긍정적으로 평가하며, 이는 AI 모델의 효율성과 성능 사이에서 균형을 이룬 좋은 예라고 말합니다. 마이크로소프트는 계속해서 혁신적인 기술을 개발하며, 특히 사용자 경험 향상을 위한 노력이 두드러지고 있습니다. 이번 Mu 모델의 출시는 마이크로소프트의 이러한 비전을 실현하는 중요한 단계로 볼 수 있습니다.

마이크로소프트, Windows용 AI 스마트 에이전트 Mu 모델 발표

Related Links