AI 주간 보고서: Microsoft, Tsinghua University 및 Hong Kong University의 최신 연구는 일반 에이전트, 지리 정보 시스템 및 로봇 공학 분야에서 새로운 혁신을 창출합니다.

特色图像

일반 지능형 에이전트 분야에서 AI는 단일 작업 실행에서 추론, 다중 모드 상호작용, 자율 학습과 같은 종합적인 기능으로 전환되고 있습니다. 그러나 기존의 강화 학습 학습 방법은 에이전트 실행 메커니즘과 밀접하게 결합되어 있고, 마이그레이션이 어렵고, 시스템에 대한 침투성이 매우 높습니다.

Agent Lightning 프레임워크는 이러한 요구에 부응하여 학습과 실행을 완전히 분리했습니다. 사실상 코드 변경 없이 다양한 에이전트 아키텍처를 통합할 수 있습니다. 통합된 인터페이스와 궤적 분해를 통해 복잡한 상호작용을 학습 가능한 데이터로 변환하여 다양한 시나리오에서 유연한 강화 학습(RL) 미세 조정을 지원합니다.

논문 링크:https://go.hyper.ai/se37P

최신 AI 논문:https://hyper.ai/cn/papers

더 많은 사용자에게 학계 인공지능 분야의 최신 동향을 알리기 위해 HyperAI 공식 웹사이트(hyper.ai)에 "최신 논문" 섹션이 개설되었습니다. 이 섹션에서는 매일 최첨단 AI 연구 논문을 업데이트합니다.우리가 추천하는 인기 있는 AI 논문 5편을 소개합니다.동시에, 모든 분들을 위해 논문 구조의 마인드맵도 요약했습니다. 이번 주 AI의 최첨단 성과를 간략하게 살펴보겠습니다⬇️

이번 주 논문 추천

1 에이전트 라이트닝: 강화를 통해 모든 AI 에이전트를 훈련합니다. 학습

본 논문은 모든 AI 에이전트에 대해 강화 학습을 사용하여 대규모 언어 모델을 학습하는 유연하고 확장 가능한 프레임워크인 Agent Lightning을 제안합니다. 강화 학습을 에이전트와 밀접하게 결합하거나 마스크 시퀀스 연결에 의존하는 기존 방식과 달리, Agent Lightning은 에이전트 실행과 학습을 완전히 분리하여 다양한 방식으로 개발된 기존 에이전트와 거의 코드 수정 없이 원활하게 통합됩니다.

논문 링크:https://go.hyper.ai/se37P

모델 아키텍처 다이어그램
종이 마인드맵

2 AlphaEarth Foundations: 정확하고 효율적인 글로벌을 위한 임베딩 필드 모델 

매핑에서 희소 레이블 데이터

본 논문에서는 AlphaEarth Foundations라는 지구 관측 데이터 처리 모델을 소개합니다. 이 모델은 희소하게 주석이 달린 데이터로부터 전 세계 지도와 모니터링 시스템을 효율적이고 정확하게 생성하도록 설계되었습니다. 이 모델은 다양한 출처의 공간적, 시간적, 그리고 측정 데이터 간의 관계를 학습하여 보편적인 지공간적 표현을 생성합니다. 이 모델은 재학습 없이도 다양한 지도 평가 작업에서 기존의 모든 기능화 방법보다 우수한 성능을 발휘합니다.

논문 링크:https://go.hyper.ai/HSPlS

위성 내장 지구 관측 데이터 세트:https://go.hyper.ai/WTpjt

모델 아키텍처 다이어그램
종이 마인드맵

3 Cognitive Kernel-Pro: 심층 연구 에이전트 및 에이전트 기반 모델 교육을 위한 프레임워크

본 논문은 고급 AI 에이전트의 개발 및 평가를 민주화하도록 설계된 완전 오픈 소스이자 대부분 무료인 다중 모듈 지능형 에이전트 프레임워크인 Cognitive Kernel-Pro를 제시합니다. 실험 결과는 Cognitive Kernel-Pro가 오픈 소스 및 무료 에이전트 시스템 중에서 최고 수준의 성능을 달성하여 WebDancer 및 WebSailor와 같은 기존 주요 시스템을 능가함을 보여주며, 접근성이 높고 성능이 우수한 AI 에이전트에 대한 새로운 기준을 제시합니다.

논문 링크:https://go.hyper.ai/HIS8M

CognitiveKernel-Pro-Query 텍스트 생성 벤치마크 데이터 세트:https://go.hyper.ai/ofF3N

모델 아키텍처 다이어그램
종이 마인드맵

4 LLM 기반 에이전트를 통한 인간과 유사한 학습 역학 시뮬레이션

본 논문은 현실적인 교육 환경을 시뮬레이션하도록 설계된 대규모 언어 모델 기반의 새로운 다중 에이전트 프레임워크인 LearnerAgent를 제안합니다. 연구팀은 인간과 유사한 학습의 역학을 탐구하기 위해 심리학적 정보를 기반으로 한 학습자 프로파일을 구축하고, 프로파일이 없는 일반 학습자를 설정하여 기본 LLM의 기본 행동을 테스트했습니다. 연구팀은 주간 지식 습득, 월간 전략 선택, 주기적 테스트, 그리고 동료와의 상호작용을 시뮬레이션하여 1년 동안 학습자의 역동적인 학습 여정을 추적할 수 있었습니다.

논문 링크:https://go.hyper.ai/GbGs2

모델 아키텍처 다이어그램
종이 마인드맵

5 villa-X: 시각-언어-행동 모델에서 잠재 행동 모델링 강화

본 논문은 잠재 행동 모델링 역량을 향상시키고 이를 통해 일반화 가능한 로봇 조작 정책을 학습하도록 설계된 새로운 시각-언어-잠재 행동 프레임워크인 villa-X를 제안합니다. 실험 결과는 villa-X가 SIMPLER 및 LIBERO와 같은 시뮬레이션 환경뿐 아니라 두 가지 실제 로봇 플랫폼에서도 우수한 성능을 달성함을 보여줍니다.

논문 링크:https://go.hyper.ai/8IWxU

모델 아키텍처 다이어그램
종이 마인드맵
AI 주간 보고서: Microsoft, Tsinghua University 및 Hong Kong University의 최신 연구는 일반 에이전트, 지리 정보 시스템 및 로봇 공학 분야에서 새로운 혁신을 창출합니다. | 뉴스 | HyperAI초신경