AI 논문 주간 보고서 | NVIDIA 오픈 소스 모델 / OpenAI 벤치마크 / 에이전트 시스템 / 장기 컨텍스트 추론... AI 업데이트 간략 요약

7달 전

대규모 언어 모델(LLM)은 추천 시스템을 암묵적인 행동 패턴 매칭에서 명시적인 의도 추론으로 전환하는 데 상당한 잠재력을 보여주었습니다. RecGPT-V1은 LLM 기반 추론을 사용자 관심사 분석 및 아이템 태그 예측에 통합하여 이러한 패러다임을 성공적으로 개척했지만, 네 가지 근본적인 한계점을 가지고 있습니다.

* 낮은 계산 효율성과 여러 추론 경로에 걸친 인지적 중복성;

* 고정 템플릿 생성 시 해석 가능성이 불충분함;

* 지도 학습 패러다임 내에서의 적용 가능성이 제한적입니다.

단순하고 결과 중심적인 평가는 인간적인 기준을 충족시키지 못한다.

기존의 한계를 극복하기 위해 알리바바 연구팀은 최신 버전인 RecGPT-V2를 출시했습니다. 이번 버전에는 네 가지 핵심 혁신 기술이 포함되어 있습니다.

계층적 다중 에이전트 시스템을 구축합니다.

메타 프롬프팅 프레임워크를 제안합니다.

* 제약 조건 기반 강화 학습 메커니즘을 도입합니다.

* 에이전트를 심사위원으로 하는 평가 프레임워크를 설계하십시오.

RecGPT-V2는 대규모 언어 모델 기반 의도 추론의 기술적 타당성을 검증했을 뿐만 아니라 대규모 산업 시나리오에서의 상업적 타당성까지 입증하여 인지적 탐구와 산업 응용 사이의 간극을 성공적으로 메웠습니다.

논문 링크:https://go.hyper.ai/wftNU

최신 AI 논문:https://go.hyper.ai/hzChC

더 많은 사용자에게 학계 인공지능 분야의 최신 동향을 알리기 위해 HyperAI 공식 웹사이트(hyper.ai)에 "최신 논문" 섹션이 개설되었습니다. 이 섹션에서는 매일 최첨단 AI 연구 논문을 업데이트합니다.우리가 추천하는 인기 있는 AI 논문 5편을 소개합니다.이번 주 최첨단 AI 성과를 간략히 살펴보겠습니다⬇️

이번 주 논문 추천

1. Nemotron 3 Nano: 에이전트 추론을 위한 개방적이고 효율적인 전문가 혼합형 하이브리드 Mamba-Transformer 모델

본 논문에서는 Mixture-of-Experts 아키텍처 기반의 하이브리드 Mamba-Transformer 언어 모델인 Nemotron 3 Nano 30B-A3B를 소개합니다. Nemotron 3 Nano는 Nemotron 2에 비해 3조 개 이상의 고유 태그가 추가된 25조 개의 텍스트 태그를 사용하여 사전 학습되었으며, 이후 지도 미세 조정과 다양한 환경에서의 대규모 강화 학습을 거쳤습니다. 이 모델은 에이전트의 행동, 추론 능력 및 대화 상호작용을 크게 향상시키며, 최대 100만 개의 태그로 구성된 컨텍스트를 지원합니다.

논문 링크:https://go.hyper.ai/LtmY3

2. 첨단 과학

본 논문에서는 전문가 수준의 과학적 추론 능력에 대한 인공지능의 성능을 평가하기 위한 벤치마크 테스트인 FrontierScience를 제안합니다. FrontierScience는 두 가지 트랙으로 구성됩니다. (1) 국제 올림피아드(IPhO, IChO 및 IBO)의 문제를 다루는 올림피아드 트랙, (2) 과학 연구의 전형적인 하위 문제를 나타내는 박사 수준의 개방형 문제를 포함하는 연구 트랙입니다.

논문 링크:https://go.hyper.ai/XanPc

3. AutoGLM: GUI를 위한 자율 기반 에이전트

본 논문에서는 그래픽 사용자 인터페이스(GUI)를 통해 디지털 기기의 자율 제어를 가능하게 하는 기반 에이전트로 설계된 ChatGLM 제품군의 새로운 시리즈인 AutoGLM을 제안합니다. 연구팀은 웹 브라우저와 모바일 폰을 대표적인 GUI 시나리오로 활용하여 AutoGLM을 구축하고, 실제 환경에서의 GUI 상호작용을 위한 실용적인 기반 에이전트 시스템을 구현했습니다.

논문 링크:https://go.hyper.ai/SLjro

4. RecGPT-V2 기술 보고서

본 논문에서는 네 가지 핵심 혁신을 포함하는 RecGPT-V2를 제안합니다. 첫째, 계층적 다중 에이전트 시스템을 구축하고, 둘째, 메타 프롬프팅 프레임워크를 제안하며, 셋째, 제약 조건이 있는 강화 학습 메커니즘을 도입하고, 넷째, 에이전트를 평가자로 활용하는 평가 프레임워크를 설계합니다. RecGPT-V2는 대규모 언어 모델 기반 의도 추론의 기술적 타당성을 검증할 뿐만 아니라 대규모 산업 시나리오에서의 상업적 실현 가능성을 입증하여 인지 탐구와 산업 응용 사이의 간극을 성공적으로 메웁니다.

논문 링크:https://go.hyper.ai/TdjZJ

5. Deeper-GXX: 임의의 GNN 심화

본 논문에서는 체계적인 사후 학습 혁신을 통해 탁월한 장기 컨텍스트 추론 능력을 달성한 모델인 QwenLong-L1.5를 소개합니다. Qwen3-30B-A3B-Thinking 아키텍처를 기반으로 하는 QwenLong-L1.5는 장기 컨텍스트 추론 벤치마크에서 GPT-5 및 Gemini-2.5-Pro에 근접한 성능을 보이며, 기준 모델 대비 평균 9.90점 향상되었습니다. 특히 초장기 작업(100만~400만 토큰)에서는 메모리 에이전트 프레임워크를 통해 기준 에이전트 대비 9.48점의 상당한 성능 향상을 달성했습니다.

논문 링크:https://go.hyper.ai/vViJi

이번 주 논문 추천 내용은 여기까지입니다. 더 많은 최첨단 AI 연구 논문을 보시려면 hyper.ai 공식 웹사이트의 "최신 논문" 섹션을 방문하세요.

또한, 연구팀의 고품질 연구 결과와 논문 제출을 환영합니다. 관심 있는 분은 NeuroStar WeChat(WeChat ID: Hyperai01)을 추가해 주세요.

다음주에 뵙겠습니다!

AI 논문 주간 보고서 | NVIDIA 오픈 소스 모델 / OpenAI 벤치마크 / 에이전트 시스템 / 장기 컨텍스트 추론... AI 업데이트 간략 요약

7달 전

* 낮은 계산 효율성과 여러 추론 경로에 걸친 인지적 중복성;

* 고정 템플릿 생성 시 해석 가능성이 불충분함;

* 지도 학습 패러다임 내에서의 적용 가능성이 제한적입니다.

단순하고 결과 중심적인 평가는 인간적인 기준을 충족시키지 못한다.

기존의 한계를 극복하기 위해 알리바바 연구팀은 최신 버전인 RecGPT-V2를 출시했습니다. 이번 버전에는 네 가지 핵심 혁신 기술이 포함되어 있습니다.

계층적 다중 에이전트 시스템을 구축합니다.

메타 프롬프팅 프레임워크를 제안합니다.

* 제약 조건 기반 강화 학습 메커니즘을 도입합니다.

* 에이전트를 심사위원으로 하는 평가 프레임워크를 설계하십시오.

논문 링크:https://go.hyper.ai/wftNU

최신 AI 논문:https://go.hyper.ai/hzChC

이번 주 논문 추천

1. Nemotron 3 Nano: 에이전트 추론을 위한 개방적이고 효율적인 전문가 혼합형 하이브리드 Mamba-Transformer 모델

논문 링크:https://go.hyper.ai/LtmY3

2. 첨단 과학

논문 링크:https://go.hyper.ai/XanPc

3. AutoGLM: GUI를 위한 자율 기반 에이전트

논문 링크:https://go.hyper.ai/SLjro

4. RecGPT-V2 기술 보고서

논문 링크:https://go.hyper.ai/TdjZJ

5. Deeper-GXX: 임의의 GNN 심화

논문 링크:https://go.hyper.ai/vViJi

이번 주 논문 추천 내용은 여기까지입니다. 더 많은 최첨단 AI 연구 논문을 보시려면 hyper.ai 공식 웹사이트의 "최신 논문" 섹션을 방문하세요.

또한, 연구팀의 고품질 연구 결과와 논문 제출을 환영합니다. 관심 있는 분은 NeuroStar WeChat(WeChat ID: Hyperai01)을 추가해 주세요.

다음주에 뵙겠습니다!

Command Palette

AI 논문 주간 보고서 | NVIDIA 오픈 소스 모델 / OpenAI 벤치마크 / 에이전트 시스템 / 장기 컨텍스트 추론... AI 업데이트 간략 요약

이번 주 논문 추천

Command Palette

AI 논문 주간 보고서 | NVIDIA 오픈 소스 모델 / OpenAI 벤치마크 / 에이전트 시스템 / 장기 컨텍스트 추론... AI 업데이트 간략 요약

이번 주 논문 추천

관련 뉴스

데이터셋 개요 | NVIDIA, Nemotron 데이터셋 공개: 10TB 이상의 토큰과 4천만 개의 학습 샘플을 포함하며, 수학적 추론, 코드 생성 및 다국어 대화 학습을 지원합니다.

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

데이터셋 모음 | AI 에이전트 평가 데이터셋: 마이크로소프트, 베이징대학교, 홍콩대학교, 상하이 자오퉁대학교 등에서 공개한 10개의 데이터셋으로, 장기 기억부터 실제 작업 실행까지 모든 것을 포괄합니다.

구글이 혼합 테이블형 데이터를 위한 제로샷 예측 모델인 TabFM-1.0.0-PyTorch를 출시했습니다. NVIDIA는 수천만 개의 문자를 포함하는 다국적 합성 문자 데이터셋을 오픈소스로 공개했습니다.

ICML 26 우수 논문: 칭화대 JustGRPO, dLLM 추론 병목 현상 극복; 단순 지시 테스트에 작별을 고하다: Agents Last Exam, 지능형 에이전트의 장기적인 전문 역량을 종합적으로 평가.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

온라인 튜토리얼 | NVIDIA 오픈 소스 LocateAnything은 이미지 및 비디오 대상 포인팅, 개방형 어휘 객체 감지, 대상 위치 파악, OCR 텍스트 위치 파악 및 기타 기능을 지원하는 3B 모델입니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

Command Palette

AI 논문 주간 보고서 | NVIDIA 오픈 소스 모델 / OpenAI 벤치마크 / 에이전트 시스템 / 장기 컨텍스트 추론... AI 업데이트 간략 요약

이번 주 논문 추천

관련 뉴스

데이터셋 개요 | NVIDIA, Nemotron 데이터셋 공개: 10TB 이상의 토큰과 4천만 개의 학습 샘플을 포함하며, 수학적 추론, 코드 생성 및 다국어 대화 학습을 지원합니다.

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

데이터셋 모음 | AI 에이전트 평가 데이터셋: 마이크로소프트, 베이징대학교, 홍콩대학교, 상하이 자오퉁대학교 등에서 공개한 10개의 데이터셋으로, 장기 기억부터 실제 작업 실행까지 모든 것을 포괄합니다.

구글이 혼합 테이블형 데이터를 위한 제로샷 예측 모델인 TabFM-1.0.0-PyTorch를 출시했습니다. NVIDIA는 수천만 개의 문자를 포함하는 다국적 합성 문자 데이터셋을 오픈소스로 공개했습니다.

ICML 26 우수 논문: 칭화대 JustGRPO, dLLM 추론 병목 현상 극복; 단순 지시 테스트에 작별을 고하다: Agents Last Exam, 지능형 에이전트의 장기적인 전문 역량을 종합적으로 평가.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

온라인 튜토리얼 | NVIDIA 오픈 소스 LocateAnything은 이미지 및 비디오 대상 포인팅, 개방형 어휘 객체 감지, 대상 위치 파악, OCR 텍스트 위치 파악 및 기타 기능을 지원하는 3B 모델입니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

관련 뉴스

데이터셋 개요 | NVIDIA, Nemotron 데이터셋 공개: 10TB 이상의 토큰과 4천만 개의 학습 샘플을 포함하며, 수학적 추론, 코드 생성 및 다국어 대화 학습을 지원합니다.

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

데이터셋 모음 | AI 에이전트 평가 데이터셋: 마이크로소프트, 베이징대학교, 홍콩대학교, 상하이 자오퉁대학교 등에서 공개한 10개의 데이터셋으로, 장기 기억부터 실제 작업 실행까지 모든 것을 포괄합니다.

구글이 혼합 테이블형 데이터를 위한 제로샷 예측 모델인 TabFM-1.0.0-PyTorch를 출시했습니다. NVIDIA는 수천만 개의 문자를 포함하는 다국적 합성 문자 데이터셋을 오픈소스로 공개했습니다.

ICML 26 우수 논문: 칭화대 JustGRPO, dLLM 추론 병목 현상 극복; 단순 지시 테스트에 작별을 고하다: Agents Last Exam, 지능형 에이전트의 장기적인 전문 역량을 종합적으로 평가.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

온라인 튜토리얼 | NVIDIA 오픈 소스 LocateAnything은 이미지 및 비디오 대상 포인팅, 개방형 어휘 객체 감지, 대상 위치 파악, OCR 텍스트 위치 파악 및 기타 기능을 지원하는 3B 모델입니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.

관련 뉴스

데이터셋 개요 | NVIDIA, Nemotron 데이터셋 공개: 10TB 이상의 토큰과 4천만 개의 학습 샘플을 포함하며, 수학적 추론, 코드 생성 및 다국어 대화 학습을 지원합니다.

무료 CPU 온라인 튜토리얼 | Hermes 에이전트: 장기 기억 학습? TencentDB Agent Memory 메모리 향상 플러그인은 사실, 선호도, 작업 상태 등을 별도로 저장할 수 있습니다.

데이터셋 모음 | AI 에이전트 평가 데이터셋: 마이크로소프트, 베이징대학교, 홍콩대학교, 상하이 자오퉁대학교 등에서 공개한 10개의 데이터셋으로, 장기 기억부터 실제 작업 실행까지 모든 것을 포괄합니다.

구글이 혼합 테이블형 데이터를 위한 제로샷 예측 모델인 TabFM-1.0.0-PyTorch를 출시했습니다. NVIDIA는 수천만 개의 문자를 포함하는 다국적 합성 문자 데이터셋을 오픈소스로 공개했습니다.

ICML 26 우수 논문: 칭화대 JustGRPO, dLLM 추론 병목 현상 극복; 단순 지시 테스트에 작별을 고하다: Agents Last Exam, 지능형 에이전트의 장기적인 전문 역량을 종합적으로 평가.

4단계 이미지 출력/4K 화질/6배속 향상, PiD는 픽셀 확산을 사용하여 디코딩과 초해상도 출력을 통합합니다. SA-3DAO: 아티스트가 직접 제작한 3D 메시와 실제 이미지 1000쌍을 포함하는 데이터셋입니다.

온라인 튜토리얼 | NVIDIA 오픈 소스 LocateAnything은 이미지 및 비디오 대상 포인팅, 개방형 어휘 객체 감지, 대상 위치 파악, OCR 텍스트 위치 파악 및 기타 기능을 지원하는 3B 모델입니다.

이모티콘으로 음성 생성을 제어할 수 있을까요? Irodori-TTS는 RF-DiT 아키텍처 기반의 일본어 TTS입니다. 습진 및 백선 피부 질환 데이터 세트: 의료 영상 분류 및 전이 학습을 지원합니다.