날짜

3달 전

조직

Paper URL

태그

피크-리턴 그리디 슬라이싱(PRGS)은 산둥대학교, 중국과학원, 리오토, 칭화대학교 등의 연구팀이 공동으로 제안한 알고리즘 프레임워크입니다. 관련 연구 결과는 [논문명 누락]에 게재되었습니다. 피크 반환 탐욕적 슬라이싱: 트랜스포머 기반 오프라인 강화 학습을 위한 부분 궤적 선택이 내용은 ICLR 2026에 채택되었습니다.

PRGS는 시간 단계 수준에서의 명시적인 궤적 분할을 통해 Transformer 기반 오프라인 강화 학습(Offline RL) 모델의 경험 연결 및 재구성 능력을 크게 향상시키는 것을 목표로 합니다. 기존 방법들은 종종 전체 궤적과 최종 보상에만 의존하여 긴 궤적 내에서 우수 구간과 열등 구간을 구분하기 어렵다는 한계를 극복하고자, 본 프레임워크는 세 가지 핵심 메커니즘(MMD 기반 보상 추정, 탐욕적 분할 정책, 적응형 이력 절단)을 활용하여 시간 단계 수준에서 정책 학습에 사용할 고품질 하위 궤적을 명시적으로 분할하고 추출합니다. 실험 결과, PRGS는 고보상 경험을 연결하는 모델의 능력을 크게 향상시켜, 여러 복잡한 환경 벤치마크에서 기존 기준 알고리즘 대비 평균 15.81 TP3T의 성능 향상을 달성했습니다.

공간 이론

공간 이론은 지능형 에이전트가 불완전한 정보 환경에서 능동적인 탐색을 통해 공간적 믿음을 구성, 업데이트 및 활용하는 능력을 설명하는 틀을 의미합니다.

3달 전

덴스 리트리버

고밀도 검색 엔진은 방대한 문서 라이브러리에서 쿼리 의미와 가장 관련성이 높은 단락을 신속하게 찾아내는 역할을 하며, 검색 기능 향상 생성 시스템의 핵심 기반 구성 요소입니다.

3달 전

광학 문자 인식(OCR)

OCR(광학 문자 인식)은 이미지 속 텍스트를 편집 가능한 텍스트로 변환하는 기술로, 문서 디지털화 및 자동 정보 추출의 핵심 기반이 됩니다.

하루 전

배포하면서 배우기

LWD는 범용 로봇이 지속적으로 경험을 수집하고 정책을 자체적으로 진화시킬 수 있도록 하는, 플릿 수준의 오프라인-온라인 강화 학습 프레임워크입니다.

2달 전

유도 사고 강화

GTR은 복잡한 시각 환경에서 모델 추론을 안내하고 "뇌 기능 저하"를 방지할 수 있습니다.

3달 전

원격 감지

위성 및 드론 이미지를 분석하여 지구 표면과 환경을 모니터링하면 비접촉 방식으로 지리 공간적 이해를 얻고 지구를 거시적으로 관찰할 수 있습니다.

하루 전

세계 행동 모델 WAM

WAM은 체화된 지능 및 로봇 공학 분야를 위한 새로운 AI 기반 모델 아키텍처입니다.

2달 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

날짜

3달 전

조직

Paper URL

태그

공간 이론

3달 전

덴스 리트리버

3달 전

광학 문자 인식(OCR)

OCR(광학 문자 인식)은 이미지 속 텍스트를 편집 가능한 텍스트로 변환하는 기술로, 문서 디지털화 및 자동 정보 추출의 핵심 기반이 됩니다.

하루 전

배포하면서 배우기

2달 전

유도 사고 강화

GTR은 복잡한 시각 환경에서 모델 추론을 안내하고 "뇌 기능 저하"를 방지할 수 있습니다.

3달 전

원격 감지

하루 전

세계 행동 모델 WAM

WAM은 체화된 지능 및 로봇 공학 분야를 위한 새로운 AI 기반 모델 아키텍처입니다.

2달 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

AI로 AI 구축

HyperAI Newsletters

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

AI로 AI 구축

HyperAI Newsletters

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

AI로 AI 구축

HyperAI Newsletters

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

Command Palette

피크 리턴 그리디 슬라이싱

AI로 AI 구축

HyperAI Newsletters

Command Palette

피크 리턴 그리디 슬라이싱

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

AI로 AI 구축

HyperAI Newsletters

Command Palette

피크 리턴 그리디 슬라이싱

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

AI로 AI 구축

HyperAI Newsletters

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM

관련 위키

공간 이론

덴스 리트리버

광학 문자 인식(OCR)

배포하면서 배우기

유도 사고 강화

원격 감지

세계 행동 모델 WAM