Command Palette
Search for a command to run...
Papers
최신 AI 트렌드를 파악할 수 있도록 매일 업데이트되는 최첨단 AI 연구 논문

토큰을 넘어서: 뇌에서 영감을 받은 지능에서 인공 일반 지능의 인지적 기초와 그 사회적 영향까지

수학적 추론이 일반 LLM 기능을 향상시키는가? LLM 추론의 전이성 이해































토큰을 넘어서: 뇌에서 영감을 받은 지능에서 인공 일반 지능의 인지적 기초와 그 사회적 영향까지

수학적 추론이 일반 LLM 기능을 향상시키는가? LLM 추론의 전이성 이해






























SciArena: 과학 문헌 작업을 위한 기초 모델 평가 플랫폼
의학에서의 통합적 인공지능: 성능 향상과 설명 가능성 개선
진화하는 맥락 내 프롬프트: 개방형, 자기 복제적 관점
SPIRAL: 제로섬 게임에서의 자기 대결이 다중 에이전트 다턴 강화 학습을 통해 추론을 유도함
VLMs에서 이미지 선호도를 위한 청자 보상형 사고
서예가: 자유형 텍스트 이미지 맞춤 설정
VMoBA: 비디오 확산 모델을 위한 블록 주의력 혼합
SMMILE: 다중 모드 의료 문맥 학습을 위한 전문가 주도 벤치마크
자동화된 LLM 스피드런 벤치마크: NanoGPT 개선 재현
Shape-for-Motion: 3D 프록시를 활용한 정밀하고 일관된 비디오 편집
이상에서 현실로: 실제 시나리오를 위한 통합적이고 데이터 효율적인 밀집 예측
ShotBench: 비전-언어 모델에서 전문가 수준의 시네마틱 이해
XVerse: DiT 변조를 통한 일관된 다중 주체의 신원 및 의미 속성 제어
24 웰 플레이트에서의 제로샷 항체 설계
KinFormer: 촉매 유기 반응 동역학을 위한 일반화 가능한 역동적 기호 회귀
MiCo: 다중 이미지 대조를 이용한 강화 시각적 추론
세부 선호도 최적화가 VLM의 공간 추론을 개선합니다.
Ark: 로봇 학습을 위한 오픈 소스 파이썬 기반 프레임워크
Pangu Pro MoE: 효율적인 희소성을 위한 그룹 전문가 혼합
LLaVA-Scissor: 의미 연결 성분을 이용한 토큰 압축 기법으로 비디오 LLM 최적화
BlenderFusion: 3D 기반 시각적 편집 및 생성적 합성
UniMate: 기계 메타물질 생성, 특성 예측 및 상태 확인을 위한 통합 모델
트랜스포머의 중간 레이어를 건너뛰는 방법 학습
SAM4D: 카메라 및 LiDAR 스트림에서 모든 것을 세그멘테이션하기
LLM 프리트레이닝에서 Grokking을 어디서 찾을 수 있을까요? 테스트 없이 암기-일반화 과정을 모니터링하기
FineWeb2: 모든 언어를 위한 단일 파이프라인 -- 사전 학습 데이터 처리의 적응
MADrive: 메모리 증강 주행 장면 모델링
FaSTA^*: 효율적인 다단계 이미지 편집을 위한 빠르고 느린 경로 에이전트 및 서브루틴 채굴
Mind2Web 2: 에이전트-아즈-저지로 대리적 검색 평가하기
WorldVLA: 자동 회귀적 행동 세계 모델로의 진전
SciArena: 과학 문헌 작업을 위한 기초 모델 평가 플랫폼
의학에서의 통합적 인공지능: 성능 향상과 설명 가능성 개선
진화하는 맥락 내 프롬프트: 개방형, 자기 복제적 관점
SPIRAL: 제로섬 게임에서의 자기 대결이 다중 에이전트 다턴 강화 학습을 통해 추론을 유도함
VLMs에서 이미지 선호도를 위한 청자 보상형 사고
서예가: 자유형 텍스트 이미지 맞춤 설정
VMoBA: 비디오 확산 모델을 위한 블록 주의력 혼합
SMMILE: 다중 모드 의료 문맥 학습을 위한 전문가 주도 벤치마크
자동화된 LLM 스피드런 벤치마크: NanoGPT 개선 재현
Shape-for-Motion: 3D 프록시를 활용한 정밀하고 일관된 비디오 편집
이상에서 현실로: 실제 시나리오를 위한 통합적이고 데이터 효율적인 밀집 예측
ShotBench: 비전-언어 모델에서 전문가 수준의 시네마틱 이해
XVerse: DiT 변조를 통한 일관된 다중 주체의 신원 및 의미 속성 제어
24 웰 플레이트에서의 제로샷 항체 설계
KinFormer: 촉매 유기 반응 동역학을 위한 일반화 가능한 역동적 기호 회귀
MiCo: 다중 이미지 대조를 이용한 강화 시각적 추론
세부 선호도 최적화가 VLM의 공간 추론을 개선합니다.
Ark: 로봇 학습을 위한 오픈 소스 파이썬 기반 프레임워크
Pangu Pro MoE: 효율적인 희소성을 위한 그룹 전문가 혼합
LLaVA-Scissor: 의미 연결 성분을 이용한 토큰 압축 기법으로 비디오 LLM 최적화
BlenderFusion: 3D 기반 시각적 편집 및 생성적 합성
UniMate: 기계 메타물질 생성, 특성 예측 및 상태 확인을 위한 통합 모델
트랜스포머의 중간 레이어를 건너뛰는 방법 학습
SAM4D: 카메라 및 LiDAR 스트림에서 모든 것을 세그멘테이션하기
LLM 프리트레이닝에서 Grokking을 어디서 찾을 수 있을까요? 테스트 없이 암기-일반화 과정을 모니터링하기
FineWeb2: 모든 언어를 위한 단일 파이프라인 -- 사전 학습 데이터 처리의 적응
MADrive: 메모리 증강 주행 장면 모델링
FaSTA^*: 효율적인 다단계 이미지 편집을 위한 빠르고 느린 경로 에이전트 및 서브루틴 채굴
Mind2Web 2: 에이전트-아즈-저지로 대리적 검색 평가하기
WorldVLA: 자동 회귀적 행동 세계 모델로의 진전