HyperAI초신경

2024년, 카네기 멜론 대학교(CMU)는 대규모 언어 모델을 통해 자연어 신호를 자동으로 조정하여 텍스트 그래프와 시각적 인식과 같은 여러 다운스트림 작업에서 시각 언어 모델(VLM)의 성능을 최적화하는 새로운 블랙박스 최적화 전략을 제안했습니다. 이 접근 방식은 모델을 건드릴 필요가 없을 뿐만 아니라 […]

2년 전

DexmimicGen 자동 데이터 생성 시스템

DexMimicGen은 소수의 인간 시연으로부터 대량의 로봇 훈련 데이터를 생성할 수 있습니다.

2년 전

다중 이미지 향상을 위한 MIA-DPO 선호 정렬 방법

MIA-DPO(Multi-Image Augmented Direct Preference Optimization)는 상하이 교통대학교와 상하이 인민대학교가 공동으로 개발한 대규모 시각 언어 모델(LVLM)을 위한 다중 이미지 증강 선호도 정렬 방법입니다.

2년 전

멜 주파수 켑스트럼 MFCC

멜-주파수 켑스트럼은 음성 처리 분야, 특히 음성 인식 및 화자 식별 분야에서 널리 사용되는 기술입니다.

2년 전

다익스트라 알고리즘

다익스트라 알고리즘은 그래프에서 단일 소스로부터 가장 짧은 경로를 찾는 고전적인 알고리즘입니다.

2년 전

환각에 맞서는 WISE 기술

WISE 기술은 대규모 언어 모델에서 환각 현상을 해결하고 모델의 지식 메모리 편집 기능을 개선하는 것을 목표로 합니다.

2년 전

DuoAttention 프레임워크

DuoAttention은 검색 헤더에 전체 KV 캐시를 적용하고 스트리밍 헤더에 가볍고 고정 길이의 KV 캐시를 적용하여 메모리와 컴퓨팅 리소스를 최적화합니다.

2년 전

디지털 사촌

디지털 사촌은 실제 객체와 일대일 대응을 추구하는 대신, 유사한 기하학적, 의미적 특성에 초점을 맞춰 더 낮은 비용으로 실용적인 훈련 데이터를 생성합니다.

2년 전

DAPE 위치 인코딩 방법

DAPE는 데이터 적응형 위치 인코딩(Data-Adaptive Positional Encoding)의 약자로, 홍콩 중국 대학의 정촨양(Zheng Chuanyang) 등이 제안한 새로운 위치 인코딩 방법입니다. 연구팀에는 싱가포르 국립대학교, 노아 랩, 홍콩대학교, 홍콩 침례대학교의 연구자들도 포함되어 있습니다. […]

2년 전

SparseLLM 글로벌 프루닝 프레임워크

SparseLLM은 에모리 대학교와 Argonne National Laboratory의 연구자들이 2024년에 제안한 새로운 글로벌 프루닝 프레임워크입니다. 관련 논문은 "SparseLLM: 사전 학습의 글로벌 프루닝을 향하여 […]"입니다.

2년 전

차동 변압기

Diff Transformer는 두 개의 독립적인 소프트맥스 어텐션 맵을 계산한 다음 그 차이를 구해 최종 어텐션 점수를 구합니다. 이 방법을 사용하면 주의 잡음을 효과적으로 제거하고 모델이 입력의 가장 관련성 있는 부분에 더 많은 주의를 기울이도록 할 수 있습니다.

2년 전

UNA 정렬 프레임워크

UNA는 Unified Alignment Framework의 약자로, Salesforce와 샤먼 대학의 연구팀이 제안한 새로운 정렬 프레임워크입니다. 관련 논문은 “UNA: […]의 통합 정렬”입니다.

2년 전

Swarm 다중 에이전트 프레임워크

Swarm은 OpenAI가 2024년에 개발한 실험적 다중 에이전트 프레임워크로, 다중 에이전트 시스템의 구성, 오케스트레이션 및 배포를 단순화하는 것을 목표로 합니다. Swarm은 에이전트 협업과 실행을 가볍고, 제어하기 쉽고, 테스트하기 쉽게 만드는 데 중점을 둡니다. 스웜의 핵심[…]

2년 전

미켈란젤로

미켈란젤로는 딥마인드 연구진이 2024년에 제안한 방법으로, 장문 텍스트 맥락에서 대규모 언어 모델의 추론 능력을 평가하는 방법입니다. 이는 LSQ(Latent Structure Queries)라는 프레임워크를 통해 수행됩니다. […]

2년 전

정지 문제

정지 문제는 논리와 수학의 계산 가능성 이론에서 중요한 문제입니다. 1936년 영국의 수학자 앨런 튜링이 제안한 것으로, 관련 논문은 튜링의 유명한 논문 "계산 가능한 숫자에 관하여 […]"이다.

2년 전

Command Palette

위키

Command Palette

위키

강화 미세 조정

자연어 강화 학습(NLRL)

혼합 정수 선형 프로그래밍 생성 프레임워크 MILP-StuDio

혼합 정수 선형 프로그래밍 MILP

이벤트 기반 카메라

UDK-VQA 데이터 생성 프레임워크

SearchLVLMs 프레임워크

LLMxMapReduce 긴 텍스트 프레임 처리 프레임워크

AdaCache는 비디오 생성을 가속화합니다

블랙박스 옵티마이저

DexmimicGen 자동 데이터 생성 시스템

다중 이미지 향상을 위한 MIA-DPO 선호 정렬 방법

멜 주파수 켑스트럼 MFCC

다익스트라 알고리즘

환각에 맞서는 WISE 기술

DuoAttention 프레임워크

디지털 사촌

DAPE 위치 인코딩 방법

SparseLLM 글로벌 프루닝 프레임워크

차동 변압기

UNA 정렬 프레임워크

Swarm 다중 에이전트 프레임워크

미켈란젤로

정지 문제

Command Palette

위키

강화 미세 조정

자연어 강화 학습(NLRL)

혼합 정수 선형 프로그래밍 생성 프레임워크 MILP-StuDio

혼합 정수 선형 프로그래밍 MILP

이벤트 기반 카메라

UDK-VQA 데이터 생성 프레임워크

SearchLVLMs 프레임워크

LLMxMapReduce 긴 텍스트 프레임 처리 프레임워크

AdaCache는 비디오 생성을 가속화합니다

블랙박스 옵티마이저

DexmimicGen 자동 데이터 생성 시스템

다중 이미지 향상을 위한 MIA-DPO 선호 정렬 방법

멜 주파수 켑스트럼 MFCC

다익스트라 알고리즘

환각에 맞서는 WISE 기술

DuoAttention 프레임워크

디지털 사촌

DAPE 위치 인코딩 방법

SparseLLM 글로벌 프루닝 프레임워크

차동 변압기

UNA 정렬 프레임워크

Swarm 다중 에이전트 프레임워크

미켈란젤로

정지 문제

강화 미세 조정

자연어 강화 학습(NLRL)

혼합 정수 선형 프로그래밍 생성 프레임워크 MILP-StuDio

혼합 정수 선형 프로그래밍 MILP

이벤트 기반 카메라

UDK-VQA 데이터 생성 프레임워크

SearchLVLMs 프레임워크

LLMxMapReduce 긴 텍스트 프레임 처리 프레임워크

AdaCache는 비디오 생성을 가속화합니다

블랙박스 옵티마이저

DexmimicGen 자동 데이터 생성 시스템

다중 이미지 향상을 위한 MIA-DPO 선호 정렬 방법

멜 주파수 켑스트럼 MFCC

다익스트라 알고리즘

환각에 맞서는 WISE 기술

DuoAttention 프레임워크

디지털 사촌

DAPE 위치 인코딩 방법

SparseLLM 글로벌 프루닝 프레임워크

차동 변압기

UNA 정렬 프레임워크

Swarm 다중 에이전트 프레임워크

미켈란젤로

정지 문제

강화 미세 조정

자연어 강화 학습(NLRL)