Command Palette
Search for a command to run...
위키
머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색
Search for a command to run...
머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색
UDK-VQA 프레임워크의 핵심 목적은 기존의 대규모 시각 언어 모델(LVLM)을 향상시켜 최신 지식을 바탕으로 시각적 질의응답(VQA)을 처리할 수 있도록 하는 것입니다.
SearchLVLMs 프레임워크는 최첨단 지식을 요구하는 질문에 답하는 데 있어 LVLM의 성능을 크게 향상시킬 수 있습니다.
LLMxMapReduce 프레임워크는 대규모 모델의 메모리 제한을 깨고 이론적으로 "무한 길이" 컨텍스트의 처리 능력을 달성합니다.
AdaCache는 Meta가 2024년에 제안한 기술로 AI 비디오 생성을 가속화합니다. 핵심은 적응형 캐싱 메커니즘입니다. 관련 논문 결과는 “더 빠른 비디오 생성을 위한 적응형 캐싱 […]”입니다.
2024년, 카네기 멜론 대학교(CMU)는 대규모 언어 모델을 통해 자연어 신호를 자동으로 조정하여 텍스트 그래프와 시각적 인식과 같은 여러 다운스트림 작업에서 시각 언어 모델(VLM)의 성능을 최적화하는 새로운 블랙박스 최적화 전략을 제안했습니다. 이 접근 방식은 모델을 건드릴 필요가 없을 뿐만 아니라 […]
DexMimicGen은 소수의 인간 시연으로부터 대량의 로봇 훈련 데이터를 생성할 수 있습니다.
MIA-DPO(Multi-Image Augmented Direct Preference Optimization)는 상하이 교통대학교와 상하이 인민대학교가 공동으로 개발한 대규모 시각 언어 모델(LVLM)을 위한 다중 이미지 증강 선호도 정렬 방법입니다.
멜-주파수 켑스트럼은 음성 처리 분야, 특히 음성 인식 및 화자 식별 분야에서 널리 사용되는 기술입니다.
다익스트라 알고리즘은 그래프에서 단일 소스로부터 가장 짧은 경로를 찾는 고전적인 알고리즘입니다.
WISE 기술은 대규모 언어 모델에서 환각 현상을 해결하고 모델의 지식 메모리 편집 기능을 개선하는 것을 목표로 합니다.
DuoAttention은 검색 헤더에 전체 KV 캐시를 적용하고 스트리밍 헤더에 가볍고 고정 길이의 KV 캐시를 적용하여 메모리와 컴퓨팅 리소스를 최적화합니다.
디지털 사촌은 실제 객체와 일대일 대응을 추구하는 대신, 유사한 기하학적, 의미적 특성에 초점을 맞춰 더 낮은 비용으로 실용적인 훈련 데이터를 생성합니다.
DAPE는 데이터 적응형 위치 인코딩(Data-Adaptive Positional Encoding)의 약자로, 홍콩 중국 대학의 정촨양(Zheng Chuanyang) 등이 제안한 새로운 위치 인코딩 방법입니다. 연구팀에는 싱가포르 국립대학교, 노아 랩, 홍콩대학교, 홍콩 침례대학교의 연구자들도 포함되어 있습니다. […]
SparseLLM은 에모리 대학교와 Argonne National Laboratory의 연구자들이 2024년에 제안한 새로운 글로벌 프루닝 프레임워크입니다. 관련 논문은 "SparseLLM: 사전 학습의 글로벌 프루닝을 향하여 […]"입니다.
Diff Transformer는 두 개의 독립적인 소프트맥스 어텐션 맵을 계산한 다음 그 차이를 구해 최종 어텐션 점수를 구합니다. 이 방법을 사용하면 주의 잡음을 효과적으로 제거하고 모델이 입력의 가장 관련성 있는 부분에 더 많은 주의를 기울이도록 할 수 있습니다.
UNA는 Unified Alignment Framework의 약자로, Salesforce와 샤먼 대학의 연구팀이 제안한 새로운 정렬 프레임워크입니다. 관련 논문은 “UNA: […]의 통합 정렬”입니다.
Swarm은 OpenAI가 2024년에 개발한 실험적 다중 에이전트 프레임워크로, 다중 에이전트 시스템의 구성, 오케스트레이션 및 배포를 단순화하는 것을 목표로 합니다. Swarm은 에이전트 협업과 실행을 가볍고, 제어하기 쉽고, 테스트하기 쉽게 만드는 데 중점을 둡니다. 스웜의 핵심[…]
미켈란젤로는 딥마인드 연구진이 2024년에 제안한 방법으로, 장문 텍스트 맥락에서 대규모 언어 모델의 추론 능력을 평가하는 방법입니다. 이는 LSQ(Latent Structure Queries)라는 프레임워크를 통해 수행됩니다. […]
정지 문제는 논리와 수학의 계산 가능성 이론에서 중요한 문제입니다. 1936년 영국의 수학자 앨런 튜링이 제안한 것으로, 관련 논문은 튜링의 유명한 논문 "계산 가능한 숫자에 관하여 […]"이다.
모델이 학습 중에 실제 데이터 분포와 거리가 먼 데이터를 생성하기 시작하면 모델 성능이 급격히 떨어지고, 결국 모델 출력이 무의미해지게 됩니다.
홉필드 네트워크는 연관 기억이나 패턴 인식과 같은 문제에 주로 사용되는 순환 신경망입니다.
보상 오류 감소는 보상 함수가 에이전트의 실제 목표와 완전히 일치하지 않아 발생하는 강화 학습(RL)의 문제를 말합니다.
순차적 추천 시스템은 사용자의 과거 행동 순서를 기반으로 사용자의 다음 행동을 예측하는 것이 주된 임무인 중요한 유형의 추천 시스템입니다.
R-MFDN은 교차 모달 대조 학습 손실 함수와 신원 기반 대조 학습 손실 함수를 통해 위조된 콘텐츠에 대한 모델의 민감도를 향상시킵니다.
UDK-VQA 프레임워크의 핵심 목적은 기존의 대규모 시각 언어 모델(LVLM)을 향상시켜 최신 지식을 바탕으로 시각적 질의응답(VQA)을 처리할 수 있도록 하는 것입니다.
SearchLVLMs 프레임워크는 최첨단 지식을 요구하는 질문에 답하는 데 있어 LVLM의 성능을 크게 향상시킬 수 있습니다.
LLMxMapReduce 프레임워크는 대규모 모델의 메모리 제한을 깨고 이론적으로 "무한 길이" 컨텍스트의 처리 능력을 달성합니다.
AdaCache는 Meta가 2024년에 제안한 기술로 AI 비디오 생성을 가속화합니다. 핵심은 적응형 캐싱 메커니즘입니다. 관련 논문 결과는 “더 빠른 비디오 생성을 위한 적응형 캐싱 […]”입니다.
2024년, 카네기 멜론 대학교(CMU)는 대규모 언어 모델을 통해 자연어 신호를 자동으로 조정하여 텍스트 그래프와 시각적 인식과 같은 여러 다운스트림 작업에서 시각 언어 모델(VLM)의 성능을 최적화하는 새로운 블랙박스 최적화 전략을 제안했습니다. 이 접근 방식은 모델을 건드릴 필요가 없을 뿐만 아니라 […]
DexMimicGen은 소수의 인간 시연으로부터 대량의 로봇 훈련 데이터를 생성할 수 있습니다.
MIA-DPO(Multi-Image Augmented Direct Preference Optimization)는 상하이 교통대학교와 상하이 인민대학교가 공동으로 개발한 대규모 시각 언어 모델(LVLM)을 위한 다중 이미지 증강 선호도 정렬 방법입니다.
멜-주파수 켑스트럼은 음성 처리 분야, 특히 음성 인식 및 화자 식별 분야에서 널리 사용되는 기술입니다.
다익스트라 알고리즘은 그래프에서 단일 소스로부터 가장 짧은 경로를 찾는 고전적인 알고리즘입니다.
WISE 기술은 대규모 언어 모델에서 환각 현상을 해결하고 모델의 지식 메모리 편집 기능을 개선하는 것을 목표로 합니다.
DuoAttention은 검색 헤더에 전체 KV 캐시를 적용하고 스트리밍 헤더에 가볍고 고정 길이의 KV 캐시를 적용하여 메모리와 컴퓨팅 리소스를 최적화합니다.
디지털 사촌은 실제 객체와 일대일 대응을 추구하는 대신, 유사한 기하학적, 의미적 특성에 초점을 맞춰 더 낮은 비용으로 실용적인 훈련 데이터를 생성합니다.
DAPE는 데이터 적응형 위치 인코딩(Data-Adaptive Positional Encoding)의 약자로, 홍콩 중국 대학의 정촨양(Zheng Chuanyang) 등이 제안한 새로운 위치 인코딩 방법입니다. 연구팀에는 싱가포르 국립대학교, 노아 랩, 홍콩대학교, 홍콩 침례대학교의 연구자들도 포함되어 있습니다. […]
SparseLLM은 에모리 대학교와 Argonne National Laboratory의 연구자들이 2024년에 제안한 새로운 글로벌 프루닝 프레임워크입니다. 관련 논문은 "SparseLLM: 사전 학습의 글로벌 프루닝을 향하여 […]"입니다.
Diff Transformer는 두 개의 독립적인 소프트맥스 어텐션 맵을 계산한 다음 그 차이를 구해 최종 어텐션 점수를 구합니다. 이 방법을 사용하면 주의 잡음을 효과적으로 제거하고 모델이 입력의 가장 관련성 있는 부분에 더 많은 주의를 기울이도록 할 수 있습니다.
UNA는 Unified Alignment Framework의 약자로, Salesforce와 샤먼 대학의 연구팀이 제안한 새로운 정렬 프레임워크입니다. 관련 논문은 “UNA: […]의 통합 정렬”입니다.
Swarm은 OpenAI가 2024년에 개발한 실험적 다중 에이전트 프레임워크로, 다중 에이전트 시스템의 구성, 오케스트레이션 및 배포를 단순화하는 것을 목표로 합니다. Swarm은 에이전트 협업과 실행을 가볍고, 제어하기 쉽고, 테스트하기 쉽게 만드는 데 중점을 둡니다. 스웜의 핵심[…]
미켈란젤로는 딥마인드 연구진이 2024년에 제안한 방법으로, 장문 텍스트 맥락에서 대규모 언어 모델의 추론 능력을 평가하는 방법입니다. 이는 LSQ(Latent Structure Queries)라는 프레임워크를 통해 수행됩니다. […]
정지 문제는 논리와 수학의 계산 가능성 이론에서 중요한 문제입니다. 1936년 영국의 수학자 앨런 튜링이 제안한 것으로, 관련 논문은 튜링의 유명한 논문 "계산 가능한 숫자에 관하여 […]"이다.
모델이 학습 중에 실제 데이터 분포와 거리가 먼 데이터를 생성하기 시작하면 모델 성능이 급격히 떨어지고, 결국 모델 출력이 무의미해지게 됩니다.
홉필드 네트워크는 연관 기억이나 패턴 인식과 같은 문제에 주로 사용되는 순환 신경망입니다.
보상 오류 감소는 보상 함수가 에이전트의 실제 목표와 완전히 일치하지 않아 발생하는 강화 학습(RL)의 문제를 말합니다.
순차적 추천 시스템은 사용자의 과거 행동 순서를 기반으로 사용자의 다음 행동을 예측하는 것이 주된 임무인 중요한 유형의 추천 시스템입니다.
R-MFDN은 교차 모달 대조 학습 손실 함수와 신원 기반 대조 학습 손실 함수를 통해 위조된 콘텐츠에 대한 모델의 민감도를 향상시킵니다.