HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
위키

위키

머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

메인 페이지

GPU

콘솔
Studio
문서
가격

Pulse

뉴스

리소스

논문
노트북
데이터 세트
위키

벤치마크

SOTA
LLM 모델
GPU 리더보드

커뮤니티

이벤트

유틸리티

정보 서비스 이용약관 개인정보 처리방침
한국어

Command Palette

Search for a command to run...

HyperAI
위키

위키

머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색

인공지능의 미래를 구축하세요

정보

회사 소개 지원 데이터 세트 도움말

제품

뉴스 논문 노트북 데이터 세트 위키

링크

© HyperAI

GitHub Discord X (formerly Twitter)

유전 알고리즘

유전 알고리즘(GA)은 계산 수학에서 최적화 문제를 해결하는 데 사용되는 검색 알고리즘입니다. 이는 유전, 돌연변이, 자연선택, 교잡을 포함한 진화생물학의 일부 현상에서 차용한 일종의 진화 알고리즘입니다. 유전자 알고리즘은 일반적으로 컴퓨터 시뮬레이션의 형태로 구현됩니다. 최적화 문제에는 […]가 있습니다.

이득 비율

이득률은 일반적으로 정보 이득률을 의미하며, 노드 정보와 노드 분할 정보 측정값의 비율을 나타냅니다. 이득률은 일반적으로 속성 선택 방법 중 하나로 사용됩니다. 다른 두 가지 일반적인 방법은 정보 이득과 지니 지수입니다. 이득 비율 공식은 다음과 같습니다. $latex {GainRatio{ \left( {R} […]

힐베르트 공간

힐베르트 공간은 완전 내적 공간으로, 내적을 포함하는 완전 벡터 공간으로 이해할 수 있습니다. 알베르트 공간은 유한 차원의 유클리드 공간을 기반으로 하며, 후자의 일반화로 볼 수 있습니다. 그것은 실수와 유한한 차원에 국한되지는 않지만 완전하지는 않습니다. 유클리드 공간과 마찬가지로 힐베르트 공간은 내적 공간이며 거리와 각도를 갖습니다.

은닉 마르코프 모델

은닉 마르코프 모델(HMM)은 시계열의 확률적 모델로, 은닉 마르코프 체인을 통해 각 상태에서 관찰할 수 없는 상태의 관찰 가능한 무작위 시퀀스를 생성하는 과정을 설명합니다. 은닉 마르코프 모델은 숨겨진 알려지지 않은 매개변수를 포함하는 마르코프 모델을 설명하는 데 사용되는 통계 모델입니다.

숨겨진 레이어

은닉층은 다단계 피드포워드 신경망에서 입력층과 출력층을 제외한 나머지 층을 말합니다. 은닉층은 외부 신호를 직접 받지 않으며, 외부 세계에 신호를 직접 보내지도 않습니다. 데이터가 비선형적으로 분리된 경우에만 필요합니다. 은닉층의 뉴런은 최대 풀링층, 합성곱층 등 다양한 형태를 취할 수 있으며, 각각 다른 수학적 함수를 수행합니다. […]

하드 투표

하드 투표는 클래스 레이블을 직접 출력하는 투표 방법으로, 주로 분류 머신 러닝 알고리즘에서 사용됩니다. 투표는 앙상블 학습에서 분류 문제에 대한 조합 전략입니다. 알고리즘의 기본 아이디어는 출력이 가장 많은 클래스를 선택하는 것입니다. 하드 투표는 알고리즘에서 가장 많은 출력을 낸 레이블을 선택하는 것입니다. 라벨의 개수가 같으면 오름차순으로 정렬됩니다. […]

독립적이고 동일하게 분포됨

독립적이고 동일하게 분포(IID)한다는 것은 확률 변수 집합의 각 변수의 확률 분포가 동일하고 이러한 확률 변수가 서로 독립적이라는 것을 의미합니다. 확률 변수의 집합이 독립적이고 동일하게 분포한다는 것은 표본 공간에서 각 사건의 확률이 동일하다는 것을 의미하지 않습니다. 예를 들어, 균일하지 않은 주사위를 굴려 나온 결과의 순서는 독립적이고 동일하게 분포되지만, 각 주사위를 굴릴 확률은 [...]

점진적 학습

증분 학습이란 새로운 데이터가 추가될 때 새로운 데이터만 업데이트된다는 것을 의미합니다. 증분 학습은 이전에 학습한 지식의 대부분을 보존하면서 새로운 샘플로부터 지속적으로 새로운 지식을 학습할 수 있습니다. 증분 학습은 점진적인 축적과 업데이트 과정인 인간 학습 모델과 유사합니다. 전통적인 학습 방법은 모든 데이터를 미리 준비하는 배치 학습입니다.

지식 기반

지식 기반은 관련 도메인 지식의 수집, 구성 및 추출을 용이하게 하기 위해 지식 관리에 사용되는 특수한 데이터베이스입니다. 데이터베이스에 있는 지식은 해당 분야 전문가로부터 나옵니다. 이는 문제 해결과 관련된 도메인 지식의 모음으로, 기본적인 사실, 규칙 및 기타 관련 정보를 포함합니다. 지식 기반은 체계적이고, 사용하기 쉽고, 사용하기 쉬운 포괄적인 지식 엔지니어링입니다.[…]

K-최근접 이웃 알고리즘

K-최근접 이웃 알고리즘(KNN)은 자신에게 가장 가까운 K개의 점에 투표하여 범주형 데이터의 분류를 결정하는 기본적인 분류 및 회귀 알고리즘입니다. KNN의 특징 KNN은 게으른 학습 방법입니다. KNN은 계산 복잡도가 높습니다. K 값이 다르면 분류 결과도 달라집니다.

JS 다이버전스 젠슨-섀넌 다이버전스

JS 발산은 두 확률 분포의 유사성을 측정합니다. 이는 KL 발산의 변형을 기반으로 하며 KL 발산의 비대칭 문제를 해결합니다. 일반적으로 JS 발산은 대칭적이며 그 값은 0과 1 사이입니다. 정의는 다음과 같습니다. KL 발산과 JS 발산을 측정 기준으로 사용할 경우 문제가 있습니다. 두 […]

최소 제곱 회귀 트리

최소 제곱 회귀 트리는 일반적으로 사용되는 회귀 트리 알고리즘입니다. 제곱 오차를 최소화하기 위해서는 각 특징의 값을 차례로 탐색하고 가능한 각 분할 지점의 오차를 계산해야 합니다. 마지막으로, 분할 오류가 가장 작은 지점을 선택하고 입력 공간을 두 부분으로 나눕니다. 위의 단계는 분할이 완료될 때까지 재귀적으로 반복됩니다. 이 방법은 […]

잠재 디리클레 할당

잠재 디리클레 할당(LDA)은 문서 집합 내 각 문서의 주제를 확률 분포 형태로 표현할 수 있는 주제 모델입니다. 또한, 학습을 위해 수동으로 주석이 달린 학습 세트가 필요하지 않은 비지도 학습 알고리즘입니다. 문서 집합과 지정된 주제의 수 K만 필요합니다. 또한 각 주제에 대해 […]

최소 설명 길이

최소 설명 길이 원칙이라고도 하는 최소 설명 길이는 데이터를 저장하기 위한 여러 가설 중에서 가장 큰 데이터 압축 효과를 낼 수 있는 가설이 가장 좋다는 것을 의미합니다. 최소 설명 길이 원칙은 1978년 요르마 리사넨이 도입한 오컴의 면도날을 공식화한 것입니다. 이 원칙의 주요 요점은 다음과 같습니다. […]

메타러닝

메타 러닝은 머신 러닝 실험의 메타데이터에 자동으로 학습 알고리즘을 적용하는 머신 러닝의 하위 분야입니다. 메타러닝의 핵심은 '학습(훈련)' 과정으로, 뉴런이 기존 지식을 잘 활용하여 새로운 작업에 맞게 스스로를 조정할 수 있도록 하는 방법을 연구하는 것입니다. 개략도는 다음과 같습니다. 신경망의 초기 매개변수(파란색 ■ […]

최대 풀링

최대 풀링은 값을 최대화하여 데이터 양을 줄이는 일반적으로 사용되는 풀링 작업입니다. 일반적인 동작은 입력 이미지를 여러 개의 직사각형 영역으로 나누고 각 하위 도메인의 최대값을 출력하는 것입니다. 현재 일반적으로 사용되는 풀링 방법에는 최대 풀링과 평균 풀링이 있으며, 이는 상위 은닉층의 복잡한 계산을 줄이고 현재 […]에 영향을 받지 않습니다.

최대 마진

최대 간격은 분류 작업에서 훈련 데이터 간의 거리가 가장 큰 상황을 말합니다. 최대 구간을 만족하는 초평면은 데이터를 양수와 음수 범주로 나눌 수 있으며, 이때 결정 신뢰도가 가장 높습니다. 지원 벡터 머신에는 하드 마진 최대화와 소프트 마진 최대화가 있는데, 둘 다 최대 마진을 찾는 전략입니다.

마르코프 랜덤 필드

마르코프 난수장은 마르코프 네트워크라고도 불리며, 무향 그래프로 표현되는 모델입니다. 여기에는 노드 집합이 포함되어 있으며, 각 노드는 단일 변수 또는 변수 그룹에 해당하며 노드 간의 링크는 방향이 없습니다. 마르코프 난수장은 여러 데이터 포인트 중에서 두 포인트 사이에는 관계가 있지만 앞과 뒤 또는 방향 측면에서 명확한 관계가 없는 상황을 설명합니다.

자동 요약

자동 요약은 소프트웨어를 사용하여 텍스트 문서를 줄여서 원본 문서의 주요 내용을 담은 요약을 만드는 과정입니다. 현재는 머신 러닝과 데이터 마이닝 분야에 속하며, 관련 "정보"를 담고 있는 데이터 하위 집합을 찾는 것이 목표입니다. 현재 자동 요약에는 추출과 추상화라는 두 가지 방법이 있습니다. 추출은 원본 텍스트의 단어와 구문을 기반으로 합니다. […]

자동 음성 인식

자동 음성 인식 기술은 사람의 말을 텍스트로 변환하는 기술입니다. 음성 신호의 다양성과 복잡성으로 인해, 현재의 음성 인식 시스템은 특정 제약 하에서만 만족스러운 성능을 달성할 수 있습니다(특정한 경우에만 적용 가능). 자동 음성 인식 정의 자동 음성 인식 기술의 목표는 컴퓨터가 "[…]

오토인코더

자동 인코더는 비지도 학습에서 효율적인 인코딩을 위해 사용되는 인공 신경망으로, 종종 차원 감소를 위해 사용됩니다. 데이터의 압축 및 압축 해제 함수가 손실형이고 샘플로부터 자동으로 학습되는 데이터 압축 알고리즘이기도 하지만, 오토인코더가 언급되는 대부분의 경우 압축 및 압축 해제 함수는 신경망을 통해 학습됩니다 […]

주의 메커니즘

인간의 주의 메커니즘은 직관에 기초합니다. 이는 인간이 제한된 자원을 사용하여 방대한 양의 정보에서 가치 있는 정보를 빠르게 걸러내는 수단입니다. 딥러닝의 주의 메커니즘은 인간의 주의적 사고 모드를 차용한 것으로, 자연어 처리, 이미지 분류, 음성 인식 등 다양한 시나리오에서 널리 사용되어 놀라운 성과를 거두었습니다.

ROC 곡선 아래의 면적

AUC는 ROC 곡선과 좌표축 아래의 면적으로 정의됩니다. ROC 곡선은 y=x 위에 있으므로 AUC 값의 범위는 0.5와 1 사이입니다. AUC는 다양한 분류 모델을 비교할 때 모델의 품질을 나타내는 지표로 사용할 수 있습니다. 그 주요 의미는 AUC […]라는 사실에 있습니다.

헤시안 행렬

헤시안 행렬은 헤시안 행렬 또는 헤시안 행렬이라고도 하며, 다변수 실수 값 함수의 2차 편미분으로 구성된 블록 행렬입니다. 이는 다변수 함수에 대한 2차 미분의 일반화이며, 함수의 극값과 밀접한 관련이 있습니다.

유전 알고리즘

유전 알고리즘(GA)은 계산 수학에서 최적화 문제를 해결하는 데 사용되는 검색 알고리즘입니다. 이는 유전, 돌연변이, 자연선택, 교잡을 포함한 진화생물학의 일부 현상에서 차용한 일종의 진화 알고리즘입니다. 유전자 알고리즘은 일반적으로 컴퓨터 시뮬레이션의 형태로 구현됩니다. 최적화 문제에는 […]가 있습니다.

이득 비율

이득률은 일반적으로 정보 이득률을 의미하며, 노드 정보와 노드 분할 정보 측정값의 비율을 나타냅니다. 이득률은 일반적으로 속성 선택 방법 중 하나로 사용됩니다. 다른 두 가지 일반적인 방법은 정보 이득과 지니 지수입니다. 이득 비율 공식은 다음과 같습니다. $latex {GainRatio{ \left( {R} […]

힐베르트 공간

힐베르트 공간은 완전 내적 공간으로, 내적을 포함하는 완전 벡터 공간으로 이해할 수 있습니다. 알베르트 공간은 유한 차원의 유클리드 공간을 기반으로 하며, 후자의 일반화로 볼 수 있습니다. 그것은 실수와 유한한 차원에 국한되지는 않지만 완전하지는 않습니다. 유클리드 공간과 마찬가지로 힐베르트 공간은 내적 공간이며 거리와 각도를 갖습니다.

은닉 마르코프 모델

은닉 마르코프 모델(HMM)은 시계열의 확률적 모델로, 은닉 마르코프 체인을 통해 각 상태에서 관찰할 수 없는 상태의 관찰 가능한 무작위 시퀀스를 생성하는 과정을 설명합니다. 은닉 마르코프 모델은 숨겨진 알려지지 않은 매개변수를 포함하는 마르코프 모델을 설명하는 데 사용되는 통계 모델입니다.

숨겨진 레이어

은닉층은 다단계 피드포워드 신경망에서 입력층과 출력층을 제외한 나머지 층을 말합니다. 은닉층은 외부 신호를 직접 받지 않으며, 외부 세계에 신호를 직접 보내지도 않습니다. 데이터가 비선형적으로 분리된 경우에만 필요합니다. 은닉층의 뉴런은 최대 풀링층, 합성곱층 등 다양한 형태를 취할 수 있으며, 각각 다른 수학적 함수를 수행합니다. […]

하드 투표

하드 투표는 클래스 레이블을 직접 출력하는 투표 방법으로, 주로 분류 머신 러닝 알고리즘에서 사용됩니다. 투표는 앙상블 학습에서 분류 문제에 대한 조합 전략입니다. 알고리즘의 기본 아이디어는 출력이 가장 많은 클래스를 선택하는 것입니다. 하드 투표는 알고리즘에서 가장 많은 출력을 낸 레이블을 선택하는 것입니다. 라벨의 개수가 같으면 오름차순으로 정렬됩니다. […]

독립적이고 동일하게 분포됨

독립적이고 동일하게 분포(IID)한다는 것은 확률 변수 집합의 각 변수의 확률 분포가 동일하고 이러한 확률 변수가 서로 독립적이라는 것을 의미합니다. 확률 변수의 집합이 독립적이고 동일하게 분포한다는 것은 표본 공간에서 각 사건의 확률이 동일하다는 것을 의미하지 않습니다. 예를 들어, 균일하지 않은 주사위를 굴려 나온 결과의 순서는 독립적이고 동일하게 분포되지만, 각 주사위를 굴릴 확률은 [...]

점진적 학습

증분 학습이란 새로운 데이터가 추가될 때 새로운 데이터만 업데이트된다는 것을 의미합니다. 증분 학습은 이전에 학습한 지식의 대부분을 보존하면서 새로운 샘플로부터 지속적으로 새로운 지식을 학습할 수 있습니다. 증분 학습은 점진적인 축적과 업데이트 과정인 인간 학습 모델과 유사합니다. 전통적인 학습 방법은 모든 데이터를 미리 준비하는 배치 학습입니다.

지식 기반

지식 기반은 관련 도메인 지식의 수집, 구성 및 추출을 용이하게 하기 위해 지식 관리에 사용되는 특수한 데이터베이스입니다. 데이터베이스에 있는 지식은 해당 분야 전문가로부터 나옵니다. 이는 문제 해결과 관련된 도메인 지식의 모음으로, 기본적인 사실, 규칙 및 기타 관련 정보를 포함합니다. 지식 기반은 체계적이고, 사용하기 쉽고, 사용하기 쉬운 포괄적인 지식 엔지니어링입니다.[…]

K-최근접 이웃 알고리즘

K-최근접 이웃 알고리즘(KNN)은 자신에게 가장 가까운 K개의 점에 투표하여 범주형 데이터의 분류를 결정하는 기본적인 분류 및 회귀 알고리즘입니다. KNN의 특징 KNN은 게으른 학습 방법입니다. KNN은 계산 복잡도가 높습니다. K 값이 다르면 분류 결과도 달라집니다.

JS 다이버전스 젠슨-섀넌 다이버전스

JS 발산은 두 확률 분포의 유사성을 측정합니다. 이는 KL 발산의 변형을 기반으로 하며 KL 발산의 비대칭 문제를 해결합니다. 일반적으로 JS 발산은 대칭적이며 그 값은 0과 1 사이입니다. 정의는 다음과 같습니다. KL 발산과 JS 발산을 측정 기준으로 사용할 경우 문제가 있습니다. 두 […]

최소 제곱 회귀 트리

최소 제곱 회귀 트리는 일반적으로 사용되는 회귀 트리 알고리즘입니다. 제곱 오차를 최소화하기 위해서는 각 특징의 값을 차례로 탐색하고 가능한 각 분할 지점의 오차를 계산해야 합니다. 마지막으로, 분할 오류가 가장 작은 지점을 선택하고 입력 공간을 두 부분으로 나눕니다. 위의 단계는 분할이 완료될 때까지 재귀적으로 반복됩니다. 이 방법은 […]

잠재 디리클레 할당

잠재 디리클레 할당(LDA)은 문서 집합 내 각 문서의 주제를 확률 분포 형태로 표현할 수 있는 주제 모델입니다. 또한, 학습을 위해 수동으로 주석이 달린 학습 세트가 필요하지 않은 비지도 학습 알고리즘입니다. 문서 집합과 지정된 주제의 수 K만 필요합니다. 또한 각 주제에 대해 […]

최소 설명 길이

최소 설명 길이 원칙이라고도 하는 최소 설명 길이는 데이터를 저장하기 위한 여러 가설 중에서 가장 큰 데이터 압축 효과를 낼 수 있는 가설이 가장 좋다는 것을 의미합니다. 최소 설명 길이 원칙은 1978년 요르마 리사넨이 도입한 오컴의 면도날을 공식화한 것입니다. 이 원칙의 주요 요점은 다음과 같습니다. […]

메타러닝

메타 러닝은 머신 러닝 실험의 메타데이터에 자동으로 학습 알고리즘을 적용하는 머신 러닝의 하위 분야입니다. 메타러닝의 핵심은 '학습(훈련)' 과정으로, 뉴런이 기존 지식을 잘 활용하여 새로운 작업에 맞게 스스로를 조정할 수 있도록 하는 방법을 연구하는 것입니다. 개략도는 다음과 같습니다. 신경망의 초기 매개변수(파란색 ■ […]

최대 풀링

최대 풀링은 값을 최대화하여 데이터 양을 줄이는 일반적으로 사용되는 풀링 작업입니다. 일반적인 동작은 입력 이미지를 여러 개의 직사각형 영역으로 나누고 각 하위 도메인의 최대값을 출력하는 것입니다. 현재 일반적으로 사용되는 풀링 방법에는 최대 풀링과 평균 풀링이 있으며, 이는 상위 은닉층의 복잡한 계산을 줄이고 현재 […]에 영향을 받지 않습니다.

최대 마진

최대 간격은 분류 작업에서 훈련 데이터 간의 거리가 가장 큰 상황을 말합니다. 최대 구간을 만족하는 초평면은 데이터를 양수와 음수 범주로 나눌 수 있으며, 이때 결정 신뢰도가 가장 높습니다. 지원 벡터 머신에는 하드 마진 최대화와 소프트 마진 최대화가 있는데, 둘 다 최대 마진을 찾는 전략입니다.

마르코프 랜덤 필드

마르코프 난수장은 마르코프 네트워크라고도 불리며, 무향 그래프로 표현되는 모델입니다. 여기에는 노드 집합이 포함되어 있으며, 각 노드는 단일 변수 또는 변수 그룹에 해당하며 노드 간의 링크는 방향이 없습니다. 마르코프 난수장은 여러 데이터 포인트 중에서 두 포인트 사이에는 관계가 있지만 앞과 뒤 또는 방향 측면에서 명확한 관계가 없는 상황을 설명합니다.

자동 요약

자동 요약은 소프트웨어를 사용하여 텍스트 문서를 줄여서 원본 문서의 주요 내용을 담은 요약을 만드는 과정입니다. 현재는 머신 러닝과 데이터 마이닝 분야에 속하며, 관련 "정보"를 담고 있는 데이터 하위 집합을 찾는 것이 목표입니다. 현재 자동 요약에는 추출과 추상화라는 두 가지 방법이 있습니다. 추출은 원본 텍스트의 단어와 구문을 기반으로 합니다. […]

자동 음성 인식

자동 음성 인식 기술은 사람의 말을 텍스트로 변환하는 기술입니다. 음성 신호의 다양성과 복잡성으로 인해, 현재의 음성 인식 시스템은 특정 제약 하에서만 만족스러운 성능을 달성할 수 있습니다(특정한 경우에만 적용 가능). 자동 음성 인식 정의 자동 음성 인식 기술의 목표는 컴퓨터가 "[…]

오토인코더

자동 인코더는 비지도 학습에서 효율적인 인코딩을 위해 사용되는 인공 신경망으로, 종종 차원 감소를 위해 사용됩니다. 데이터의 압축 및 압축 해제 함수가 손실형이고 샘플로부터 자동으로 학습되는 데이터 압축 알고리즘이기도 하지만, 오토인코더가 언급되는 대부분의 경우 압축 및 압축 해제 함수는 신경망을 통해 학습됩니다 […]

주의 메커니즘

인간의 주의 메커니즘은 직관에 기초합니다. 이는 인간이 제한된 자원을 사용하여 방대한 양의 정보에서 가치 있는 정보를 빠르게 걸러내는 수단입니다. 딥러닝의 주의 메커니즘은 인간의 주의적 사고 모드를 차용한 것으로, 자연어 처리, 이미지 분류, 음성 인식 등 다양한 시나리오에서 널리 사용되어 놀라운 성과를 거두었습니다.

ROC 곡선 아래의 면적

AUC는 ROC 곡선과 좌표축 아래의 면적으로 정의됩니다. ROC 곡선은 y=x 위에 있으므로 AUC 값의 범위는 0.5와 1 사이입니다. AUC는 다양한 분류 모델을 비교할 때 모델의 품질을 나타내는 지표로 사용할 수 있습니다. 그 주요 의미는 AUC […]라는 사실에 있습니다.

헤시안 행렬

헤시안 행렬은 헤시안 행렬 또는 헤시안 행렬이라고도 하며, 다변수 실수 값 함수의 2차 편미분으로 구성된 블록 행렬입니다. 이는 다변수 함수에 대한 2차 미분의 일반화이며, 함수의 극값과 밀접한 관련이 있습니다.