Command Palette
Search for a command to run...
위키
머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색
Search for a command to run...
머신 러닝 용어집: 주요 AI 및 ML 개념의 정의와 설명 탐색
하드 투표는 클래스 레이블을 직접 출력하는 투표 방법으로, 주로 분류 머신 러닝 알고리즘에서 사용됩니다. 투표는 앙상블 학습에서 분류 문제에 대한 조합 전략입니다. 알고리즘의 기본 아이디어는 출력이 가장 많은 클래스를 선택하는 것입니다. 하드 투표는 알고리즘에서 가장 많은 출력을 낸 레이블을 선택하는 것입니다. 라벨의 개수가 같으면 오름차순으로 정렬됩니다. […]
독립적이고 동일하게 분포(IID)한다는 것은 확률 변수 집합의 각 변수의 확률 분포가 동일하고 이러한 확률 변수가 서로 독립적이라는 것을 의미합니다. 확률 변수의 집합이 독립적이고 동일하게 분포한다는 것은 표본 공간에서 각 사건의 확률이 동일하다는 것을 의미하지 않습니다. 예를 들어, 균일하지 않은 주사위를 굴려 나온 결과의 순서는 독립적이고 동일하게 분포되지만, 각 주사위를 굴릴 확률은 [...]
증분 학습이란 새로운 데이터가 추가될 때 새로운 데이터만 업데이트된다는 것을 의미합니다. 증분 학습은 이전에 학습한 지식의 대부분을 보존하면서 새로운 샘플로부터 지속적으로 새로운 지식을 학습할 수 있습니다. 증분 학습은 점진적인 축적과 업데이트 과정인 인간 학습 모델과 유사합니다. 전통적인 학습 방법은 모든 데이터를 미리 준비하는 배치 학습입니다.
지식 기반은 관련 도메인 지식의 수집, 구성 및 추출을 용이하게 하기 위해 지식 관리에 사용되는 특수한 데이터베이스입니다. 데이터베이스에 있는 지식은 해당 분야 전문가로부터 나옵니다. 이는 문제 해결과 관련된 도메인 지식의 모음으로, 기본적인 사실, 규칙 및 기타 관련 정보를 포함합니다. 지식 기반은 체계적이고, 사용하기 쉽고, 사용하기 쉬운 포괄적인 지식 엔지니어링입니다.[…]
K-최근접 이웃 알고리즘(KNN)은 자신에게 가장 가까운 K개의 점에 투표하여 범주형 데이터의 분류를 결정하는 기본적인 분류 및 회귀 알고리즘입니다. KNN의 특징 KNN은 게으른 학습 방법입니다. KNN은 계산 복잡도가 높습니다. K 값이 다르면 분류 결과도 달라집니다.
JS 발산은 두 확률 분포의 유사성을 측정합니다. 이는 KL 발산의 변형을 기반으로 하며 KL 발산의 비대칭 문제를 해결합니다. 일반적으로 JS 발산은 대칭적이며 그 값은 0과 1 사이입니다. 정의는 다음과 같습니다. KL 발산과 JS 발산을 측정 기준으로 사용할 경우 문제가 있습니다. 두 […]
최소 제곱 회귀 트리는 일반적으로 사용되는 회귀 트리 알고리즘입니다. 제곱 오차를 최소화하기 위해서는 각 특징의 값을 차례로 탐색하고 가능한 각 분할 지점의 오차를 계산해야 합니다. 마지막으로, 분할 오류가 가장 작은 지점을 선택하고 입력 공간을 두 부분으로 나눕니다. 위의 단계는 분할이 완료될 때까지 재귀적으로 반복됩니다. 이 방법은 […]
잠재 디리클레 할당(LDA)은 문서 집합 내 각 문서의 주제를 확률 분포 형태로 표현할 수 있는 주제 모델입니다. 또한, 학습을 위해 수동으로 주석이 달린 학습 세트가 필요하지 않은 비지도 학습 알고리즘입니다. 문서 집합과 지정된 주제의 수 K만 필요합니다. 또한 각 주제에 대해 […]
최소 설명 길이 원칙이라고도 하는 최소 설명 길이는 데이터를 저장하기 위한 여러 가설 중에서 가장 큰 데이터 압축 효과를 낼 수 있는 가설이 가장 좋다는 것을 의미합니다. 최소 설명 길이 원칙은 1978년 요르마 리사넨이 도입한 오컴의 면도날을 공식화한 것입니다. 이 원칙의 주요 요점은 다음과 같습니다. […]
메타 러닝은 머신 러닝 실험의 메타데이터에 자동으로 학습 알고리즘을 적용하는 머신 러닝의 하위 분야입니다. 메타러닝의 핵심은 '학습(훈련)' 과정으로, 뉴런이 기존 지식을 잘 활용하여 새로운 작업에 맞게 스스로를 조정할 수 있도록 하는 방법을 연구하는 것입니다. 개략도는 다음과 같습니다. 신경망의 초기 매개변수(파란색 ■ […]
최대 풀링은 값을 최대화하여 데이터 양을 줄이는 일반적으로 사용되는 풀링 작업입니다. 일반적인 동작은 입력 이미지를 여러 개의 직사각형 영역으로 나누고 각 하위 도메인의 최대값을 출력하는 것입니다. 현재 일반적으로 사용되는 풀링 방법에는 최대 풀링과 평균 풀링이 있으며, 이는 상위 은닉층의 복잡한 계산을 줄이고 현재 […]에 영향을 받지 않습니다.
최대 간격은 분류 작업에서 훈련 데이터 간의 거리가 가장 큰 상황을 말합니다. 최대 구간을 만족하는 초평면은 데이터를 양수와 음수 범주로 나눌 수 있으며, 이때 결정 신뢰도가 가장 높습니다. 지원 벡터 머신에는 하드 마진 최대화와 소프트 마진 최대화가 있는데, 둘 다 최대 마진을 찾는 전략입니다.
마르코프 난수장은 마르코프 네트워크라고도 불리며, 무향 그래프로 표현되는 모델입니다. 여기에는 노드 집합이 포함되어 있으며, 각 노드는 단일 변수 또는 변수 그룹에 해당하며 노드 간의 링크는 방향이 없습니다. 마르코프 난수장은 여러 데이터 포인트 중에서 두 포인트 사이에는 관계가 있지만 앞과 뒤 또는 방향 측면에서 명확한 관계가 없는 상황을 설명합니다.
자동 요약은 소프트웨어를 사용하여 텍스트 문서를 줄여서 원본 문서의 주요 내용을 담은 요약을 만드는 과정입니다. 현재는 머신 러닝과 데이터 마이닝 분야에 속하며, 관련 "정보"를 담고 있는 데이터 하위 집합을 찾는 것이 목표입니다. 현재 자동 요약에는 추출과 추상화라는 두 가지 방법이 있습니다. 추출은 원본 텍스트의 단어와 구문을 기반으로 합니다. […]
자동 음성 인식 기술은 사람의 말을 텍스트로 변환하는 기술입니다. 음성 신호의 다양성과 복잡성으로 인해, 현재의 음성 인식 시스템은 특정 제약 하에서만 만족스러운 성능을 달성할 수 있습니다(특정한 경우에만 적용 가능). 자동 음성 인식 정의 자동 음성 인식 기술의 목표는 컴퓨터가 "[…]
자동 인코더는 비지도 학습에서 효율적인 인코딩을 위해 사용되는 인공 신경망으로, 종종 차원 감소를 위해 사용됩니다. 데이터의 압축 및 압축 해제 함수가 손실형이고 샘플로부터 자동으로 학습되는 데이터 압축 알고리즘이기도 하지만, 오토인코더가 언급되는 대부분의 경우 압축 및 압축 해제 함수는 신경망을 통해 학습됩니다 […]
인간의 주의 메커니즘은 직관에 기초합니다. 이는 인간이 제한된 자원을 사용하여 방대한 양의 정보에서 가치 있는 정보를 빠르게 걸러내는 수단입니다. 딥러닝의 주의 메커니즘은 인간의 주의적 사고 모드를 차용한 것으로, 자연어 처리, 이미지 분류, 음성 인식 등 다양한 시나리오에서 널리 사용되어 놀라운 성과를 거두었습니다.
AUC는 ROC 곡선과 좌표축 아래의 면적으로 정의됩니다. ROC 곡선은 y=x 위에 있으므로 AUC 값의 범위는 0.5와 1 사이입니다. AUC는 다양한 분류 모델을 비교할 때 모델의 품질을 나타내는 지표로 사용할 수 있습니다. 그 주요 의미는 AUC […]라는 사실에 있습니다.
헤시안 행렬은 헤시안 행렬 또는 헤시안 행렬이라고도 하며, 다변수 실수 값 함수의 2차 편미분으로 구성된 블록 행렬입니다. 이는 다변수 함수에 대한 2차 미분의 일반화이며, 함수의 극값과 밀접한 관련이 있습니다.
알파-베타 가지치기는 미니맥스 탐색 트리에서 노드 수를 줄이는 데 사용되는 탐색 알고리즘입니다.
적응 공명 이론(ART)은 신경망과 환경 사이에 상호작용이 있을 때 신경망에서 환경 정보의 인코딩이 자발적으로 발생하고, 네트워크가 자체적으로 조직화되어 환경 지식의 인코딩을 생성할 수 있다는 이론적 모델을 말합니다.
ASIC(Application-Specific Integrated Circuit)는 다양한 제품 요구 사항에 맞게 맞춤 제작된 특수 사양을 갖춘 집적 회로입니다. 반면, 비맞춤형은 ASSP(Application-Specific Standard Product) 집적 회로입니다.
지능형 에이전트는 자율적으로 행동할 수 있는 소프트웨어 또는 하드웨어 엔티티를 말합니다. 이는 "대리인", "대리인", "지적인 주체" 등으로 번역되었습니다.
원래 샘플링 방법은 유향 그래프 모델의 기본적인 샘플링 방법으로, 모델이 나타내는 결합 분포로부터 샘플을 생성하는 것을 말하며, 조상 샘플링 방법이라고도 합니다.
하드 투표는 클래스 레이블을 직접 출력하는 투표 방법으로, 주로 분류 머신 러닝 알고리즘에서 사용됩니다. 투표는 앙상블 학습에서 분류 문제에 대한 조합 전략입니다. 알고리즘의 기본 아이디어는 출력이 가장 많은 클래스를 선택하는 것입니다. 하드 투표는 알고리즘에서 가장 많은 출력을 낸 레이블을 선택하는 것입니다. 라벨의 개수가 같으면 오름차순으로 정렬됩니다. […]
독립적이고 동일하게 분포(IID)한다는 것은 확률 변수 집합의 각 변수의 확률 분포가 동일하고 이러한 확률 변수가 서로 독립적이라는 것을 의미합니다. 확률 변수의 집합이 독립적이고 동일하게 분포한다는 것은 표본 공간에서 각 사건의 확률이 동일하다는 것을 의미하지 않습니다. 예를 들어, 균일하지 않은 주사위를 굴려 나온 결과의 순서는 독립적이고 동일하게 분포되지만, 각 주사위를 굴릴 확률은 [...]
증분 학습이란 새로운 데이터가 추가될 때 새로운 데이터만 업데이트된다는 것을 의미합니다. 증분 학습은 이전에 학습한 지식의 대부분을 보존하면서 새로운 샘플로부터 지속적으로 새로운 지식을 학습할 수 있습니다. 증분 학습은 점진적인 축적과 업데이트 과정인 인간 학습 모델과 유사합니다. 전통적인 학습 방법은 모든 데이터를 미리 준비하는 배치 학습입니다.
지식 기반은 관련 도메인 지식의 수집, 구성 및 추출을 용이하게 하기 위해 지식 관리에 사용되는 특수한 데이터베이스입니다. 데이터베이스에 있는 지식은 해당 분야 전문가로부터 나옵니다. 이는 문제 해결과 관련된 도메인 지식의 모음으로, 기본적인 사실, 규칙 및 기타 관련 정보를 포함합니다. 지식 기반은 체계적이고, 사용하기 쉽고, 사용하기 쉬운 포괄적인 지식 엔지니어링입니다.[…]
K-최근접 이웃 알고리즘(KNN)은 자신에게 가장 가까운 K개의 점에 투표하여 범주형 데이터의 분류를 결정하는 기본적인 분류 및 회귀 알고리즘입니다. KNN의 특징 KNN은 게으른 학습 방법입니다. KNN은 계산 복잡도가 높습니다. K 값이 다르면 분류 결과도 달라집니다.
JS 발산은 두 확률 분포의 유사성을 측정합니다. 이는 KL 발산의 변형을 기반으로 하며 KL 발산의 비대칭 문제를 해결합니다. 일반적으로 JS 발산은 대칭적이며 그 값은 0과 1 사이입니다. 정의는 다음과 같습니다. KL 발산과 JS 발산을 측정 기준으로 사용할 경우 문제가 있습니다. 두 […]
최소 제곱 회귀 트리는 일반적으로 사용되는 회귀 트리 알고리즘입니다. 제곱 오차를 최소화하기 위해서는 각 특징의 값을 차례로 탐색하고 가능한 각 분할 지점의 오차를 계산해야 합니다. 마지막으로, 분할 오류가 가장 작은 지점을 선택하고 입력 공간을 두 부분으로 나눕니다. 위의 단계는 분할이 완료될 때까지 재귀적으로 반복됩니다. 이 방법은 […]
잠재 디리클레 할당(LDA)은 문서 집합 내 각 문서의 주제를 확률 분포 형태로 표현할 수 있는 주제 모델입니다. 또한, 학습을 위해 수동으로 주석이 달린 학습 세트가 필요하지 않은 비지도 학습 알고리즘입니다. 문서 집합과 지정된 주제의 수 K만 필요합니다. 또한 각 주제에 대해 […]
최소 설명 길이 원칙이라고도 하는 최소 설명 길이는 데이터를 저장하기 위한 여러 가설 중에서 가장 큰 데이터 압축 효과를 낼 수 있는 가설이 가장 좋다는 것을 의미합니다. 최소 설명 길이 원칙은 1978년 요르마 리사넨이 도입한 오컴의 면도날을 공식화한 것입니다. 이 원칙의 주요 요점은 다음과 같습니다. […]
메타 러닝은 머신 러닝 실험의 메타데이터에 자동으로 학습 알고리즘을 적용하는 머신 러닝의 하위 분야입니다. 메타러닝의 핵심은 '학습(훈련)' 과정으로, 뉴런이 기존 지식을 잘 활용하여 새로운 작업에 맞게 스스로를 조정할 수 있도록 하는 방법을 연구하는 것입니다. 개략도는 다음과 같습니다. 신경망의 초기 매개변수(파란색 ■ […]
최대 풀링은 값을 최대화하여 데이터 양을 줄이는 일반적으로 사용되는 풀링 작업입니다. 일반적인 동작은 입력 이미지를 여러 개의 직사각형 영역으로 나누고 각 하위 도메인의 최대값을 출력하는 것입니다. 현재 일반적으로 사용되는 풀링 방법에는 최대 풀링과 평균 풀링이 있으며, 이는 상위 은닉층의 복잡한 계산을 줄이고 현재 […]에 영향을 받지 않습니다.
최대 간격은 분류 작업에서 훈련 데이터 간의 거리가 가장 큰 상황을 말합니다. 최대 구간을 만족하는 초평면은 데이터를 양수와 음수 범주로 나눌 수 있으며, 이때 결정 신뢰도가 가장 높습니다. 지원 벡터 머신에는 하드 마진 최대화와 소프트 마진 최대화가 있는데, 둘 다 최대 마진을 찾는 전략입니다.
마르코프 난수장은 마르코프 네트워크라고도 불리며, 무향 그래프로 표현되는 모델입니다. 여기에는 노드 집합이 포함되어 있으며, 각 노드는 단일 변수 또는 변수 그룹에 해당하며 노드 간의 링크는 방향이 없습니다. 마르코프 난수장은 여러 데이터 포인트 중에서 두 포인트 사이에는 관계가 있지만 앞과 뒤 또는 방향 측면에서 명확한 관계가 없는 상황을 설명합니다.
자동 요약은 소프트웨어를 사용하여 텍스트 문서를 줄여서 원본 문서의 주요 내용을 담은 요약을 만드는 과정입니다. 현재는 머신 러닝과 데이터 마이닝 분야에 속하며, 관련 "정보"를 담고 있는 데이터 하위 집합을 찾는 것이 목표입니다. 현재 자동 요약에는 추출과 추상화라는 두 가지 방법이 있습니다. 추출은 원본 텍스트의 단어와 구문을 기반으로 합니다. […]
자동 음성 인식 기술은 사람의 말을 텍스트로 변환하는 기술입니다. 음성 신호의 다양성과 복잡성으로 인해, 현재의 음성 인식 시스템은 특정 제약 하에서만 만족스러운 성능을 달성할 수 있습니다(특정한 경우에만 적용 가능). 자동 음성 인식 정의 자동 음성 인식 기술의 목표는 컴퓨터가 "[…]
자동 인코더는 비지도 학습에서 효율적인 인코딩을 위해 사용되는 인공 신경망으로, 종종 차원 감소를 위해 사용됩니다. 데이터의 압축 및 압축 해제 함수가 손실형이고 샘플로부터 자동으로 학습되는 데이터 압축 알고리즘이기도 하지만, 오토인코더가 언급되는 대부분의 경우 압축 및 압축 해제 함수는 신경망을 통해 학습됩니다 […]
인간의 주의 메커니즘은 직관에 기초합니다. 이는 인간이 제한된 자원을 사용하여 방대한 양의 정보에서 가치 있는 정보를 빠르게 걸러내는 수단입니다. 딥러닝의 주의 메커니즘은 인간의 주의적 사고 모드를 차용한 것으로, 자연어 처리, 이미지 분류, 음성 인식 등 다양한 시나리오에서 널리 사용되어 놀라운 성과를 거두었습니다.
AUC는 ROC 곡선과 좌표축 아래의 면적으로 정의됩니다. ROC 곡선은 y=x 위에 있으므로 AUC 값의 범위는 0.5와 1 사이입니다. AUC는 다양한 분류 모델을 비교할 때 모델의 품질을 나타내는 지표로 사용할 수 있습니다. 그 주요 의미는 AUC […]라는 사실에 있습니다.
헤시안 행렬은 헤시안 행렬 또는 헤시안 행렬이라고도 하며, 다변수 실수 값 함수의 2차 편미분으로 구성된 블록 행렬입니다. 이는 다변수 함수에 대한 2차 미분의 일반화이며, 함수의 극값과 밀접한 관련이 있습니다.
알파-베타 가지치기는 미니맥스 탐색 트리에서 노드 수를 줄이는 데 사용되는 탐색 알고리즘입니다.
적응 공명 이론(ART)은 신경망과 환경 사이에 상호작용이 있을 때 신경망에서 환경 정보의 인코딩이 자발적으로 발생하고, 네트워크가 자체적으로 조직화되어 환경 지식의 인코딩을 생성할 수 있다는 이론적 모델을 말합니다.
ASIC(Application-Specific Integrated Circuit)는 다양한 제품 요구 사항에 맞게 맞춤 제작된 특수 사양을 갖춘 집적 회로입니다. 반면, 비맞춤형은 ASSP(Application-Specific Standard Product) 집적 회로입니다.
지능형 에이전트는 자율적으로 행동할 수 있는 소프트웨어 또는 하드웨어 엔티티를 말합니다. 이는 "대리인", "대리인", "지적인 주체" 등으로 번역되었습니다.
원래 샘플링 방법은 유향 그래프 모델의 기본적인 샘플링 방법으로, 모델이 나타내는 결합 분포로부터 샘플을 생성하는 것을 말하며, 조상 샘플링 방법이라고도 합니다.