HyperAI초신경

매니폴드 학습

매니폴드 학습이는 패턴 인식의 기본적인 방법으로, 관찰된 현상에서 사물의 본질을 찾고 데이터를 생성하는 내부 법칙을 발견하는 데 기초합니다.

다양체 학습은 선형 다양체 학습 알고리즘과 비선형 다양체 학습 알고리즘의 두 가지 유형으로 나눌 수 있습니다. 비선형 매니폴드 학습 알고리즘에는 아이소맵, 라플라시안 고유맵, 국소 선형 임베딩이 포함됩니다. 선형 방법에는 주성분 분석과 다차원 스케일링이 포함됩니다.

등각 투영 매핑

Isomap의 목표는 주어진 고차원 매니폴드에 대한 해당 저차원 임베딩을 찾는 것인데, 이를 통해 고차원 매니폴드의 데이터 포인트 간의 이웃 구조가 저차원 임베딩에서 유지될 수 있습니다. Isomap은 미분기하학에서 지오데식 거리를 사용하여 고차원 다양체의 데이터 점 사이의 거리를 계산합니다.

이점:

  • 해결 과정은 선형 대수의 고유값 및 고유 벡터 문제에 의존하며, 이를 통해 결과의 견고성과 전역 최적성이 보장됩니다.
  • 잔차 분산은 기본 저차원 임베딩의 필수 차원을 결정하는 데 사용될 수 있습니다.
  • Isomap 방법은 계산 중에 하나의 매개변수(이웃 매개변수 k 또는 이웃 반경 e)만 결정하면 됩니다.

라플라시안 고유맵

라플라스 고유 사상은 무향 가중 그래프를 사용하여 다양체를 기술한 다음 그래프 임베딩을 사용하여 저차원 표현을 찾습니다. 가장 빠르지만 효과는 상대적으로 만족스럽지 않습니다.

로컬 선형 임베딩

로컬 선형 임베딩은 비선형 차원 축소의 이정표이며, 그 알고리즘은 세 단계로 요약될 수 있습니다.

  • 각 샘플 지점의 k번째 최근접 이웃을 찾습니다.
  • 각 샘플 지점의 로컬 재구성 가중치 행렬은 샘플 지점의 이웃 지점으로부터 계산됩니다.
  • 샘플 지점의 출력 값은 샘플 지점과 그 주변 지점의 로컬 재구성 가중치 행렬을 기반으로 계산됩니다.

주성분 분석

새로운 변수는 원래 변수를 선형적으로 결합하여 얻습니다. 이들 변수 간의 분산이 가장 큽니다. 원래 데이터의 변수들 간의 차이가 크지 않고 설명이 유사하기 때문에 효율성이 낮습니다.

다차원 스케일링

다차원 스케일링 분석은 관찰된 데이터를 더 적은 차원으로 표현하는 것이지만, 쌍을 이루는 샘플 간의 유사성을 사용하여 적절한 저차원 공간을 구성함으로써 샘플과 고차원 공간 간의 유사성이 가능한 한 일관되도록 합니다.

다차원 척도 분석 방법은 다음과 같이 주체, 객체, 기준, 기준 가중치, 주체 가중치라는 5가지 핵심 요소로 구성됩니다.

  • 객체: 평가되는 객체. 이는 여러 가지 범주로 분류될 수 있습니다.
  • 주어: 목적어를 평가하는 단위. 이는 훈련 데이터입니다.
  • 기준: 연구 목적에 따라 스스로 정의한 표준으로, 대상의 질을 평가하는 데 사용됩니다.
  • 기준의 가중치: 피험자는 기준의 중요성을 평가한 후 각 기준에 가중치를 부여합니다.
  • 주제의 가중치: 연구자는 기준의 중요성을 평가한 후 주제에 가중치 값을 부여합니다.