HyperAI초신경

하이퍼네트워크

하이퍼네트워크는 기존 신경망과 비교했을 때 모델 매개변수화에 몇 가지 차이점이 있는 신경망 구조입니다. Google Brain은 2016년에 "하이퍼네트워크하이퍼네트워크에서 신경망은 다른 신경망의 가중치나 기타 매개변수를 생성하는 데 사용됩니다. 이렇게 생성된 네트워크를 하이퍼네트워크라고 하며, 하이퍼네트워크에 의해 생성된 네트워크를 타겟 네트워크라고 합니다.

일반적으로 HyperNetwork는 대상 네트워크의 입력과 같은 추가 입력을 수신한 다음 대상 네트워크의 매개변수를 생성합니다. 이 접근 방식의 주요 장점은 대상 네트워크 매개변수를 동적으로 생성할 수 있어 모델을 다양한 작업이나 환경에 맞게 더 유연하게 적용할 수 있다는 것입니다.

하이퍼네트워크는 메타러닝, 아키텍처 검색 등의 분야에 잠재적으로 응용될 수 있습니다. 하이퍼네트워크를 사용하면 모델 구조나 매개변수를 자동으로 조정하고 최적화할 수 있어 모델의 일반화 능력과 적응성이 향상됩니다.

안정적 확산의 하이퍼네트워크

HyperNetworks는 Stable Diffusion의 초기 채택자입니다. 새로운 AI 미세조정 기술을 개발했습니다. 이는 Stable Diffusion 모델에 첨부되어 해당 모델의 스타일을 수정하는 작은 신경망입니다.

하이퍼네트워크는 일반적으로 간단한 신경망입니다. 즉, 손실 및 활성화 함수가 있는 완전히 연결된 선형 네트워크입니다. 신경망 입문 과정에서 배운 것과 똑같습니다. 그들은 키 벡터와 쿼리 벡터를 변환하기 위해 두 개의 네트워크를 삽입하여 교차 주의 모듈을 납치합니다. 아래는 원래 모델 아키텍처와 납치된 모델 아키텍처를 비교한 것입니다.

원래 안정 확산 모델의 교차 주의 모듈
HyperNetworks는 키와 값을 변환하기 위해 추가 신경망을 주입합니다.

학습하는 동안 안정적 확산 모델은 잠기지만, 연결된 하이퍼네트워크는 변경될 수 있습니다. 하이퍼네트워크는 작기 때문에 학습이 빠르고 제한된 리소스가 필요합니다. 일반 컴퓨터에서도 훈련이 가능합니다.

참고문헌

【1】하이퍼네트워크

【2】하이퍼네트워크란 무엇이고 알아야 할 하이퍼네트워크는 무엇입니까?