HyperAIHyperAI

Command Palette

Search for a command to run...

KV 캐시

날짜

2년 전

KV 캐시는 키-값 캐시의 약자로, 대규모 모델의 추론 성능을 최적화하는 데 일반적으로 사용되는 기술입니다. 이 기술은 계산 정확도에 영향을 주지 않고 공간을 시간으로 교환하여 추론 성능을 향상시킬 수 있습니다. KV 캐시는 Transformer 추론 성능을 최적화하는 데 중요한 엔지니어링 기술입니다.모든 주요 추론 프레임워크는 이를 구현하고 캡슐화했습니다(예를 들어, transformers 라이브러리의 generate 함수는 이를 캡슐화했으며, 사용자는 past_key_values를 수동으로 전달할 필요가 없습니다). 또한 이 기능은 기본적으로 활성화되어 있습니다(config.json 파일에서 use_cache=True).

참고문헌

【1】https://zhuanlan.zhihu.com/p/630832593

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
KV 캐시 | Wiki | HyperAI초신경