Command Palette

Search for a command to run...

건설적 보안 정렬(CSA)

날짜

4일 전

기관

난양 이공대학교
복단대학교
칭화대학교

논문 URL

2509.01909

건설적 안전 정렬(CSA)은 알리바바 그룹 보안 부서와 칭화대학교를 비롯한 여러 대학이 2025년 9월 공동으로 제안했습니다. 관련 연구 결과는 논문 "[…]"에 게재되었습니다.Oyster-I: 거부를 넘어 – 책임 있는 언어 모델을 위한 건설적 안전 정렬".

대규모 언어 모델(LLM)은 일반적으로 유해 콘텐츠 생성을 방지하기 위해 보안 메커니즘을 구축합니다. CSA(콘텐츠 안전)는 악의적인 남용을 방지할 뿐만 아니라 악의적이지 않은 사용자를 안전하고 유익한 결과로 이끌기 위해 적극적으로 안내합니다. CSA는 수동적인 방어와 전면적인 거부를 넘어, 선제적이고 안전하며 유익한 안내를 제공하며, 보안을 이중적인 책임으로 간주합니다. 즉, 피해를 방지하는 것뿐만 아니라 사용자가 합법적이고 신뢰할 수 있는 해결책을 찾을 수 있도록 돕는 것입니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp