Command Palette
Search for a command to run...
원스톱 단백질 제로샷 돌연변이 예측/기능 예측, 단백질 엔지니어링 워크벤치 VenusFactory는 풀스택 개발을 가능하게 합니다.

AI의 설계 효율성 향상은 단백질 설계 분야의 기존 연구 패러다임을 변화시키고 있습니다. 기존 단백질 설계 실험과 비교했을 때, 대규모 AI 모델은 단백질 서열, 구조, 기능을 훨씬 짧은 시간 안에 예측하고 스크리닝할 수 있을 뿐만 아니라, 물리적, 화학적 원리와 데이터 패턴을 기반으로 자연에서 발견되지 않는 새로운 단백질을 설계할 수 있습니다. 멀티태스크 학습 및 딥러닝 모델을 통해 안정성, 결합 친화도, 반응 속도와 같은 단백질 특성을 동시에 예측할 수도 있습니다.
하지만,모델의 복잡한 계산 프레임워크와 거대한 단백질 데이터베이스는 AI 도구를 사용하는 데 필요한 기준을 높였습니다.한편, 단백질 설계 분야는 생물학적 데이터에 의존하기 때문에 연구자들이 여러 데이터베이스에서 데이터를 검색, 다운로드, 컴파일 및 변환해야 하므로 상당한 시간이 소요됩니다. 다른 한편, 단백질 AI 모델은 현재 특정 분야의 개별 과제만 해결할 수 있으며, 권위 있는 벤치마크 데이터를 기반으로 하는 평가 시스템이 부족합니다.
또한 AI 단백질 설계의 과제에 대해 상하이 교통대학교 홍량 교수 연구팀의 탄 양 박사는 단백질 설계 분야의 기존 AI 모델은 데이터 수집과 포맷 통일에 어려움이 있을 뿐만 아니라 매개변수 조정에 어려움이 있고 학습 속도가 느리다는 단점이 있다고 소개했습니다."데이터 장벽, 모델 장벽, 응용 프로그램 장벽"으로 인한 장애물은 더 광범위한 과학 연구 커뮤니티에서 AI 도구의 대중화와 적용을 방해했습니다.
동시에, 기존 솔루션과 관련하여 웹 서버는 간단하고 사용하기 쉽지만, 기능이 제한적이고, 개별 데이터 기반 학습이 불가능하며, 지능도 제한적입니다. 에이전트는 인간의 개입을 줄이고, 결과 목표에 직접 집중하며, 하나 이상의 작업 단위를 자율적으로 완료할 수 있습니다.
단백질 공학 분야에서 인공지능의 광범위한 적용을 촉진하기 위해,상하이 교통대학의 홍량 교수 연구팀은 원스톱 오픈소스 단백질 엔지니어링 워크벤치인 VenusFactory를 개발했습니다.이 플랫폼은 생물학적 데이터 검색, 표준화된 작업 벤치마킹, 그리고 사전 훈련된 단백질 언어 모델(PLM)을 통합합니다. 이 플랫폼은 웹 서버와 에이전트의 두 가지 기능을 결합합니다.
* 개인 데이터 세트를 사용하여 AI 모델의 0코드 사용자 정의를 구현하고 명령줄 실행과 Gradio 기반 코드리스 인터페이스를 지원합니다.
* 30개 이상의 대규모 모델 평가 벤치마크 데이터 세트에 대한 오픈 소스 다운로드를 제공하고, 40개 이상의 단백질 관련 데이터 세트와 40개 이상의 인기 있는 PLM을 통합하며, 단백질 데이터에 쉽게 연결합니다.
* 제로 샘플 돌연변이 예측을 달성하고, 수요에 따라 돌연변이를 추천하기 위해 AI 모델을 자동으로 결합하고, 대상 통합 AI 모델을 통해 속성을 예측하기 위해 감독 예측 모듈을 통합할 수 있습니다.
현재,VenusFactory 단백질 공학 설계 플랫폼은 이제 HyperAI 공식 웹사이트(hyper.ai)의 튜토리얼 섹션에서 이용할 수 있습니다. VenusFactory 플랫폼 튜토리얼은 7개의 기능 모듈을 다루며, 한 번의 클릭으로 배포하여 온라인에서 체험할 수 있습니다.
* 학습: 제로코드 모델 학습, 40개 이상의 대규모 모델 지원, 비공개 데이터 세트를 사용하여 자체 모델을 학습합니다.
* 평가: 단백질 모델의 포괄적인 성능 평가를 위한 사용하기 쉬운 도구입니다.
* 예측: 훈련된 모델을 사용하여 새로운 단백질 서열의 기능을 예측합니다.
* 빠른 도구: 사용하기 쉬운 버전으로, 제로 샘플 돌연변이 예측(지시적 진화)과 지도 예측(기능 또는 속성 예측)을 지원합니다.
* 고급 도구: 제로 샘플 돌연변이 예측(지시적 진화) 및 지도 예측(기능 또는 속성 예측)을 지원하는 고급 사용자 정의 버전입니다.
* 다운로드: 단백질 데이터에 쉽게 연결하고 주요 주류 데이터베이스(RCSB, UniProt 등)의 멀티스레드 다운로드를 지원합니다.
* VenusAgent: DeepSeek과 함께 작동하여 AI 단백질 계산을 가능하게 하는 단백질 엔지니어링 에이전트입니다.
튜토리얼 링크:
또한, 신규 사용자를 위해 깜짝 컴퓨팅 리소스 혜택을 준비했습니다."VenusFactory" 초대 코드로 등록하시면 듀얼 SIM A6000 사용 시간을 2시간 동안 받으실 수 있습니다(리소스 유효 기간은 1개월입니다).수량이 한정되어 있으니 놓치지 마세요!
데모 실행
1. 브라우저에 URL hyper.ai를 입력하세요. 홈페이지에 접속하면 "튜토리얼" 페이지를 클릭하고, "VenusFactory 단백질 공학 플랫폼"을 선택한 후 "이 튜토리얼을 온라인으로 실행"을 클릭하세요.


2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

3. NVIDIA GeForce RTX 4090-2 및 PyTorch 이미지를 선택하고 "계속"을 클릭하세요. OpenBayes 플랫폼은 사용량 기반 요금제 또는 일일/주간/월간 요금제 등 네 가지 결제 옵션을 제공합니다. 신규 사용자는 아래 초대 링크를 통해 등록하시면 RTX 4090 4시간과 CPU 5시간 무료 이용권을 받으실 수 있습니다!
HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. 리소스가 할당될 때까지 기다리세요. 첫 번째 복제 프로세스는 약 2분 정도 소요됩니다. 상태가 "실행 중"으로 변경되면 "API 주소" 옆의 화살표를 클릭하여 데모 페이지로 이동하세요.모델이 크기 때문에 WebUI 인터페이스를 표시하는 데 약 3분이 걸리며, 그렇지 않으면 "잘못된 게이트웨이"가 표시됩니다.API 주소 접근 기능을 이용하기 위해서는 이용자는 실명인증을 완료해야 합니다.

효과 시연
다음은 VenusFactory 사용 페이지입니다. "수동"을 클릭하면 학습 모듈, 예측 모듈, 평가 모듈 및 다운로드 모듈의 사용 설명서를 직접 볼 수 있습니다.

교육 모듈 디스플레이
"모델 학습 및 예측 학습" 모듈에서 "학습" 모듈을 클릭합니다.
* 단백질 언어 모델 선택
* 데이터셋 선택
* 데이터셋 미리보기
* 훈련 방법 구성(자세한 내용은 사용자 가이드 참조)
* 일괄 구성(자세한 내용은 사용자 가이드 참조)

학습 모델 저장 경로를 설정하고 "학습 시작"을 클릭하여 학습을 시작하세요.

이 시점에서 훈련 매개변수와 손실 곡선을 볼 수 있습니다.

사용자 정의 데이터 세트를 사용하려면 사용자 정의 데이터 세트 구성을 사용할 수 있습니다. 데이터 세트 경로를 입력하기만 하면 됩니다(자세한 내용은 매뉴얼 문서를 참조하세요).
평가 모듈 디스플레이
"모델 학습 및 예측 학습" 모듈에서 "평가" 모듈을 클릭합니다.

일괄 구성, "평가 시작"을 클릭하여 학습을 시작하세요.

평가 결과는 다음과 같으며, CSV 파일을 다운로드할 수 있습니다.

사용자 정의 데이터 세트를 사용하려면 사용자 정의 데이터 세트 구성을 사용할 수 있습니다. 데이터 세트 경로를 입력하기만 하면 됩니다(자세한 내용은 매뉴얼 문서를 참조하세요).
예측 모듈 디스플레이
"모델 학습 및 예측 학습" 모듈에서 "예측" 모듈을 클릭하고 학습 모델 저장 경로를 설정하고, 단백질 언어 모델을 선택한 후 "예측 시작"을 클릭하여 학습을 시작합니다.
단일 시퀀스 예측을 예로 들어 보겠습니다.

단백질 서열 예시: MKTWFGHVLQ

비너스에이전트 쇼케이스
VenusAgent 모듈을 클릭합니다.

VenusAgent는 DeepSeek 대용량 모델을 필요로 하므로, 이 튜토리얼에서는 API 키를 직접 입력하거나 플랫폼에 배포된 DeepSeek-R1-70B 모델을 사용하는 두 가지 호출 방법을 제공합니다. 필요한 기능에 따라 다양한 그래픽 카드 환경을 선택할 수 있습니다. 카드 선택 지침은 다음과 같습니다.
* 단일 RTX 4090 그래픽 카드를 사용하는 경우, VenusAgent 기능은 로컬에 배포된 대규모 모델 서비스를 사용할 수 없습니다(DeepSeek API 키 사용은 무제한임).
* RTX 4090 그래픽 카드를 두 개 사용하시는 경우, VenusAgent 기능 사용 후 바로(1~2분 후) 다른 기능을 사용하실 수 없습니다. (DeepSeek API Key를 사용하시는 경우에는 제한이 없습니다.)
* RTX A6000 그래픽 카드를 두 개 사용하는 경우 VenusAgent 기능은 무제한입니다.
* 사용자는 DeepSeek API 키를 입력할 수 있습니다. 입력하지 않을 경우, 기본적으로 튜토리얼에서 로컬로 배포된 대규모 모델 서비스를 사용합니다. 로컬 대규모 모델 서비스를 사용할 경우 첫 번째 대화의 응답 시간은 약 2~3분입니다. 잠시 기다려 주시기 바랍니다.
위의 내용은 "VenusFactory 단백질 공학 설계 플랫폼"을 사용하는 방법에 대한 자세한 튜토리얼입니다. 누구나 와서 체험해 볼 수 있습니다!
튜토리얼 링크:
2023년부터 2024년까지 AI4S 분야의 고품질 논문과 심층 해석 기사를 클릭 한 번으로 받아보세요⬇️
