Command Palette

Search for a command to run...

LAB 벤치 언어 모델 생물학 벤치마크 데이터 세트

날짜

일 년 전

크기

241.96 MB

기관

퓨처하우스

논문 URL

arxiv.org

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

최첨단 대규모 언어 모델(LLM)과 LLM 강화 시스템이 광범위한 학문 분야에서 과학적 발견을 빠르게 가속화할 수 있는 잠재력을 가지고 있다는 낙관론이 널리 퍼져 있습니다. 오늘날 교과서에 나오는 과학 문제에 대한 LLM의 지식과 추론 능력을 측정하는 벤치마크는 많지만, 문헌 검색, 프로토콜 계획, 데이터 분석 등 과학 연구에 필요한 실제 과제에서 언어 모델의 성능을 평가하는 데 사용되는 벤치마크는 거의 없습니다.

이러한 벤치마크를 확립하기 위한 첫 단계로 FutureHouse의 연구팀은 2024년에 Language Agent Biology Benchmark(LAB-Bench)를 출시했습니다. 이 데이터 세트에는 문헌 검색 및 추론 기능, 데이터 해석 기능, 데이터베이스 접근 및 탐색 기능, DNA 및 단백질 시퀀스 이해 및 제어 기능 등 다양한 실용적인 생물학 연구 기능에서 인공 지능 시스템의 성능을 평가하기 위한 2,400개 이상의 객관식 문제가 포함되어 있습니다. 관련 논문 결과는 다음과 같습니다.LAB-Bench: 생물학 연구를 위한 언어 모델의 기능 측정"

LAB-Bench.torrent
시딩 1다운로드 중 0완료됨 165총 다운로드 횟수 329
  • LAB-Bench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • lab-bench.zip
          241.96 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
LAB 벤치 언어 모델 생물학 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경