안정적인 가상 카메라는 3D 콘텐츠 생성을 새롭게 정의하고 이미지의 새로운 차원을 열어줍니다. BatteryLife는 배터리 수명을 보다 정확하게 예측하는 데 도움이 됩니다.

디지털 콘텐츠 제작의 치열한 경쟁 속에서 Stability AI는 운명의 갈림길에 서 있습니다. 한때 스테이블 디퓨전으로 이미지 생성에 혁명을 일으켰던 이 회사는 상위 경영진의 문제로 인해 위기에 빠졌습니다. 최근 Stability AI는 Stable Virtual Camera 모델을 출시했습니다. 강력한 타격으로 교착 상태를 깨뜨릴 수 있을지 궁금하네요.
안정적인 가상 카메라는 다중 시점 확산 모델입니다.기존 가상 카메라의 제어 능력과 생성적 AI의 창의성을 결합한 제품입니다. 이 기술은 복잡한 장면 재구성이나 전문적인 기술 없이도 일반적인 2D 이미지를 사실적인 깊이와 관점을 갖춘 3D 비디오로 변환합니다.
기존의 3D 영상 모델과 비교했을 때,이 모델은 많은 수의 입력 이미지나 복잡한 전처리 단계를 필요로 하지 않으므로 3D 콘텐츠 생성이 훨씬 간단하고 실현 가능합니다.그리고 이 기술은 Novel View Synthesis(NVS) 벤치마크에서도 좋은 성과를 보였습니다.성능이 기존 모델보다 뛰어납니다.
현재 HyperAI Super Neural이 온라인 상태입니다. 「안정적인 가상 카메라 이미지를 몇 초 만에 3D 영상으로 변환」튜토리얼, 와서 시도해보세요~
온라인 사용:https://go.hyper.ai/N2u9l
3월 24일부터 3월 28일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼 선택: 3개
* 커뮤니티 게시물 선정 : 3개 게시물
* 인기 백과사전 항목: 5개
* 4월 마감일 상위 컨퍼런스: 10
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
이 데이터 세트는 17,966개의 문자와 29,798개의 실제 대화를 담고 있습니다. 여기에는 캐릭터 개요와 대화만 포함되는 것이 아니라, 줄거리 요약, 캐릭터 경험, 대화 배경 등 풍부한 콘텐츠가 제공됩니다. 더불어 대화 내용은 언어, 행동, 생각의 세 가지 차원을 포괄하여 캐릭터의 연기가 보다 입체적으로 표현됩니다.
직접 사용:https://go.hyper.ai/1WbXV

MV-MATH 데이터 세트에는 2,009개의 고품질 수학 문제가 포함되어 있으며, 이는 객관식 문제, 빈칸 채우기 문제, 다단계 문제라는 세 가지 유형으로 나뉩니다. 데이터 세트에는 여러 개의 시각적 장면이 포함되어 있으며, 각 질문에는 2~8개의 이미지가 포함되어 있습니다. 이러한 이미지는 텍스트와 얽혀 복잡한 다중 시각 장면을 형성하는데, 이는 실제 세계의 수학 문제에 더 가깝고 다중 시각 정보를 처리하는 모델의 추론 능력을 효과적으로 평가할 수 있습니다.
직접 사용:https://go.hyper.ai/tRQsA

이 데이터 세트는 광범위한 공간적 동작을 포함하는 4D 장면 데이터를 도입하여 복잡한 동적 장면에서 기존 4D 재구성 데이터 세트의 빈틈을 메웁니다. 실제 장면(도시 거리, 시골 도로 등)과 가상 장면을 포함하여 장면의 풍부함, 동작의 복잡성, 환경의 다양성 측면에서 탁월하며, 단거리, 중거리, 장거리 이동과 복잡한 동작 궤적을 포괄하는 동시에 맑은 날, 비오는 날, 모래 폭풍 등 다양한 기상 조건을 시뮬레이션합니다.
직접 사용:https://go.hyper.ai/9KszI

4. TacQuad 다중 모드 다중 센서 촉각 데이터 세트
TacQuad는 4가지 유형의 시각 촉각 센서(GelSight Mini, DIGIT, DuraGel 및 Tac3D)에서 수집된 정렬된 다중 모드 다중 센서 촉각 데이터 세트입니다. 텍스트와 시각적 이미지를 활용한 다중 센서 정렬 데이터를 제공함으로써 시각 촉각 센서의 낮은 표준화 문제에 대한 보다 포괄적인 솔루션을 제공합니다. 이를 통해 모델은 의미 수준의 촉각 속성과 센서 독립적 기능을 명확하게 학습하여 데이터 기반 접근 방식을 통해 통합된 다중 센서 표현 공간을 형성할 수 있습니다.
직접 사용:https://go.hyper.ai/uL0Zd

5. 물리적 AI 로봇 및 자율 주행 비디오 데이터 세트
이 데이터 세트는 NVIDIA가 GTC25 컨퍼런스에서 발표한 물리적 AI 데이터 세트입니다. 여기에는 15TB의 데이터, 로봇 훈련을 위한 320,000개 이상의 궤적, SimReady 컬렉션을 포함하여 다양한 유형의 도로와 지리적 환경, 다양한 인프라, 다양한 기상 환경을 포괄하는 최대 1,000개의 일반 장면 설명(OpenUSD) 자산이 포함되어 있습니다.
직접 사용:https://go.hyper.ai/LEHa5

Skyview는 총 12,000개의 이미지와 15개의 다양한 카테고리로 구성된 항공 풍경 분류를 위한 큐레이션된 데이터 세트이며, 각 카테고리에는 256×256픽셀의 해상도를 가진 800개의 고품질 이미지가 포함되어 있습니다. 이 데이터 세트는 공개적으로 사용 가능한 AID와 NWPU-Resisc45 데이터 세트의 이미지를 융합한 것입니다. 이 편집물은 특히 항공 지형 분석 분야에서 컴퓨터 비전 분야의 연구 개발을 촉진하는 것을 목표로 합니다.
직접 사용:https://go.hyper.ai/mne9z

이 데이터 세트는 운전 사고 추론 작업을 위해 특별히 설계된 최초의 데이터 세트이며, 고급 비디오 생성 및 향상 기술을 활용하여 MM-AU 데이터 세트를 확장한 것입니다. 데이터 세트에는 사전 훈련된 Open-Sora 1.2 모델을 미세 조정하여 생성된 2k개의 새로 생성된 자세한 사고 현장 비디오가 포함되어 있으며, 사고 이해 및 예방을 위한 보다 풍부하고 다양한 훈련 데이터를 제공하는 것을 목표로 합니다.
직접 사용:https://go.hyper.ai/gy0mb
8. BatteryLife 배터리 수명 예측 데이터 세트
이 데이터 세트는 원래 배터리 수명 예측 연구를 지원하기 위해 만들어졌습니다. 이 솔루션은 16개의 다양한 데이터 세트를 통합하고 998개의 배터리에서 90,000개 이상의 샘플을 제공하며, 모든 샘플에는 수명 라벨이 붙어 있습니다. BatteryLife 데이터 세트는 이전에 가장 큰 배터리 수명 리소스였던 BatteryML보다 2.4배 더 큽니다.
직접 사용:https://go.hyper.ai/0PzfZ
9. VenusMutHub 단백질 돌연변이 소규모 샘플 데이터 세트
VenusMutHub는 실제 응용 시나리오를 위한 단백질 돌연변이의 최초의 소규모 샘플 데이터 세트입니다. 연구팀은 실제 적용 시나리오를 위해 527개 단백질(그 중 98% 단백질은 5~200개의 돌연변이를 가짐)을 포함하는 905개의 소규모 샘플 실험 돌연변이 데이터 세트를 신중하게 편집했으며, 안정성, 활성, 결합 친화도 및 선택성과 같은 다양한 기능적 측정 데이터를 포함했습니다. 모든 데이터는 대체 형광 판독법이 아닌 직접적인 생화학적 측정법을 사용하여 얻었으므로 평가의 정확성이 보장됩니다.
직접 사용:https://go.hyper.ai/8y20R
10. 새 vs 드론 새와 드론 이미지 분류 데이터 세트
이 데이터 세트에는 Pexel 웹사이트에서 가져온 다양한 이미지 컬렉션이 포함되어 있으며, 움직이는 새와 드론을 표현하고 있습니다. 비디오 프레임에서 이미지를 캡처하고, 분할, 증강 및 사전 처리하여 다양한 환경 조건을 시뮬레이션함으로써 모델 학습 프로세스를 향상시킵니다.
직접 사용:https://go.hyper.ai/RdN4d
선택된 공개 튜토리얼
컴퓨터 비전 분야에서 이미지 디헤이징은 중요한 전처리 작업이며, 특히 자율 주행, 원격 감지 이미지 분석 및 모니터링 시스템에서 중요합니다. 디헤이징은 이미지 품질을 효과적으로 개선하고 대상을 더 선명하게 보이게 할 수 있습니다.
이 프로젝트에서는 이미지 디헤이징을 위해 Retinex 알고리즘을 사용하고 이를 GPU 가속과 결합하여 계산 효율성을 개선합니다. 튜토리얼에 따라 관련 코드를 입력하여 이미지 디헤이징 과정을 완료하세요.
온라인으로 실행:https://go.hyper.ai/wu1fE

2. 안정적인 가상 카메라로 몇 초 만에 이미지를 3D 영상으로 변환
Seva(Stable Virtual Camera)는 Stability AI가 2025년 3월에 출시한 일반 확산 모델입니다. Seva는 입력 뷰와 대상 카메라의 개수에 관계없이 장면의 새로운 뷰를 생성할 수 있습니다. 이 설계는 특정 작업 구성에 의존하지 않으면서도 큰 관점 변화나 시간적으로 매끄러운 샘플을 생성하는 기존 방법의 한계를 극복합니다.
이 모델의 주목할 만한 특징은 추가적인 3D 표현 학습이 필요 없이 높은 수준의 일관된 샘플 생성을 유지할 수 있다는 점입니다. 따라서 실제 응용 프로그램에서 원근 합성 프로세스가 간소화됩니다. 또한, Seva는 최대 30초 길이의 고품질 비디오를 생성하고 원활하게 반복할 수 있습니다. 광범위한 벤치마크 테스트를 통해 Seva가 다양한 데이터 세트와 설정에서 기존 방법보다 우수한 성능을 보인다는 것이 밝혀졌습니다.
이 프로젝트의 관련 모델과 종속성이 배포되었습니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.
온라인으로 실행:https://go.hyper.ai/N2u9l

3. 온라인 튜토리얼 | CSM이 온다. 비켜라! 더욱 생생한 음성 생성, 더 이상 지연되고 지루하며 기계적인 음성은 없습니다.
세서미팀이 출시한 음성 생성 모델 CSM(Conversational Speech Model)은 텍스트와 오디오 입력을 기반으로 유창하고 자연스럽고 감성적인 음성을 출력할 수 있습니다. CSM은 기존 AI 음성 생성 모델과 비교했을 때 감정 이해 능력이 더 뛰어나고, 대화 리듬이 더 자연스럽고, 지연이 거의 없는 실시간 상호작용이 가능하며, 드론 감지도 없습니다.
온라인으로 실행:https://go.hyper.ai/bxOoN

커뮤니티 기사
1. 정확도가 주니어 피부과 의사보다 훨씬 높습니다. 베이징대학교 국제병원 등은 여드름 병변 탐지 및 분류를 위한 딥러닝 알고리즘을 개발했다.
베이징대학 국제병원 팀에서 개발한 AcneDGNet 딥러닝 알고리즘은 여드름 병변을 정확하게 식별하고 그 심각도를 자동으로 판단할 수 있으며, 진단 정확도는 전문 피부과 의사와 비슷합니다. 온라인 상담과 오프라인 진료를 강력하게 지원하여 여드름을 보다 효율적으로 관리하는 데 도움이 됩니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/qAjYK
케임브리지 대학의 연구팀은 AlphaFold-Metainference라는 방법을 제안했습니다. 이 방법은 AlphaFold가 예측한 정렬 오차 맵과 분자 동역학 시뮬레이션의 거리 변화 행렬 간의 상관 관계를 활용하여 무질서한 단백질과 무질서한 영역을 포함하는 단백질의 구조적 집합을 구성하고, 딥 러닝 방법을 기반으로 무질서한 단백질 구조를 예측하기 위한 새로운 아이디어를 제공하며, AlphaFold의 적용 범위를 더욱 확대합니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/6Bbhc
3. 정확도 향상 5.2%, NVIDIA 등 3D 이미지 자동 분할 및 상호작용 구현 위한 다중 모달 의료 이미지 분할 모델 출시
연구에 따르면, 의료 이미지를 장시간 작업한 전문가의 시각 피로로 인해 경계 오류가 최대 12%까지 발생할 수 있다고 합니다. 이 문제를 해결하기 위해 NVIDIA는 최근 다른 연구팀과 협력하여 VISTA3D 다중 모드 의료 이미지 분할 모델을 제안했습니다. 이 모델은 3차원 슈퍼복셀 특징 추출 방법을 개척하였고, 통합 아키텍처를 통해 3차원 자동 분할과 대화형 분할의 협업적 최적화를 달성했습니다. 23개 데이터 세트를 포함하는 포괄적인 벤치마크 테스트에서 기존 최적 전문가 모델과 비교했을 때 세분화 정확도가 5.2% 향상되었습니다. 관련 결과는 arXiv에 사전 인쇄본으로 게시되었습니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/D19LU
인기 백과사전 기사
1. 달-이
2. 상호 정렬 융합 RRF
3. 파레토 전선
4. 대규모 멀티태스크 언어 이해(MMLU)
5. 대조 학습
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!