포옹 얼굴을 비교하시나요? GitHub Models에 OpenAI O1/llama 3.2 등이 추가되고 새로운 기능이 모델의 병렬 비교를 지원합니다.

주커버그는 Llama 3.1이 출시되었을 때 긴 글을 써서 오픈 소스의 중요성을 설명하면서 "오픈 소스는 전 세계의 더 많은 사람들이 AI 개발로부터 혜택을 받고 기회를 얻을 수 있도록 보장할 수 있습니다."라고 말했습니다.실제로 최근 몇 년 동안 AI가 급속히 발전함에 따라 오픈 소스의 인기도 계속해서 상승하고 있습니다. 오픈소스 커뮤니티에 대한 개발자들의 기여는 그들의 개인적인 기술적 태도를 나타낼 뿐만 아니라, 어느 정도 최첨단 기술 탐구에서 이룬 업적을 보여주기도 합니다.
이 과정에서 두 개의 주요 오픈소스 프로젝트 호스팅 플랫폼인 GitHub과 Hugging Face도 급속한 성장을 이루었습니다.
2023년 GitHub는 플랫폼 사용자 수가 1억 명에 도달했다고 발표하며 세계 최대 오픈소스 코드 호스팅 플랫폼이 되었습니다..GitHub가 0에서 1억으로 성장하는 데 걸린 시간은 15년이었습니다.허깅페이스는 2개월 전 사용자 수가 500만 명에 도달했다고 발표했습니다.허깅페이스가 이러한 도약을 이루는 데 걸린 시간은 8년이었습니다.

현재 Hugging Face는 NLP, 컴퓨터 비전, 음성, 시계열, 생물학, 강화 학습 등의 분야를 망라하여 107만 개 이상의 사전 학습된 모델과 234,000개의 데이터 세트를 공유하고 있으며, "머신 러닝 분야의 GitHub"으로 알려져 있습니다.
떠오르는 스타인 Hugging Face의 총 사용자 수는 GitHub만큼 많지는 않지만, 대형 모델의 추진력과 그에 못지않게 풍부한 오픈 소스 리소스에 의존하면서 최근 몇 년 동안 멈추지 않고 성장해 왔습니다. 이로 인해 네티즌들은 불가피하게 AI의 급속한 발전에 직면하여 Hugging Face가 점차 GitHub를 대체하고 개발자들이 더 선호하는 모임 장소가 되지 않을까 하는 추측을 하게 됩니다. 일찍이 시작되어 사용자 기반이 강력한 오픈소스 프로젝트 호스팅 플랫폼인 GitHub은 어떻게 대응할까요?
방금 마무리된 GitHub Universe 2024에서 GitHub CEO Thomas Dohmke가 발표한 일련의 새로운 개발 사항이 이 질문에 답할 수 있습니다.GitHub 모델을 이제 사용할 수 있습니다.,새로운 모델이 추가되었습니다: OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5 등.

벤치마킹 모델 허브? GitHub Models에 새로운 기능이 추가되었습니다.
우리 모두 알고 있듯이, 허깅 페이스는 글로벌 오픈 소스 대형 모델 유통 센터가 되었습니다. 또한, Spaces 섹션에서 제공하는 독창적인 경험은 개발자에게 큰 편의성을 제공합니다. 구체적으로,허깅 페이스는 2020년 초에 모델 허브를 출시했습니다.이는 개방형 AI 모델 공유 플랫폼입니다.사용자는 다양한 NLP 모델을 업로드, 공유, 다운로드할 수 있어 AI 모델의 재사용 및 확장이 크게 촉진되고, 점차 AI 개발자를 위한 "ML 모델의 GitHub"가 되어가고 있습니다. 이 플랫폼에는 현재 1,076,375개의 오픈 소스 모델이 있습니다(본 기사 작성 시점 기준).
이와 대조적으로 GitHub은 오픈소스 AI 모델을 통합하는 데 다소 느렸으며, 올해 8월에야 GitHub 모델 섹션을 출시했습니다.당시 목표는 개발 작업을 단순화하고, AI 애플리케이션 개발에 대한 문턱을 낮추고, 모든 개발자가 적절한 도구와 교육을 통해 AI 엔지니어가 될 수 있도록 하는 것이었습니다.
이제 3개월 만에 GitHub Models가 공식적으로 오픈되었고 일련의 업데이트와 업그레이드를 거쳤습니다. 개발자는 플레이그라운드, API 및 기타 방법을 통해 AI 모델에 액세스할 수 있습니다.
첫째, 새로운 기능은 다음과 같습니다.
* 배포 프로세스 간소화 - Azure 프로덕션 키를 사용하면 개발 환경에서 프로덕션 환경으로 애플리케이션을 빠르게 이동할 수 있습니다.
* 프롬프트, 매개변수 및 메시지를 실시간으로 저장하기 위해 새로운 모델 사전 설정이 추가되었습니다.
* 다중 모달 지원 기능이 추가되어 운영 시나리오에서 다중 모달 기능을 갖춘 모델에 대한 이미지 지원을 제공할 수 있습니다.
* 동일한 프롬프트에 대한 두 모델의 출력을 실시간으로 비교할 수 있는 나란히 비교 기능이 추가되었습니다.

두 번째는 모델 확장으로 OpenAI o1, Meta Llama 3.2, Microsoft Phi 3.5, Cohere Command R 시리즈 08-2024, A21 Jamba 1.5를 추가합니다.원래의 Llama 3.1, GPT-4o, Phi 3, Mistral Large 2 및 기타 모델을 포함하여 현재 개발자가 시도해 볼 수 있는 총 35개의 모델이 포함되어 있습니다. 마찬가지로 GitHub은 사용자에게 글라이드 패스를 제공하는데, 이를 통해 사용자는 Codespaces와 VS Code 개발자 환경에서 개발할 수 있습니다.

요약하자면, Hugging Face의 Model Hub와 GitHub Models는 모두 개발자에게 최첨단 오픈소스 모델을 빠르게 경험할 수 있는 플랫폼을 제공합니다. 그러나 GitHub은 현재 대형 기술 기업의 오픈소스 기반 모델을 타겟으로 삼고 있으며, 자사 플랫폼에 오픈소스로 공개된 다른 고품질 모델을 아직 고려하지 않고 있습니다. 이와 대조적으로 Hugging Face는 모델 수와 다루는 응용 분야 측면에서 GitHub보다 훨씬 우수합니다.
연구자들의 작업 진행을 더욱 가속화하기 위해서는 다음과 같은 점을 언급할 가치가 있습니다.Hugging Face와 arXiv는 플랫폼 장벽을 '돌파'합니다. arXiv 페이지의 "코드, 데이터, 미디어" 탭 아래에 있는 Hugging Face 버튼을 켜면, 한 번의 클릭으로 관련 Hugging Face 논문, 모델 및 데이터 세트로 바로 이동할 수 있습니다.이러한 움직임은 해당 플랫폼의 사용자 수 증가에 더욱 기여할 것으로 보인다.
GitHub에서 탄생한 이 플랫폼이 "소프트웨어 2.0" 시대의 GitHub이 될까요?
오픈소스 커뮤니티의 "선구자"로서 GitHub의 사용자 기반이 Hugging Face에 비해 훨씬 유리하다는 것은 의심의 여지가 없습니다.GitHub Universe 2024에서 현재 1억 명이 넘는 사용자가 있다고 밝혔습니다. 특히 올해는 전 세계 개발자들이 GitHub의 오픈소스 및 공개 저장소에 10억 건에 가까운 기여를 했습니다.

두 플랫폼의 개발 역사를 돌이켜보면, 그 안에도 이야기가 가득하다.
GitHub은 2008년에 톰 프레스턴-워너, 크리스 완스트랫, PJ 하이엣, 스콧 차콘이라는 4명의 프로그래머에 의해 설립되었습니다.아마도 창립자가 순수 프로그래머이고 회사 경영 경험이 부족했기 때문에 2016년에 GitHub은 플랫폼의 혼란스러운 운영에 대해 불평하는 여러 사람으로부터 공동 항의 편지를 받았을 것입니다. 2년 후, 마이크로소프트는 75억 달러에 GitHub를 인수한다고 발표했는데, 이를 통해 추가적인 리소스를 확보하고 전략적 방향을 결정하게 되었습니다. 그 이후로 GitHub은 꾸준한 개발 단계에 들어섰습니다.
그 사이, 허깅 페이스도 출발 준비가 됐다.
2016년 클레망 들랑그는 줄리앙 쇼몽과 토마스 울프와 함께 허깅 페이스를 창립했습니다.이 회사는 원래 대화형 로봇을 개발했지만 당시 비슷한 일을 하던 많은 스타트업과 마찬가지로 결국 시작도 못 했습니다. 2019년, 마이크로소프트가 GitHub을 인수한 첫 해에 Hugging Face는 반전을 경험했습니다.
챗봇의 NLP(자연어 처리) 기능을 훈련하기 위해 Hugging Face는 GitHub에 Transformers 라이브러리를 오픈 소스로 공개했습니다. 이 오픈소스 프로젝트는 머신러닝 커뮤니티에서 빠르게 인기를 얻었고 GitHub 역사상 가장 빠르게 성장하는 AI 프로젝트가 되었습니다.
2020년에 Hugging Face는 오픈 AI 모델 공유 플랫폼인 Model Hub와 대규모 오픈 소스 데이터 세트 관리 도구인 Datasets 라이브러리를 출시했습니다. 2021년 Hugging Face는 Spaces를 출시하여 사용자가 Streamlit 및 Gradio와 같은 도구를 통해 AI 모델을 배포하고 표시할 수 있게 했습니다.
현재, 허깅페이스는 가장 빠르게 성장하는 커뮤니티이자 가장 널리 사용되는 머신러닝 플랫폼이 되었습니다.당시 회사 CEO였던 클레망 델랑그는 한 인터뷰에서 AI가 소프트웨어의 새로운 패러다임, 즉 "소프트웨어 2.0"이라고 말한 적이 있으며, AI 분야의 유명 연구자인 안드레이 카르파티도 이러한 견해를 인정했습니다.
그는 한때 이렇게 썼습니다.전통적인 수동 프로그래밍은 "소프트웨어 1.0"에 속하며, GitHub은 매우 성공적인 "소프트웨어 1.0" 코드 센터입니다."소프트웨어 2.0" 시대는 신경망을 사용하여 프로그래밍될 것이며, 이러한 전환 과정에서 GitHub과 같은 중량급 플랫폼이 등장할 것입니다.허깅페이스는 "소프트웨어 2.0" 시대의 GitHub가 되기를 열망합니다.
명예와 부를 동시에 얻는 GitHub과 Hugging Face의 수익 모델 비교
1+1>2의 효과는 GitHub에서 검증되었습니다. Microsoft에 인수된 후, 많은 개발자들은 GitHub이 오픈 소스로 계속 유지될 수 있을지에 대한 우려를 표명했습니다. 하지만 사실은 그렇지 않으며, GitHub은 여전히 개발자 중심 플랫폼이 되는 데 집중하고 있습니다.
관련 언론 보도에 따르면, 마이크로소프트가 2018년에 GitHub를 인수했을 당시 GitHub의 연간 반복 수익(ARR)은 2억~3억 달러에 불과했습니다. 2022년에 GitHub의 ARR은 10억 달러로 증가했습니다. 업계에서는 2023년에 GitHub의 ARR이 14억 달러에 이를 것으로 예측했지만, 관계자는 구체적인 수치를 공개하지 않았습니다.
현재 GitHub은 비교적 완전한 수익 모델을 형성했으며, 그 수익 방법은 주로 다음 세 가지 유형으로 구성됩니다.구독 플랜과 유료 서비스, 엔터프라이즈 서비스와 마켓플레이스 서비스 중에서 엔터프라이즈 서비스는 GitHub의 가장 큰 수익원입니다.
Hugging Face의 수익 모델은 GitHub와 유사하며, 유료 프로젝트도 다음과 같은 세 가지 유형으로 구성됩니다.유료 멤버십, 데이터 호스팅 및 엔터프라이즈 서비스.

하지만 Hugging Face는 GitHub과 달리 큰 트리에 의존하지 않고 주로 외부 투자에 의존하기 때문에 투자자로부터 수익 압박을 받을 수도 있습니다. 2021년 이전까지 허깅페이스는 수입이 전혀 없었고, 커뮤니티를 정상적으로 운영하기 위해 투자자들의 돈을 "소각"하는 것에 전적으로 의존했습니다. 허깅페이스는 2021년 이후에야 상용화를 모색하고 수익화 단계에 들어갔습니다. 포브스에 따르면, 이 회사는 2021년에 1,000만 달러의 매출을 올렸고, 현재 연 매출은 3,000만 달러에서 5,000만 달러 사이입니다.
올해 7월, HuggingFace의 공동 창립자이자 CEO인 클레멘트 델랑그는 소셜 네트워크에서 플랫폼의 수익성을 발표하고 팀의 220명 멤버를 축하했습니다.

작년 8월 23일, 허깅페이스는 2억 3,500만 달러 규모의 시리즈 D 펀딩 라운드(현재 약 16억 7,500만 위안)를 완료했고, 기업 가치는 45억 달러(현재 약 320억 8,800만 위안)에 달했습니다.투자자에는 Google, Amazon, Nvidia, Salesforce, AMD, Intel, IBM, Qualcomm 등이 포함되며, 이는 스타급 인재로 가득한 목록입니다. 이는 또한 업계가 허깅페이스의 개발 잠재력을 어느 정도 인식하고 있음을 보여줍니다.
AI 개발자들이 가장 큰 수혜자가 될 수도
GitHub이 연례 행사를 개최하는 동안 Hugging Face도 한가하지 않았다는 점은 언급할 가치가 있습니다. 공동 창립자인 클레망 델랑그는 소셜 미디어를 통해 10월 30일(태평양 일광 절약 시간)에 "Enterprise Hugging Face hub" 컨퍼런스를 개최할 것이라고 발표했지만, GitHub보다 늦습니다. 이에 대해 사람들은 허깅페이스가 이번에는 어떤 반응을 보일지 궁금해합니다.

참고문헌:
1.https://originality.ai/blog/huggingface-statistics
2.https://karpathy.medium.com/software-2-0-a64152b37c35
3.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
4.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA
5.https://www.shidaox.com/observation/440.html
6.https://github.blog/news-insights/octoverse/octoverse-2024/