Hugging Face 擁抱面的 Datasets 數據集 (2024)

Hugging Face (擁抱臉)是一個人工智慧平台,使用者可以在其中協作開展機器學習專案。它託管一個用於訓練和部署模型的開源平台。擁有超過20萬個模型,涵蓋電腦視覺、自然語言處理等各個領域。

在這篇文章中,我們將分享您需要了解更多有關 Hugging Face 的所有重要統計數據。

在我們跳到 Hugging Face 的關鍵統計數據之前,這裡有一個您不應錯過的 Hugging Face 的快速歷史。

什麼是 Hugging Face,誰建造的,為什麼,以及何時建造的

Hugging Face是一家總部位於紐約市的法裔美國公司,由法國企業家Clément DelangueJulien ChaumondThomas Wolf於 2016 年創立

最初,該公司開發了一款針對青少年的聊天機器人應用程序,然後在開源聊天機器人模型後轉型為機器學習平台。

該公司的平台 Hugging Face Hub 充當協作空間,使用者可以使用開源程式碼開發、訓練和部署 NLP 和 ML 模型。

Hugging Face 透過提供預先訓練的模型來簡化模型開發,使用者可以針對特定任務進行微調,從而使 AI 民主化並使開發人員更容易使用它。

它透過 Hugging Face Datasets 庫提供使用者友善的文字預處理標記器和龐大的 NLP 資料集儲存庫,為資料科學家、研究人員和 ML 工程師的專案提供支援。

此外,Hugging Face 以其專為自然語言處理應用程式量身定制的 Transformer 庫而聞名。

主要擁抱臉部統計數據一覽

  • 託管超過100 萬個模型、資料集和應用程式。一般來說,它有 35 萬個模型、7.5 萬個資料集和 15 萬個演示應用程式。 (來源
  • 2023年完成2.35億美元D輪投資,估值達45億美元。 (來源
  • 自 2016 年以來的六輪融資籌集資金總額為3.952 億美元。 (來源
  • 2021 年收入低於1000 萬美元,預計 2023 年收入為30 至 5000 萬美元。 (來源
  • 被超過10,000 家公司用於人工智慧和機器學習開發。 (來源
  • 發布BLOOM,1760億參數語言模型。 (來源
  • 擁有超過1,000位付費客戶,包括英特爾、輝瑞和彭博。 (來源
  • 與 H2O.ai、spaCy 直接競爭,與 OpenAI 間接競爭。 (來源
  • Transformers 庫在 GitHub 上擁有超過100,000 顆星。 (來源
  • 網站每月瀏覽量為1890 萬次。 (來源
  • 75.25%的網站訪客為男性;24.75%為女性。 (來源
  • 25-34歲年齡層用戶群的36.87% 。 (來源
  • 託管超過300k 模型、250k 資料集250k 空間
  • 截至 2023 年,員工人數從 2021 年的 30 名增加到 170 名。(資料來源
  • Hugging Face Pro 售價為25 美元/月。 (來源
  • 「其他」類別中最大的模型貢獻:129,157 個模型
  • IBM 貢獻了200 多個開放模型和資料集。 (來源
  • 假新聞偵測器模型的準確率高達95%。 (來源

 

擁抱臉意味著什麼,為什麼他們使用表情符號?

選擇「擁抱臉」是因為創辦人希望成為第一家以表情符號而非傳統的三字母股票符號上市的公司。

擁抱臉標誌

他們選擇擁抱臉部表情符號,因為這是他們最喜歡的表情符號,他們認為這對他們的公司來說是一個令人難忘且獨特的名稱。

嗯,一切進展順利,Hugging Face 社群已經接受了這個名字,它已經成為機器學習和資料科學領域的知名品牌。

網站流量和使用者人口統計

擁抱臉能吸引多少網站流量?

Hugging Face是著名的人工智慧平台和社區,近期流量保持穩定。

2024年1月,該網站吸引了2881萬次訪問,用戶平均每次訪問時間為10分39秒。不過,與 11 月相比,流量略有下降,達-19.5%。

Huggingface網站流量統計
資料來源:塞姆拉什

Hugging Face 的主要受眾集中在美國,在俄羅斯、印度、日本和印尼也有大量追隨者。

美國的「huggingface」國家流量很高
資料來源:塞姆拉什

該網站的流量在設備使用方面存在差異,桌上型電腦佔訪問量的 68.03%,其次是行動裝置(佔 31.97%)和平板電腦(佔 7.22%)。(有關設備使用情況的一些數據有所不同;但是,桌上型設備的使用情況約為 70-75%。)

設備使用情況
資料來源:SimilarWeb

從行銷管道來看,直接流量佔比最大,為45.06%,其次是自然搜索,佔比為28.67%。推薦、社群媒體、展示廣告和付費搜尋構成了網站其餘的流量來源。

行銷管道統計 Hugingface

抱臉的用戶群有哪些?

Hugging Face 吸引了多元化的用戶群,主要包括人工智慧研究人員、資料科學家和開發人員。

截至2023年,該平台擁有超過120萬名註冊用戶,其中男性佔75.25%,女性佔24.75%。

大多數用戶集中在25-34歲年齡段,佔用戶群的36.87%,緊隨其後的是18-24歲用戶,佔比為28.26%。整體而言,18-44歲的用戶佔平台用戶的83.03%。

擁抱臉的年齡分佈

擁抱臉的活躍付費用戶

Hugging Face 擁有超過1,000 名活躍付費用戶,其中包括英特爾、輝瑞、彭博社和 eBay 等知名公司。到 2025 年,Hugging Face 預計活躍付費用戶群將增加近 1500 名。

該平台提供 AutoTrain、Spaces 和 Inference Endpoints 等服務,費用直接記入關聯的信用卡。

此外,Hugging Face 還與 AWS 和 Azure 等雲端供應商合作,以實現無縫整合到客戶首選的雲端設定中。

擁抱臉的地理分佈

Hugging Face 吸引了來自不同地理位置的用戶,其中美國、印度和俄羅斯成為其核心受眾的關鍵樞紐。

分析網站流量,很明顯美國佔訪客的 25.06%,其次是印度(10.44%)和俄羅斯(7.06%)。

國家 所有設備 桌面 移動的
美國 6.61M 68.35% 31.65%
俄羅斯聯邦 1.64M 50.87% 49.13%
印度 1.62M 73.01% 26.99%
日本 1.54M 71.76% 28.24%
印尼 1.23M 19.54% 80.46%
來源

有趣的是,不同地區的設備偏好有所不同,其中桌面設備在美國(68.03%)中占主導地位,而行動裝置在印度(92.28%)和俄羅斯(86.48%)中受到青睞。

HuggingFace 網站流量(按國家/地區)

使用者擁抱臉部的平均時間

使用者平均在 Hugging Face 網站上花費 4 分 59 秒,與 OpenAI 的 ChatGPT、Character AI、Claude 或 Bing AI 相比相當低。

資金和估值統計

現在,讓我們來看看 Hugging Face 的一些主要資金、收入和估值統計數據。

收入和估值

根據Sacra估計,到 2023 年底,Hugging Face 的年度經常性收入 (ARR) 達到 7,000 萬美元,與前一年相比增長了 367%,令人印象深刻。

營收激增主要歸功於與英偉達、亞馬遜和微軟等主要人工智慧公司簽訂的有利可圖的諮詢合約。該公司的收入模式包括付費個人(9 美元/月)和團隊計畫(20 美元/月),其中很大一部分收入來自企業級服務。

估值方面, Hugging Face從Google、亞馬遜、英偉達、英特爾、Salesforce 等投資者獲得 2.35 億美元融資後,估值達到 45 億美元。

這一可觀的估值顯示了市場對 Hugging Face 創新人工智慧軟體解決方案和託管服務的信心。

公制 價值
收入(2021年) 1000萬美元
估值(2022 年 5 月) 20億美元
最新估值(2023 年 8 月) 45億美元
總資金 2.35 億美元

資金

截至2023年,Hugging Face已成功籌集3.95億美元資金。這筆資金對於支持公司的成長計劃、產品開發和新市場擴張至關重要。

谷歌、英偉達和其他科技巨頭等著名投資者都對 Hugging Face 的願景和產品表示了強烈支持。

抱臉能賺錢嗎?

2023 年,Hugging Face 的年度經常性收入 (ARR) 達到 7,000 萬美元,較前一年成長 367%。

收入的激增主要是由與英偉達、亞馬遜和微軟等領先人工智慧公司簽訂的利潤豐厚的諮詢合約推動的。

以下是該公司的收入統計:

收入(ARR) 成長率(年/年)
2022年 1000萬美元 不適用
2023年 7000萬美元 367%

抱臉如何賺錢(獲利模式)

Hugging Face 透過多種管道產生收入,包括訂閱方案、企業解決方案和雲端服務。以下是 Hugging Face 賺錢方式的詳細說明:

  1. 訂閱方案:
    • Hugging Face 提供個人和團隊訂閱計劃,價格分別為每月 9 美元和每月 20 美元。
    • 這些計劃允許用戶存取高級功能,例如私有資料集查看、推理功能以及提前存取新功能。
  2. 企業解決方案:
  3. 雲端服務:
    • Hugging Face透過其雲端平台提供模型託管、推理和優化等 NLP 和 AI 服務。
    • 用戶根據這些服務的使用量付費,包括模型託管和最佳化的費用。
  4. 市場定位:

市場地位與競爭

直接和間接競爭對手

Hugging Face 在快速成長的生成人工智慧市場中展開競爭,特別是在大型語言和視覺模型方面。

它不是 ChatGPT 或谷歌 Bard 的直接競爭對手,而是透過策略合作夥伴關係和企業使用的人工智慧模型的商業化來競爭

例如,Hugging Face 與 AWS 的合作旨在讓開發人員更容易部署生成式 AI 應用程式。

根據Similarweb 的數據,下表概述了Hugging Face 的主要競爭對手、他們的行業重點以及他們在 2023 年 12 月收到的總訪問量:

競爭者 產業聚焦 總訪問量(2023 年 12 月) 全球排名
1 論文與代碼.com 機器學習研究與實施 2.2M #29,926
2 openai.com 先進的人工智慧系統(GPT-4) 1.6B #25
3 奇維泰網 穩定擴散AI藝術模型 24.2M #1,301
4 萬資料庫 機器學習模型追蹤與比較 1.6M #32,001
5 github.com 軟體開發與開源協作 424.8M 第78章
6 raw.githubusercontent.com 7.7M #11,474
7 stablediffusionweb.com 藝術創作穩定擴散線上演示 3.5M #19,080
8 概念.so 工作空間生產力工具 141.2M 第200章
9 複製.com 用於機器學習模型的雲端 API 7.7M #7,370
10 穩定性.ai 人工智慧技術發展 3.5M 第19790章

擁抱臉部的方式使自己與競爭對手區分開來

  • 開源社群: Hugging Face 培育了一個開源社群平台,使開發人員能夠協作和共享 NLP 任務的模型、資料集和 API。這與 OpenAI 和 Perplexity 等閉源平台形成鮮明對比。 (來源
  • 與模型無關的方法: Hugging Face 的方法允許使用者利用高品質的封閉源模型來訓練自己的低成本開源模型。這鼓勵了機器學習開發人員的靈活性,他們可以混合和匹配模型,找到適合其特定需求的最佳解決方案。
  • 協作工作空間: Hugging Face 為 ML 開發人員提供了一個協作工作空間,促進專案團隊合作、分享見解並改善彼此的工作。 (來源
  • 多樣化的模型庫: Hugging Face 提供了多樣化的預訓練模型庫,適用於文字分類、情緒分析和翻譯等各種任務。這個廣泛的庫使其與僅專注於大型語言模型的競爭對手區分開來。
  • 雲端平台: Hugging Face 經營一個雲端平台,提供模型託管、推理和優化等 NLP 和 AI 服務。這使得用戶可以在雲端環境中輕鬆部署、管理和擴展其 NLP 模型。 (來源
  • 企業解決方案: Hugging Face 利用其 NLP 和 AI 技術提供企業解決方案,包括自訂模型培訓、部署、整合服務以及進階功能和支援。

抱臉其他重要統計數據

除了流量、收入、人口統計等之外,關於 Hugging Face,您還需要了解許多其他統計數據。讓我們來看看它們:

抱臉打造了哪些產品?

2020年,他們推出了Autotrain和Inference API等產品,針對企業客戶。

自動列車

2023 年 4 月,他們推出了開源生成人工智慧HuggingChat 。

擁抱聊天
擁抱聊天

他們的著名計畫BLOOM是一個1760億參數的大語言模型,於2022年7月發布,顯示了他們對大語言模型的承諾。 BLOOM與GPT-3類似,支援多種語言和程式語言。

Hugging Face 還提供 autoML 解決方案和用於託管程式碼儲存庫和討論的 Hugging Face Hub 平台。

他們的NLP 庫旨在透過提供資料集和工具來實現 NLP 的民主化。 Hugging Face 管理 BigScience,這是一項由 900 名研究人員在大型多語言資料集上訓練模型的研究計劃,在大型科技公司中很受歡迎。

BERT 和 DistilBERT 等模型每週的下載量很大,其 AI 編碼助理 StarCoder 支援 80 種程式語言。

Hugging Face與 AWS 合作,為 Amazon SageMaker 上的 NLP 模型部署提供深度學習容器。

NLP 擁抱臉與 AWS 合作

Hugging Face 託管了多少模型和資料集?

它擁有超過300,000 個模型、250,000 個資料集和 250,000 個空間,提供了最廣泛的可用集合。

Hugging Face Hub 託管超過 350,000 個模型、75,000 個資料集和 150,000 個演示應用程序,促進協作和創新。透過支援 130 多種架構和 100 多種語言的 75,000 多個資料集,使用者可以存取各種資源。

此外,Hugging Face 還託管 BERT 和 GPT-2 等流行的機器學習模型,以及用於評估模型預測的 Metrics 庫。

擁抱員工數據

Hugging Face 的員工人數已增至 279 人,比去年增加了 39%,標誌著公司的顯著擴張。

該公司預計年收入為 4,000 萬美元,每位員工的收入約為 143,487 美元。

此外,截至 2023 年 8 月,Hugging Face 已籌集總計 2.35 億美元的資金,目前估值為 40 億美元。

下表總結了Hugging Face的員工數據統計:

公制 價值
在職員工人數 第279章
員工成長 39%
預計年收入 4000萬美元
每位員工的收入 $143,487
總資金 2.35 億美元
估價 40億美元

Hugging Face 在 GitHub 上有多少顆星?

Hugging Face 在 GitHub 上有大量星星,顯示其受歡迎程度和社區參與。

Hugging Face 的 Transformers 工具在 GitHub 上擁有 121,000 顆星,通常被視為衡量開發者工具成功的標準。

相比之下,Meta 流行的機器學習框架 PyTorch 擁有 76,000 顆星,而 Google 的 TensorFlow 擁有 181,000 顆星。 Snowflake 的 Streamlit 擁有 30,500 顆星,而 Gradio 擁有 26,000 顆星。

總結

以下是您所需的有關擁抱臉部的所有基本統計數據。

Hugging Face 的顯著成長,尤其是其創新的人工智慧模式和協作平台,確實令人印象深刻。

Hugging Face能否維持這種快速成長動能?您預計 Hugging Face 未來會繼續擴張嗎?

如果您對此主題有任何進一步的疑問或想法,請隨時在下面的評論中分享。

Share This Post

Post Comment