Hugging Face 拥抱面的Datasets 数据集(2024)

Hugging Face (拥抱脸)是一个人工智慧平台,使用者可以在其中协作开展机器学习专案。它托管一个用于训练和部署模型的开源平台。拥有超过20万个模型,涵盖电脑视觉、自然语言处理等各个领域。

在这篇文章中,我们将分享您需要了解更多有关Hugging Face 的所有重要统计数据。

在我们跳到Hugging Face 的关键统计数据之前,这里有一个您不应错过的Hugging Face 的快速历史。

什么是Hugging Face,谁建造的,为什么,以及何时建造的

拥抱脸是一家总部位于纽约市的法裔美国公司,由法国企业家克莱门特·德朗格朱利安·肖蒙德托马斯·沃尔夫于2016 年创立

最初,该公司开发了一款针对青少年的聊天机器人应用程序,然后在开源聊天机器人模型后转型为机器学习平台。

该公司的平台Hugging Face Hub 充当协作空间,使用者可以使用开源程式码开发、训练和部署NLP 和ML 模型。

Hugging Face 透过提供预先训练的模型来简化模型开发,使用者可以针对特定任务进行微调,从而使AI 民主化并使开发人员更容易使用它。

它透过Hugging Face Datasets 库提供使用者友善的文字预处理标记器和庞大的NLP 资料集储存库,为资料科学家、研究人员和ML 工程师的专案提供支援。

此外,Hugging Face 以其专为自然语言处理应用程式量身定制的Transformer 库而闻名。

主要拥抱脸部统计数据一览

  • 托管超过100 万个模型、资料集和应用程式。一般来说,它有35 万个模型、7.5 万个资料集和15 万个演示应用程式。 (来源
  • 2023年完成2.35亿美元D轮投资,估值达45亿美元。 (来源
  • 自2016 年以来的六轮融资筹集资金总额为3.952 亿美元。 (来源
  • 2021 年收入低于1000 万美元,预计2023 年收入为30 至5000 万美元。 (来源
  • 被超过10,000 家公司用于人工智慧和机器学习开发。 (来源
  • 发布BLOOM,1760亿参数语言模型。 (来源
  • 拥有超过1,000位付费客户,包括英特尔、辉瑞和彭博。 (来源
  • 与H2O.ai、spaCy 直接竞争,与OpenAI 间接竞争。 (来源
  • Transformers 库在GitHub 上拥有超过100,000 颗星。 (来源
  • 网站每月浏览量为1890 万次。 (来源
  • 75.25%的网站访客为男性;24.75%为女性。 (来源
  • 25-34岁年龄层用户群的36.87% 。 (来源
  • 托管超过300k 模型、250k 资料集250k 空间
  • 截至2023 年,员工人数从2021 年的30 名增加到170 名。 (资料来源
  • Hugging Face Pro 售价为25 美元/月。 (来源
  • 「其他」类别中最大的模型贡献:129,157 个模型
  • IBM 贡献了200 多个开放模型和资料集。 (来源
  • 假新闻侦测器模型的准确率高达95%。 (来源

 

拥抱脸意味着什么,为什么他们使用表情符号?

选择「拥抱脸」是因为创办人希望成为第一家以表情符号而非传统的三字母股票符号上市的公司。

拥抱脸标志

他们选择拥抱脸部表情符号,因为这是他们最喜欢的表情符号,他们认为这对他们的公司来说是一个令人难忘且独特的名称。

嗯,一切进展顺利,Hugging Face 社群已经接受了这个名字,它已经成为机器学习和资料科学领域的知名品牌。

网站流量和使用者人口统计

拥抱脸能吸引多少网站流量?

Hugging Face是著名的人工智慧平台和社区,近期流量保持稳定。

2024年1月,该网站吸引了2881万次访问,用户平均每次访问时间为10分39秒。不过,与11 月相比,流量略有下降,达-19.5%。

Huggingface网站流量统计
资料来源:塞姆拉什

Hugging Face 的主要受众集中在美国,在俄罗斯、印度、日本和印尼也有大量追随者。

美国的「huggingface」国家流量很高
资料来源:塞姆拉什

该网站的流量在设备使用方面存在差异,桌上型电脑占访问量的68.03%,其次是行动装置(占31.97%)和平板电脑(占7.22%)。(有关设备使用情况的一些数据有所不同;但是,桌上型设备的使用情况约为70-75%。)

设备使用情况
资料来源:SimilarWeb

从行销管道来看,直接流量占比最大,为45.06%,其次是自然搜索,占比为28.67%。推荐、社群媒体、展示广告和付费搜寻构成了网站其余的流量来源。

行销管道统计Hugingface

抱脸的用户群有哪些?

Hugging Face 吸引了多元化的用户群,主要包括人工智慧研究人员、资料科学家和开发人员。

截至2023年,该平台拥有超过120万名注册用户,其中男性占75.25%,女性占24.75%。

大多数用户集中在25-34岁年龄段,占用户群的36.87%,緊隨其後的是18-24歲用戶,佔比為28.26%。整體而言,18-44歲的用戶佔平台用戶的83.03%。

拥抱脸的年龄分布

拥抱脸的活跃付费用户

Hugging Face 拥有超过1,000 名活跃付费用户,其中包括英特尔、辉瑞、彭博社和eBay 等知名公司。到2025 年,Hugging Face 预计活跃付费用户群将增加近1500 名。

该平台提供AutoTrain、Spaces 和Inference Endpoints 等服务,费用直接记入关联的信用卡。

此外,Hugging Face 还与AWS 和Azure 等云端供应商合作,以实现无缝整合到客户首选的云端设定中。

拥抱脸的地理分布

Hugging Face 吸引了来自不同地理位置的用户,其中美国、印度和俄罗斯成为其核心受众的关键枢纽。

分析网站流量,很明显美国占访客的25.06%,其次是印度(10.44%)和俄罗斯(7.06%)。

国家 所有设备 桌面 移动的
美国 6.61M 68.35% 31.65%
俄罗斯联邦 1.64M 50.87% 49.13%
印度 1.62M 73.01% 26.99%
日本 1.54M 71.76% 28.24%
印尼 1.23M 19.54% 80.46%
来源

有趣的是,不同地区的设备偏好有所不同,其中桌面设备在美国(68.03%)中占主导地位,而行动装置在印度(92.28%)和俄罗斯(86.48%)中受到青睐。

HuggingFace 网站流量(按国家/地区)

使用者拥抱脸部的平均时间

使用者平均在Hugging Face 网站上花费4 分59 秒,与OpenAI 的ChatGPT、Character AI、Claude 或Bing AI 相比相当低。

资金和估值统计

现在,让我们来看看Hugging Face 的一些主要资金、收入和估值统计数据。

收入和估值

根据萨克拉估计,到2023 年底,Hugging Face 的年度经常性收入(ARR) 达到7,000 万美元,与前一年相比增长了367%,令人印象深刻。

营收激增主要归功于与英伟达、亚马逊和微软等主要人工智慧公司签订的有利可图的咨询合约。该公司的收入模式包括付费个人(9 美元/月)和团队计画(20 美元/月),其中很大一部分收入来自企业级服务。

估值方面, Hugging Face从Google、亚马逊、英伟达、英特尔、Salesforce 等投资者获得2.35 亿美元融资后,估值达到45 亿美元。

这一可观的估值显示了市场对Hugging Face 创新人工智慧软体解决方案和托管服务的信心。

公制 价值
收入(2021年) 1000万美元
估值(2022 年5 月) 20亿美元
最新估值(2023 年8 月) 45亿美元
总资金 2.35 亿美元

基金

截至2023年,Hugging Face已成功筹集3.95亿美元资金。这笔资金对于支持公司的成长计划、产品开发和新市场扩张至关重要。

谷歌、英伟达和其他科技巨头等著名投资者都对Hugging Face 的愿景和产品表示了强烈支持。

抱脸能赚钱吗?

2023 年,Hugging Face 的年度经常性收入(ARR) 达到7,000 万美元,较前一年成长367%。

收入的激增主要是由与英伟达、亚马逊和微软等领先人工智慧公司签订的利润丰厚的咨询合约推动的。

以下是该公司的收入统计:

收入(ARR) 成长率(年/年)
2022年 1000万美元 不适用
2023年 7000万美元 367%

抱脸如何赚钱(获利模式)

Hugging Face 透过多种管道产生收入,包括订阅方案、企业解决方案和云端服务。以下是Hugging Face 赚钱方式的详细说明:

  1. 订阅方案:
    • Hugging Face 提供个人和团队订阅计划,价格分别为每月9 美元和每月20 美元。
    • 这些计划允许用户存取高级功能,例如私有资料集查看、推理功能以及提前存取新功能。
  2. 企业解决方案:
  3. 云端服务:
    • 拥抱脸透过其云端平台提供模型托管、推理和优化等NLP 和AI 服务。
    • 用户根据这些服务的使用量付费,包括模型托管和最佳化的费用。
  4. 市场定位:

市场地位与竞争

直接和间接竞争对手

Hugging Face 在快速成长的生成人工智慧市场中展开竞争,特别是在大型语言和视觉模型方面。

它不是ChatGPT 或谷歌Bard 的直接竞争对手,而是透过策略合作伙伴关系和企业使用的人工智慧模型的商业化来竞争

例如,Hugging Face 与AWS 的合作旨在让开发人员更容易部署生成式AI 应用程式。

根据Similarweb 的数据,下表概述了Hugging Face 的主要竞争对手、他们的行业重点以及他们在2023 年12 月收到的总访问量:

竞争者 产业聚焦 总访问量(2023 年12 月) 全球排名
1 论文与代码.com 机器学习研究与实施 2.2M #29,926
2 开源网 先进的人工智慧系统(GPT-4) 1.6B #25
3 奇维泰网 稳定扩散AI艺术模型 24.2M #1,301
4 万资料库 机器学习模型追踪与比较 1.6M #32,001
5 github.com 软体开发与开源协作 424.8M 第五章
6 raw.githubusercontent.com 7.7M #11,474
7 stablediffusionweb.com 艺术创作稳定扩散线上演示 3.5M #19,080
8 概念.so 工作空间生产力工具 141.2M 第五章
9 复制.com 用于机器学习模型的云端API 7.7M #7,370
10 稳定性.ai 人工智慧技术发展 3.5M 第五章

拥抱脸部的方式使自己与竞争对手区分开来

  • 开源社群: Hugging Face 培育了一个开源社群平台,使开发人员能够协作和共享NLP 任务的模型、资料集和API。这与OpenAI 和Perplexity 等闭源平台形成鲜明对比。 (来源
  • 与模型无关的方法: Hugging Face 的方法允许使用者利用高品质的封闭源模型来训练自己的低成本开源模型。这鼓励了机器学习开发人员的灵活性,他们可以混合和匹配模型,找到适合其特定需求的最佳解决方案。
  • 协作工作空间: Hugging Face 为ML 开发人员提供了一个协作工作空间,促进专案团队合作、分享见解并改善彼此的工作。 (来源
  • 多样化的模型库: Hugging Face 提供了多样化的预训练模型库,适用于文字分类、情绪分析和翻译等各种任务。这个广泛的库使其与仅专注于大型语言模型的竞争对手区分开来。
  • 云端平台: Hugging Face 经营一个云端平台,提供模型托管、推理和优化等NLP 和AI 服务。这使得用户可以在云端环境中轻松部署、管理和扩展其NLP 模型。 (来源
  • 企业解决方案: Hugging Face 利用其NLP 和AI 技术提供企业解决方案,包括自订模型培训、部署、整合服务以及进阶功能和支援。

抱脸其他重要统计数据

除了流量、收入、人口统计等之外,关于Hugging Face,您还需要了解许多其他统计数据。让我们来看看它们:

抱脸打造了哪些产品?

2020年,他们推出了Autotrain和Inference API等产品,针对企业客户。

自动列车

2023 年4 月,他们推出了开源生成人工智慧HuggingChat 。

拥抱聊天
拥抱聊天

他们的著名计画BLOOM是一个1760亿参数的大语言模型,于2022年7月发布,显示了他们对大语言模型的承诺。 BLOOM与GPT-3类似,支援多种语言和程式语言。

Hugging Face 还提供autoML 解决方案和用于托管程式码储存库和讨论的Hugging Face Hub 平台。

他们的NLP 库旨在透过提供资料集和工具来实现NLP 的民主化。 Hugging Face 管理BigScience,这是一项由900 名研究人员在大型多语言资料集上训练模型的研究计划,在大型科技公司中很受欢迎。

BERT 和DistilBERT 等模型每周的下载量很大,其AI 编码助理StarCoder 支援80 种程式语言。

拥抱脸与AWS 合作,为Amazon SageMaker 上的NLP 模型部署提供深度学习容器。

NLP 拥抱脸与AWS 合作

Hugging Face 托管了多少模型和资料集?

它拥有超过300,000 个模型、250,000 个资料集和250,000 个空间,提供了最广泛的可用集合。

Hugging Face Hub 托管超过350,000 个模型、75,000 个资料集和150,000 个演示应用程序,促进协作和创新。透过支援130 多种架构和100 多种语言的75,000 多个资料集,使用者可以存取各种资源。

此外,Hugging Face 还托管BERT 和GPT-2 等流行的机器学习模型,以及用于评估模型预测的Metrics 库。

拥抱员工数据

Hugging Face 的员工人数已增至279 人,比去年增加了39%,标志着公司的显著扩张。

该公司预计年收入为4,000 万美元,每位员工的收入约为143,487 美元。

此外,截至2023 年8 月,Hugging Face 已筹集总计2.35 亿美元的资金,目前估值为40 亿美元。

下表总结了Hugging Face的员工数据统计:

公制 价值
在职员工人数 第五章
员工成长 39%
预计年收入 4000万美元
每位员工的收入 $143,487
总资金 2.35 亿美元
估价 40亿美元

Hugging Face 在GitHub 上有多少颗星?

Hugging Face 在GitHub 上有大量星星,显示其受欢迎程度和社区参与。

Hugging Face 的Transformers 工具在GitHub 上拥有121,000 颗星,通常被视为衡量开发者工具成功的标准。

相比之下,Meta 流行的机器学习框架PyTorch 拥有76,000 颗星,而Google 的TensorFlow 拥有181,000 颗星。 Snowflake 的Streamlit 拥有30,500 颗星,而Gradio 拥有26,000 颗星。

总结

以下是您所需的有关拥抱脸部的所有基本统计数据。

Hugging Face 的显著成长,尤其是其创新的人工智慧模式和协作平台,确实令人印象深刻。

Hugging Face能否维持这种快速成长动能?您预计Hugging Face 未来会继续扩张吗?

如果您对此主题有任何进一步的疑问或想法,请随时在下面的评论中分享。

分享这篇文章

发表评论