一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

它正成为人工智能界的Github。

作者:张珺玥

来源:硅星人(guixingren123)

由ChatGPT引发的人工智能风潮还在猛烈地刮着。但从各个角度来看,目前这都是一个巨头争霸的战场:更大的模型更强的算力、更多的用户、更雄厚的资金……这些都似乎成为了想要加入这场角逐的门票。与此同时,核心技术的研究也逐渐开放走向封闭。

而在这高墙正在筑起的过程中,也有一些新锐的创业公司想要高举旗帜来一场革命。其中, 尤其引人注目的是一家名为Hugging Face开源创业公司。

目前,Hugging Face已经是全球最受欢迎的开源机器学习社区和,不仅创下了GitHub有史以来增长最快的AI项目记录,估值也一路冲破了20亿美元。近期,微软和浙江大学联合发布的一篇关于HuggingGPT的论文更是把Hugging Face推到了舞台中心,也让更多人关注到了当前这股与众不同的人工智能发展力量。

01HuggingGPT火了,Hugging是啥?

本月初,微软亚洲研究院和浙江大学联合发布了一项最新的名为HuggingGPT的研究,介绍了一个全新的协作系统,让开发者能够在ChatGPT的帮助下快速、准确地去选择合适的人工智能模型,从而完成包括文字、视频、语音等多模态在内的复杂任务。

该项目目前已经在Github上开源,还有一个超拉风的名字叫JARVIS(没错,就是跟钢铁侠的助手一个名字)。在这个研究中,主要涉及到了两个主体, 一个是众所周知的ChatGPT,另一个则是AI社区Hugging Face。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

图片来自HuggingGPT研究论文

那么Hugging Face是做什么的?

简单来说,Hugging Face是一个针对人工智能的开源,用户可以在上边发布和共享预训练模型、数据集和演示文件等。目前Hugging Face上已经共享了超过10万个预训练模型,1万多个数据集,包括微软、谷歌、Bloomberg、英特尔等各个行业超过1万家机构都在使用Hugging Face的产品。

在HuggingGPT中,ChatGPT通过扮演了“操作大脑”的角色,能够自动解析用户提出的需求,接着在 Hugging Face 的“AI模型池”里进行自动模型选择、执行和报告,为开发者们开发更复杂的人工智能程序提供了极大的便利。

虽然在模型上ChatGPT跟Hugging Face能够牵手, 但从本质上来说,Hugging Face跟OpenAI目前是在做两个相反方向的事。其中最大的不同点在于,在开发者服务方面,OpenAI现在正在搭建人工智能开发的围墙,仅允许满足条件的机构和个人进入,但Hugging Face则希望每个人都可以访问生成式 AI 模型,包括各类企业和所有普通开发者。

今年2月,OpenAI上线了一个名为Foundry的新开发者,允户可以在这个上运行OpenAI最新的机器学习模型,但在产品的描述中,OpenAI明确表示Foundry是为运行较大工作负载的尖端客户设计,而根据一份价格表显示,即使是 GPT-3.5 的轻量级版本,三个月费用高达7.8万美元,一年费用为 26.4万美元。

就在Foundry发布后,Hugging face便立刻宣布了其与 AWS 的最新合作伙伴关系,并发出了“让人工智能走向开放”的呼吁。通过该合作,任何开发人员都将能够使用 AWS 的托管服务并处理 Hugging Face 上可用的任何模型。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

图片来自Hugging face CTO推特

在现在巨头林立的人工智能战场上,Hugging Face就像是一支强有力的民间力量。 当巨头们都在努力保持自己生成式 AI 的霸主地位的时候,Hugging Face 的目标则是寻找各种途径来保持 AI 研究空间的开放。

而这样特点也让Hugging Face目前颇有一些“中立”的色彩。无论微软、谷歌、亚马逊、Meta这些大公司打得再激烈,但它们几乎全都是Hugging Face的支持者。

那么,Hugging Face究竟是如何发展起来的,它具体做着什么样的业务?

02一次歪打正着的创业,造就AI界的顶流“笑脸”

在普通人的眼中,人工智能一向都属于“冷感”很强的技术领域,无论是充斥着大量数字、模型的算法,还是由各种机械零件组装成的机器人,都不免让人感到有些距离感。但作为专为人工智能开发者服务的Hugging Face却主打了一个反差萌,笑脸Emoji再加上一双摊开的小手,logo甚至有点过份可爱。

之所以有这样一个可爱的logo,是因为一开始Hugging Face做的产品其实是一款 针对青少年群体的聊天机器人。

当时Hugging Face的想法是基于自然语言处理 (NLP) 的人工智能技术,来为年轻人们开发一个带有娱乐性、类似于电子宠物一样的个性化聊天机器人,让大家可以在无聊的时候跟它聊八卦、问它问题、让它生成一些有趣的图片之类的事情。

这种新颖的人机社交模式得到了一些关注。2017年3月9号,Hugging Face App在iOS App Store正式推出,并拿到了包括SV Angel、NBA球星杜兰特在内的120万美元的天使投资。此后一年多,Hugging Face都一直围绕着自己的聊天机器人业务在做着自然语言理解的相关训练并发布相关的产品,高峰时期每天处理的消息数量达到了1百万条。在2018年5月,它又获得了400万美元的种子轮融资。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

Hugging Face聊天软件界面

虽然发展的还算不错,但由于当时的人工智能的理解能力和聊天水平远不及ChatGPT这样智能有趣,再加上并非刚需的业务场景,Hugging Face的规模一直都难以扩大。

但为了开发这个聊天机器人,Hugging Face的团队做了一个很重要的事,那就是构建了一个底层库来容纳各种机器学习模型和各种类型的数据集。包括帮助训练聊天机器人检测文本消息情绪、生成连贯的响应、理解不同对话主题等,并且在GitHub上始终以开源项目的形式持续发布该底层库的一些内容。

就这样不温不火地发展了一段时间后,2018年底,Hugging Face迎来了一个重要的转折。

当年11月,谷歌宣布推出基于双向 Transformer 的大规模预训练语言模型BERT,瞬间成为了自然语言理解领域最受开发者关注的模型。但一开始,Google只发布了BERT的TensorFlow版本,Hugging Face就想为啥没有Pytorch版本呢?于是Hugging Face创始人之一的Thomas Wolf就用几天的时间完成并开源了PyTorch-BERT,但没想到,就是这么一个“无心插柳”的项目让Hugging Face一炮而红。

借着BERT的东风, Hugging Face的Pytorch-pretrained-BERT发布3个多月后,快速达成了在Github上5000+ 星标的成就,到了7月份其Star数量已经超过了1万,发展速度远超其他同类开源项目,在Github的AI项目领域里一飞冲天。

在这样的发展势头下,Hugging Face的产品战略开始发生了调整。他们将更多精力放到了开源模型的建设上,将 Pytorch-pretrained-BERT项目正式命名为Transformers,同时支持Pytorch和Tensorflow 2.0。

借助 Transformers库,开发者可以快速使用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模型,并使用这些模型来完成文本分类、文本总结、文本生成、信息抽取、自动QA等任务,节省大量时间和计算资源,此后Hugging Face在人工智能开源领域的名气也越来越大。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

Hugging Face在Github上的Star曲线,图片来自于Lux Capital

到了2019年12月,Hugging Face拿到了由Lux Capital 领投的A轮融资,融资额也比上一轮上了一个量级达到了1500万美元。 值得注意的是,从这一轮开始,Hugging Face的标签开始不再是聊天机器人,而是把AI开源业务放在了首位。这张可爱的笑脸emoji也开始被广大人工智能开发者们所熟知。

03朝着人工智能界的Github前进

在2019年底All in AI开源之后,Hugging Face开始着手构建一套完整的开源产品矩阵。用Hugging Face自己的话来讲,他们所做的事情,就是要 架起人工智能科研和应用的桥梁(bridges the gap from research to production)。

过去这些年,人工智能领域的科研和商业应用是相对独立的两个板块,科研部门的任务就是对前沿技术进行研究,搞模型、发论文,应用部门的人则是要将最新技术用到产品中探索商业变现。如何将科研成果进行系统性的整合成为开源产品,让开发者们能够很快上手去应用转化是长期困扰业界的一个问题。

Hugging Face之前歪打正着地摸到了这个痛点,接着开始认真向下挖掘。简单来说, Hugging Face就是承担了人工智能科研走向应用这个过程中几乎所有复杂、繁琐、细碎的工作,然后方便任何人工智能从业者都可以去便捷地使用这些研究模型和资源。

目前,除了头号产品Transformers之外,Hugging Face还建立了Tokenizers、Datasets、Accelerate等库,从模型到数据集、从托管到性能优化,以开源社区为载体,Hugging Face已建立起了完整的人工智能开发生态,涵盖了 NLP、计算机视觉、语音、时间序列、生物学、强化学习等各个领域。

值得注意的是,Hugging Face并不是因为ChatGPT带火的。 2024年5月,当市场的注意力都还停留在Web3、元宇宙之上时,Hugging Face拿到了有红杉、Lux Capital参与的1亿美元融资,让其估值一举突破了20亿美元。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

Hugging Face的融资历史,图片来自于企查查

Hugging Face当前的目标是想成为人工智能领域的Github。其创始团队认为,只有将那些少数人掌握的技术推广给更多人使用,才能真正最大程度地推进整个行业的进步。而从商业的角度来说,Hugging Face认为赋能整个AI社区所可能产生的价值可能比一个专有的工具高出千倍,而只要将其中的1%变现就能够足以撑起一个高市值的公司,类似的例子包括MongoDB、Elastic等等。

除了蓬勃发展的开源社区,从2020年开始,Hugging Face也开始做面向企业的定制自然语言模型,其客户涵盖彭博社、高通、英特尔等各类大中小型公司,并推出了包括AutoTrain、Inference API & Infinity、Private Hub、Expert Support等针对不同开发者类型的产品。 据报道显示,从2021年开始Hugging Face就一直处于正现金流的状态。

一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

Hugging Face的的产品服务,图片来自于其官网

Hugging Face在当前的人工智能领域中能够以开源社区的模式异军突起,有一些偶然也有必然。首先,过去这些年,人工智能技术所取得的进步都是由全世界的科研和产业领域共同协作所推动的,它的技术基因里其实就带着开放,因此建立起一个来链接研究者和开发者顺应了行业发展的历史和趋势。

此外, Hugging Face通过完成大量的基础性工作,来帮助弥补在人工智能领域里长期存在的科学与生产之间的鸿沟,这是过去很多开源没有关注和做到的。

在此前的一个采访中Hugging Face的CEO Clément Delangue表示,机器学习技术仍然还处于早期发展阶段,开源社区的能力将是巨大的。他认为,在未来5到10年,我们一定还会看到更多开源机器学习公司的崛起。

注:封面图来自于hugging face,版权属于原作者。如果不同意使用,请尽快联系我们,我们会立即删除。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。商机网仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.315965.com/n/55916.html 聚才发 母婴好物

(0)
上一篇 2023年12月18日 上午4:46
下一篇 2023年12月18日 上午4:55

相关推荐

  • 骁龙730g和麒麟710处理器哪个好 骁龙730g和麒麟810哪个好(附2024年排行榜前十名单)

    麒麟710和麒麟810哪个好 首先麒麟810的对标对象是高通的骁龙710和730,和麒麟710根本不是一个台阶。 再一个制程,七纳米的制程是旗舰级处理器的工艺,然后是框架a76的大核框架也是旗舰级的框架结构和麒麟980的框架一致然后高于骁龙845的a75框架。光制程就已经很厉害了,要知道全世界只有苹果(a12)高通(855)衡轮华为(980 ,810)三家有…

    2024年2月3日
    229
  • 使用智能手机的十大危害排名(附2024最新排名前十名单)

    手📱机排行榜2024前十名 华为 Mate 40 Pro很不错的,手📱机参数如下: 1、屏幕:屏幕尺寸为6.76英寸,屏幕色彩1670万色,DCI-P3广色域,分此源辨率:FHD+ 2772 × 1344 像素,延续了88º 超曲面环幕屏设计,弧度饱满,左右边框臻于无形,画面向更广处延伸,带来更为沉浸的视觉体验,观感十足震撼。 2、拍照:后置摄像头…

    2024年2月1日
    181
  • 华为李小龙回应 P60 Pro 充电器只能 USB-A / C 二选一使用:物理防呆,减少学习成本

    近日,华为 P60 Pro 手📱机包装盒内标配的 88W 充电器在网上引发争议,该充电器采用了 USB-A / USB-C 二选一连接器设计,无法同时使用。 对此,华为终端 BG CTO 李小龙进行了回应,他表示自己就是这个设计方案的“始作俑者”,为了防止用户插了线却没有输出电压导致没有充上电或误以为充电器故障,采用了物理干涉的方式让用户同时只能插入一根充电…

    2023年12月23日
    237
  • 抖音安妮左耳朵怎么回事?

    抖音安妮嫩 抖音安妮嫩die的嘴因为小时候的车祸有点奇怪云工有烧村批。 抖音安帆唤妮嫩die本人是安徽蚌埠人,在某服装公司引旧台上庆生普他坚东附工作,年龄21岁,身高164。她活跃在某手,因为与铁山靠与田斌pk直播而出名,后来铁山靠在某手被多次封刑号,铁山靠去了某音。 安妮春庆在某手找不到铁山靠,就去某音也注册了一个账号,3天该账号就达到220W关注人数。某…

    2024年2月6日
    249
  • 物业电工的岗位职责 维修电工基础知识(附2024年排行榜前十名单)

    物业电工的工作内容都有哪些? 1.按照行业服务规范,依约定时间为本小区业主家里水电做上门有偿维修服务, 合理收费,以保小区业主安居生活。2.根据物业要求,每月定期对小区的路灯照明、发电机房、水泵房、空调、监控系统、门禁系统、可视对讲、供水供电设备、各种弱电等进行检查检测和维护,确保其最佳运行状态。注意各种安全作业规程,高空作业时做到系好安全带,作业范围的地面…

    2024年2月4日
    144
  • 中国 6G 通信技术研发取得重要突破,航天科工完成国内首次太赫兹轨道角动量的实时无线传输通信实验

    IT之家 4 月 19 日消息,我国 6G 通信技术研发取得重要突破,中国航天科工二院 25 所完成国内首次太赫兹轨道角动量的实时无线传输通信实验。 利用高精度螺旋相位板天线在 110GHz 频段实现 4 种不同波束模态,通过 4 模态合成在 10GHz 的传输带宽上完成 100Gbps 无线实时传输,最大限度提升了带宽利用率,为我国 6G 通信技术发展提供…

    2023年12月19日
    142
  • 苹果12电池容量是多少( 苹果12电池能用一天吗)

    中关村在线消息:按照iPhone每年的迭代规律,不出意外的话,新款iPhone 12系列将会于今年9月上旬和大家正式见面。同时,iPhone 12系列也将成为苹果首款商用5G终端,因此无形之中提升了大家的期待值。 相信体验过苹果iPhone的朋友们一定深有感触,续航和快充可谓是iPhone相较Android旗舰两处最大的劣势。根据此前早些时候的行业曝光消息,…

    2023年7月30日
    194
  • 安全高效员工离职的 5 个技巧源代码

    许多公司花费大量时间来完善他们的员工入职流程。 然而,花同样多的时间(如果不是更多的话)来优化他们的离职政策是至关重要的。 离职可能非常复杂。 IT 需要保护离职员工的设备,撤销对应用程序的访问权限,并恢复无穷无尽的公司所有材料清单。您如何高效、安全地完成一长串的离职任务? 以下是一些需要考虑的提示,以及像 BetterCloud 这样的可以提供帮助的方式。…

    2024年1月14日
    117
  • 骁龙650和625哪个好 骁龙650和636哪个好(附2024年排行榜前十名单)

    636和骁龙650哪个好 高通骁龙650与636基本规格对比 其实通过上面的参数对比就可以看出,骁龙636和650具有以下几个方面的区别: 制造工艺方面 高通骁龙636采用的是更加先进的14nm工艺,而高通骁龙650采用的还是上一代的28nm执照工艺,所以理论来说,高通骁龙636有着更为出色的功耗和发热控制。 CPU构架方面 虽说这两款芯片均属于8核心设棚顷…

    2024年2月4日
    167
  • 什么是全面屏手机 全面屏手机有哪些优缺点(附2024年排行榜前十名单)

    全面屏手📱机排行榜是怎样的?哪款销量最高? 全面屏手📱机排行榜是华为P20、三星Note8、小米MIX2,销量最高的应该是华为P20。 1、华为P20 华为的高端机一直都是倍受欢迎誉没埋的,华为一直是国产机中高端的代表,而P系列一直是华为的旗舰系列,主打高端。 这次P20的屏占比也是超高,远超iPhone X,至少有95%,颜值也是超高,在加上使用上前置三摄…

    2024年2月5日
    153