首页 / AI算力争夺愈发激烈,英伟达自家研究团队也“抢不到”GPU

AI算力争夺愈发激烈,英伟达自家研究团队也“抢不到”GPU

过去一周,抢不到AI领域依旧动荡不断:Anthropic因担忧网络安全风险,算力决定暂不发布全新的争夺Claude Mythos模型(同时成立联盟,利用该模型的愈发英伟预览版本来强化网络安全防御);Meta在聘请汪滔加盟后发布首个AI模型;此外,市场对OpenAI即将推出的激烈家研究团新模型“Spud”的预期持续升温。

当前,达自队也大多数AI模型都依赖英伟达GPU运行。抢不到这些AI芯片技术复杂、算力价格高昂(单价超过3万美元),争夺是愈发英伟模型训练和推理的核心引擎。但放眼整个行业,激烈家研究团获取GPU芯片仍然是达自队也绕不开的瓶颈。例如,抢不到OpenAI总裁格雷格·布罗克曼就曾形容,算力公司内部的争夺GPU分配过程堪称“痛苦不堪”。

而在本周于旧金山举行的HumanX大会上,笔者发现,即便在英伟达(Nvidia)内部,GPU同样是稀缺资源。

笔者采访了英伟达应用深度学习研究负责人布莱恩·卡坦扎罗。他带领的团队从事AI驱动的图形、语音识别和仿真等方向的研究。早在2010年代早中期,卡坦扎罗就是最早注意到研究人员开始抢购英伟达GPU用于训练AI模型的人之一,这一趋势也促使公司首席执行官黄仁勋加码AI布局,为英伟达如今的史诗级增长奠定了基础。

但如今,即便是卡坦扎罗的团队也难以获得充足的GPU。他表示:“我们的团队在工作中高度依赖AI,他们最大的抱怨就是额度不够。他们想要更多GPU。”

“效率本身也是一种智能”

事实上,他表示,自己目前的一项主要工作就是尽可能为团队争取更多算力资源。他说道:“我们都面临供应限制。黄仁勋会说,‘抱歉,布莱恩,那些芯片都卖光了。’我们只能在这样的限制下开展工作。”

卡坦扎罗负责的项目之一,是带领团队开发英伟达的Nemotron系列模型。这是一组开源模型,用户可以自由下载、使用、研究或修改。需要说明的是,英伟达并不打算在模型领域与OpenAI、Anthropic等公司正面竞争。相反,其打造这些模型旨在强化开发者生态系统,使其依赖英伟达的软硬件体系。

Nemotron系列模型以极高的GPU利用效率著称。卡坦扎罗表示,正是英伟达内部也面临GPU短缺,才倒逼团队不断提升Nemotron模型的效率。他表示:“在供应受限的环境中,效率本身也是一种智能。”

不再只是“科研项目”

不过,令人意外的是,提升效率并未损害商业利益。卡坦扎罗表示,这是“杰文斯悖论”在起作用:当某件事变得更高效时,需求反而往往会激增。他表示:“当某件事物的效率提升时,人们总会找到各种新的使用方式。”

不过他也承认,Nemotron在英伟达内部关注度的提升,同样帮助团队获得了更多资源。“我们做这个项目已经很久了,但直到最近六个月才真正受到重视。随着公司内部越来越理解这项工作的重要性,沟通变得更顺畅、协作更紧密,公司也给予我们更多支持。”

他补充说,英伟达已经意识到,不能再对AI生态系统采取“放手不管”的态度。过去,公司可以依赖其他企业开发模型和应用来带动芯片需求。但如今,随着AI竞争加剧、芯片供应紧张,英伟达认为自己应当在生态系统发展中扮演更积极的角色。

他表示:“过去,有人认为我们可以让生态系统自行发展。但现在很明显,英伟达需要承担更重要的角色——Nemotron带来的既是责任,也是机遇。”

这种定位也有助于提升Nemotron在英伟达内部的地位,毕竟各团队都在争夺稀缺的GPU资源。卡坦扎罗表示:“这已经不是一个科研项目。这不仅仅是我为团队争取资源的问题,还关系到英伟达的未来。”(财富中文网)

译者:刘进龙

审校:汪皓

财富中文网所刊载内容之知识产权为财富媒体知识产权有限公司及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

文章推荐