AI算力争夺愈发激烈，英伟达自家研究团队也“抢不到”GPU-噬脐莫及网

过去一周，抢不到AI领域依旧动荡不断：Anthropic因担忧网络安全风险，算力决定暂不发布全新的争夺Claude Mythos模型（同时成立联盟，利用该模型的愈发英伟预览版本来强化网络安全防御）；Meta在聘请汪滔加盟后发布首个AI模型；此外，市场对OpenAI即将推出的激烈家研究团新模型“Spud”的预期持续升温。

当前，达自队也大多数AI模型都依赖英伟达GPU运行。抢不到这些AI芯片技术复杂、算力价格高昂（单价超过3万美元），争夺是愈发英伟模型训练和推理的核心引擎。但放眼整个行业，激烈家研究团获取GPU芯片仍然是达自队也绕不开的瓶颈。例如，抢不到OpenAI总裁格雷格·布罗克曼就曾形容，算力公司内部的争夺GPU分配过程堪称“痛苦不堪”。

而在本周于旧金山举行的HumanX大会上，笔者发现，即便在英伟达（Nvidia）内部，GPU同样是稀缺资源。

笔者采访了英伟达应用深度学习研究负责人布莱恩·卡坦扎罗。他带领的团队从事AI驱动的图形、语音识别和仿真等方向的研究。早在2010年代早中期，卡坦扎罗就是最早注意到研究人员开始抢购英伟达GPU用于训练AI模型的人之一，这一趋势也促使公司首席执行官黄仁勋加码AI布局，为英伟达如今的史诗级增长奠定了基础。

但如今，即便是卡坦扎罗的团队也难以获得充足的GPU。他表示：“我们的团队在工作中高度依赖AI，他们最大的抱怨就是额度不够。他们想要更多GPU。”

“效率本身也是一种智能”

事实上，他表示，自己目前的一项主要工作就是尽可能为团队争取更多算力资源。他说道：“我们都面临供应限制。黄仁勋会说，‘抱歉，布莱恩，那些芯片都卖光了。’我们只能在这样的限制下开展工作。”

卡坦扎罗负责的项目之一，是带领团队开发英伟达的Nemotron系列模型。这是一组开源模型，用户可以自由下载、使用、研究或修改。需要说明的是，英伟达并不打算在模型领域与OpenAI、Anthropic等公司正面竞争。相反，其打造这些模型旨在强化开发者生态系统，使其依赖英伟达的软硬件体系。

Nemotron系列模型以极高的GPU利用效率著称。卡坦扎罗表示，正是英伟达内部也面临GPU短缺，才倒逼团队不断提升Nemotron模型的效率。他表示：“在供应受限的环境中，效率本身也是一种智能。”

不再只是“科研项目”

不过，令人意外的是，提升效率并未损害商业利益。卡坦扎罗表示，这是“杰文斯悖论”在起作用：当某件事变得更高效时，需求反而往往会激增。他表示：“当某件事物的效率提升时，人们总会找到各种新的使用方式。”

不过他也承认，Nemotron在英伟达内部关注度的提升，同样帮助团队获得了更多资源。“我们做这个项目已经很久了，但直到最近六个月才真正受到重视。随着公司内部越来越理解这项工作的重要性，沟通变得更顺畅、协作更紧密，公司也给予我们更多支持。”

他补充说，英伟达已经意识到，不能再对AI生态系统采取“放手不管”的态度。过去，公司可以依赖其他企业开发模型和应用来带动芯片需求。但如今，随着AI竞争加剧、芯片供应紧张，英伟达认为自己应当在生态系统发展中扮演更积极的角色。

他表示：“过去，有人认为我们可以让生态系统自行发展。但现在很明显，英伟达需要承担更重要的角色——Nemotron带来的既是责任，也是机遇。”

这种定位也有助于提升Nemotron在英伟达内部的地位，毕竟各团队都在争夺稀缺的GPU资源。卡坦扎罗表示：“这已经不是一个科研项目。这不仅仅是我为团队争取资源的问题，还关系到英伟达的未来。”(财富中文网）

译者：刘进龙

审校：汪皓

财富中文网所刊载内容之知识产权为财富媒体知识产权有限公司及/或相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。