Mistral董事会成员和a16z风投公司的Anjney Midha表示DeepSeek不会停止AI对GPU的需求

Andreesen Horowitz的普通合伙人兼Mistral董事会成员Anjney“Anj” Midha在六个月前首次注意到DeepSeek令人瞠目的性能,他告诉TechCrunch。

那时,DeepSeek推出了Coder V2,这与去年发布的一份论文中与OpenAI的GPT4-Turbo相媲美,特别是在编码特定任务方面。他说,这使得DeepSeek在接下来的几个月中推出了改进的模型,直至R1。R1是其新的开源推理模型,以行业标准的性能以较低的成本颠覆了科技行业。

尽管Nvidia的股票出售,Midha表示,R1并不意味着AI基础模型将停止花费数十亿美元来获取GPU芯片并尽快建造更多数据中心。

这意味着他们将利用他们所能获得的计算能力做更多事情。

“当人们说,好吧Anj,Mistral已经筹集了10亿美元,”他说。“DeepSeek是否意味着所有这10亿美元完全是多余的?不,事实上,对于他们来说,能够看到DeepSeek的效率改进、内部化,并投入10亿美元非常有价值。”

他补充道,“现在我们可以从相同的计算中得到10倍以上的输出。”

他认为,这并不意味着Mistral无望落后于竞争对手OpenAI和Anthropic。每个公司都筹集到比Mistral更多的数十亿美元。据报道,OpenAI正处于筹集另一笔令人瞠目的400亿美元的资金之中。

Mistral仍然与它们竞争,因为它是开源的,他说。他的逻辑确实有其道理。开源使公司可以获得那些想要帮助的人提供的基本免费技术劳动力。闭源竞争对手保护他们的秘密,并不得不支付所有劳动力以及计算能力。

“你不需要200亿美元。你只需要比任何其他开源模型应用程序的计算能力更强。所以Mistral的位置非常好。他们拥有开源提供商中最强大的计算能力,”他说到他的投资组合公司。

Facebook的Llama,是Mistral的最大西方开源AI模型对手,也会得到更多的投资。CEO马克·扎克伯格周三表示,他仍计划在AI领域总共投入“数千亿美元”。其中包括2025年在资本支出方面投入600亿美元,主要用于数据中心。

a16z的Oxygen GPU共享计划“已满额”

Midha,同时也是AI图像生成器Black Forest Labs和3D模型制造商Luma的董事会成员(以及AI公司Anthropic、ElevenLabs等的天使投资者),对AI对GPU的需求迅速增长没有放缓的原因还有一个。他是a16z的Oxygen计划的负责人。特别是Nvidia最先进的H100型号GPU已经变得如此稀缺,以至于这家风投公司大约一年半前采取了行动。它为其投资组合公司购买了大量这些GPU。

Oxygen目前“已满额”。Midha笑道。他的初创公司不仅需要GPU进行AI模型训练,而且需要更多的GPU来运行他们持续为客户提供的AI产品。

“现在,对于推理,对于消耗,有着这种不可满足的需求,”他解释道。

这也是他认为DeepSeek的工程突破不会改变“Stargate”的原因。这是OpenAI在本月早些时候与软银和甲骨文达成的5000亿美元的重大合作伙伴关系,用于AI数据中心。

DeepSeek所带来的主要变化是,国家已经认识到人工智能是下一个基础基础设施,就像电力和互联网一样。Midha希望他们考虑“基础设施独立性”,正如他所说。他们想依靠中国的模型,带有审查制度和在其数据中心的干预吗?还是想要遵循西方法律和伦理并遵守北约协议的西方模型?

显然,他主张西方国家使用西方模型,就像他位于巴黎的Mistral一样。数百家公司分享这一担忧,并已经封锁了DeepSeek,这既是一项消费者应用服务,也是一个开源模型。

并非所有人都担心中国的开源模型。公司可以在自己的数据中心中本地运行它们。DeepSeek已经作为一个安全的云服务供应商出现在了美国公司如微软Azure Foundry等公司中,因此开发人员不必使用DeepSeek的云服务。

事实上,英特尔的前首席执行官帕特·吉尔辛格——一个对中国非常熟悉的人告诉TechCrunch,他的初创公司Gloo正在建立基于他们自己版本的DeepSeek R1的AI聊天服务,而不是选择像Llama或OpenAI那样的选择。

但如果有人因为DeepSeek而放弃了他们的数据中心计划,Midha笑着发出一个请求:“如果你有多余的GPU,请送给Anj。”

TechCrunch有一个以人工智能为重点的新闻简报!请在这里注册,每周三发送到您的收件箱中。