
TrueFoundry是一家由前 Meta 工程师组成的创业公司,旨在帮助企业大规模部署人工智能系统,近日获得了由 Intel Capital 领投的1,900万美元的新一轮投资。
随着 GenAI 在 2022 年 11 月推出 ChatGPT 后的出现,各种规模的企业开始寻求途径来拥抱人工智能。但是 GenAI 依赖于大型语言模型来提供智能(读作效率),需要大量的计算力。并不是所有企业都能够访问数百或数千个 GPU,这使得 GPU 优化至关重要。此外,企业需要尝试多个模型以找到最适合其用例的模型,并对现有模型进行微调,使人工智能系统与其运营相关。
TrueFoundry 的软件以平台即服务模式提供,面向全栈数据科学家,解决了所有这些问题。它提供自动扩展、主动维护、集中访问控制和实时监控等功能,以简化端到端的人工智能部署。
TrueFoundry 是由前 Meta 工程师 Nikunj Bajaj 和 Abhishek Choudhary 以及他们的 IIT Kharagpur 同学 Anuraag Gutgutia 于 2021 年 6 月创立的,最初提供跨云原生软件以加速机器学习部署。然而,随着 GenAI 在 2023 年成为主流,这家初创公司修改了其系统以支持 GenAI 功能。
在一次独家采访中,Gutgutia 表示:“以前,数据科学家只会与模型一起工作并尝试它们,但很多部署工作都交给了机器学习工程师。通过我们的系统,我们正在实现的是让数据科学家们可以建立这整个复杂系统并在交付给平台团队进行最终部署之前进行规模化测试。”
该初创公司提供了一个称为自动驾驶系统的软件解决方案,利用人工智能查看日志和指标,通过调整 GPU 使用量和修复内存需求来帮助扩展人工智能应用程序。
使用自动驾驶系统,Gutgutia 告诉 TechCrunch,TrueFoundry 的一家拥有两名团队成员的客户每秒管理了1000万个请求。

TrueFoundry 目前在全球拥有 30 名付费客户,并有“许多”用户访问其用于实验的开源 RAG 框架。其中,GPU 巨头 NVIDIA 使用该软件构建和部署优化其 GPU 集群的代理。医疗科技公司 Resmed 也使用 TrueFoundry 的产品来开发内部人工智能平台。同样地,西门子医疗、Automation Anywhere、Games24x7 和 Whatfix 都是其客户。
该初创公司使用 Kubernetes 架构其软件,使其多云就绪,与包括 AWS、Google Cloud Platform 和 Azure 在内的所有主要云平台兼容。此外,企业可以在本地原生部署该平台。
使用 TrueFoundry 的企业在两个月内建立并启动其内部人工智能平台,并在四个月内实现投资回报率,而此过程通常平均需要 14 个月。Bajaj 表示,TrueFoundry 的客户在基础设施支出上实现了大约 40-50% 的成本降低,以及部署速度提高了 10 倍,无论他们是在代理、RAG、复杂深度学习模型还是精心调整的模型上工作。
云供应商已经开始提供他们自己的软件来简化人工智能模型的构建和部署,如亚马逊的 Sagemaker 和 Google Cloud 的 Vertex。尽管如此,Gutgutia 告诉 TechCrunch,TrueFoundry 的解决方案仍然相关,因为它有助于“加速云提供商的计算使用率”,缩短人工智能应用的上市时间并降低它们的整体成本。
这轮由全股权组成的 A 轮融资中,Eniac Ventures、Peak XV Partners 和 Jump Capital 参与投资,还有包括 Gokul Rajaram、Mohit Aron 和 Cyan Bainster 等天使投资者。
该初创公司将利用这笔资金将团队从总部设在印度的 45 名成员扩展到美国的市场部门,包括销售、客户成功和产品营销职位。它还计划投资于各种合作伙伴关系,尤其是与云供应商合作,并正在努力在主要云市场上市,首站是 AWS Marketplace。
此外,TrueFoundry 计划推出其能够建议正确资源并实现自动扩展和故障排除的人工智能代理。
通过这轮新融资,TrueFoundry 总共筹集了超过 2100 万美元的资金,包括 2022 年 9 月由 Peak XV(当时 Sequoia India)Surge 领投的 230 万美元的种子轮。去年,该初创公司的客户群体增长了四倍,并为客户的机器学习工作负载部署了超过 1,000 个集群。Gutgutia 还告诉 TechCrunch,其年度收入已超过 150 万美元,今年计划加倍增长。