|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
开源平台 Hugging Face 正在为开发人员提供由 NVIDIA 的 NIM 提供支持的推理即服务。新服务为 AI 模型提供了 5 倍的令牌效率,并允许立即访问在 NVIDIA DGX Cloud 上运行的 NIM 微服务。
Open Source platform Hugging Face is now offering developers Inference-as-a-Service that will be powered by NVIDIA’s NIM. The new service provides 5x better token efficiency for AI models and allows immediate access to NIM microservices running on NVIDIA DGX Cloud.
开源平台 Hugging Face 现已向开发人员提供由 NVIDIA 的 NIM 提供支持的推理即服务。新服务为 AI 模型提供了 5 倍的令牌效率,并允许立即访问在 NVIDIA DGX Cloud 上运行的 NIM 微服务。
The new inference-as-a-service was announced at the ongoing SIGGRAPH 2024, a premier conference and exhibition on computer graphics and interactive techniques in Denver, Colorado. The new service will let developers deploy powerful LLMs like Llama 2, Mistral AI models and many more with optimisation from NVIDIA NIM microservices. Hugging Face Enterprise Hub users can access serverless inference for increased flexibility and minimal infrastructure overhead with NVIDIA NIM.
新的推理即服务是在科罗拉多州丹佛市正在举行的 SIGGRAPH 2024 上宣布的,这是一场有关计算机图形和交互技术的顶级会议和展览。这项新服务将让开发人员能够通过 NVIDIA NIM 微服务的优化来部署强大的 LLM,例如 Llama 2、Mistral AI 模型等。 Hugging Face Enterprise Hub 用户可以使用 NVIDIA NIM 访问无服务器推理,以提高灵活性并最大限度地减少基础设施开销。
When accessed as a NIM, large models like the 70-billion-parameter version of Llama 3 will deliver up to 5x higher throughput when compared with off-the-shelf deployment on NVIDIA H100 Tensor Core GPU-powered systems.
当作为 NIM 访问时,与 NVIDIA H100 Tensor Core GPU 驱动的系统上的现成部署相比,像 Llama 3 的 700 亿参数版本这样的大型模型将提供高达 5 倍的吞吐量。
The new inference service also supports Train on DGX Cloud, an AI training service that is already available on Hugging Face.
新的推理服务还支持 DGX Cloud 上的 Train,这是一项已经在 Hugging Face 上提供的人工智能训练服务。
Enter NVIDIA NIM
进入 NVIDIA NIM
NVIDIA NIM is a set of AI microservices, including NVIDIA AI foundation models and open-source community models, that has been optimised for inference with standard APIs. It improves token processing efficiency and enhances the NVIDIA DGX Cloud infrastructure, accelerating AI applications. This setup provides faster, more robust results.
NVIDIA NIM 是一组 AI 微服务,包括 NVIDIA AI 基础模型和开源社区模型,已针对标准 API 的推理进行了优化。它提高了令牌处理效率并增强了 NVIDIA DGX Cloud 基础设施,从而加速了 AI 应用程序。此设置可提供更快、更稳健的结果。
The NVIDIA DGX Cloud platform is tailored for generative AI, offering developers reliable, accelerated computing infrastructure for faster production readiness. It supports AI development from prototyping to production without requiring long-term commitments.
NVIDIA DGX 云平台专为生成式 AI 量身定制,为开发人员提供可靠、加速的计算基础设施,以实现更快的生产准备。它支持从原型设计到生产的人工智能开发,无需长期承诺。
Hugging Face to the Fore
拥抱前面的脸
The new announcement banks on an existing partnership between both tech companies and is only going to foster the developer community further. Interesting recent announcements from Hugging Face include its profitability with a 220-member team and the release of SmolLM, a series of small language models.
新的公告基于两家科技公司之间现有的合作伙伴关系,只会进一步培育开发者社区。 Hugging Face 最近发布的有趣消息包括其拥有 220 名成员的团队实现盈利,以及发布 SmolLM(一系列小语言模型)。
免责声明:info@kdj.com
所提供的信息并非交易建议。根据本文提供的信息进行的任何投资,kdj.com不承担任何责任。加密货币具有高波动性,强烈建议您深入研究后,谨慎投资!
如您认为本网站上使用的内容侵犯了您的版权,请立即联系我们(info@kdj.com),我们将及时删除。
-
- 国会批准工作犬纪念币计划
- 2024-11-23 02:30:02
- 该法案中的所有附加费将捐给美国兽医狗协会,以确保该组织能够继续向残疾退伍军人和急救人员提供这些救生动物,而个人无需支付任何费用。
-
- “冷酷的家伙”模因在法律阻力中引发狂热
- 2024-11-23 02:30:02
- Chill Guy meme 硬币的灵感来自 TikTok 上的热门歌曲“Just a Chill Guy”,席卷了加密世界。
-
- 不为人知的故事:比特币的演变如何塑造我们的世界
- 2024-11-23 02:30:02
- 随着比特币继续吸引人们的关注,它的故事不断展开,它的发展有几个有趣的方面在主流讨论中通常没有被强调。