今天小编分享的科学经验:英伟达新品“掌心AI超算”,¥1800跑8B多模态模型,算力暴增70%价格腰斩,欢迎阅读。
" 英伟达版树莓派 " 这波良心了,性能涨 70%,降价 50%。
老黄召开厨房发布会,从烤箱里端出这台 " 掌心 AI 超算 "。
△怎么不穿皮衣了
新版Jetson Orin Nano开发版套件,算力从 40 TOPS 涨到 67 TOPS(INT8),内存带宽增加 50%,达到 102GB/s,功耗仅 25 瓦。
价格却降了 50%,从 $499 降到 $249(约人民币 1800 元)。
67 TOPS 什么概念?
比目前英特尔、AMD 或高通 AI PC 中的大部分 NPU 都快
能跑主流的 7B、8B 大模型量化版,如阿里 Qwen,Llama 等
最高支持 4 个摄像头,也能跑 8B 的视觉语言模型和 ViT 模型
英伟达称这是 " 最实惠的生成式 AI 超级计算机 "。
无论是用来创建基于 RAG 的聊天机器人、视觉 AI Agent,还是部署基于 AI 的机器人,都是理想的解决方案。
开发套件包括一个 Jetson Orin Nano 8GB 系统级模块(SoM)和一个参考载板,可用于边缘 AI 应用的原型设计,功耗最高 25w。
采用 6 核 Arm CPU 和 NVIDIA Ampere 架构 GPU,GPU 配备 1024 个 CUDA 核心和 32 个张量核心,支持多个并发 AI 应用管道和高性能推理。它最多可以支持 4 个摄像头,提供比以前版本更高的分辨率和帧率。
The Register 估计在运行 4 位量化版 Llama 3.1 8B 模型时,能达到约 18-20 tokens/s 的速度。
Jetson 支持一系列英伟达 AI 軟體,包括用于机器人的 NVIDIA ISAAC、用于视觉 AI 的 NVIDIA Metropolis 和用于传感器处理的 NVIDIA Holoscan。
另外可以使用 NVIDIA Omniverse Replicator 生成合成数据,并使用 NVIDIA TAO 工具包微调预训练模型,可以缩短开发时间。
老黄称这个系列为一种全新的处理器——机器人处理器。
推出第一代产品时,没人理解英伟达在做什么
到现在,它已经支持了各种机器人,带轮子的、两条腿的、三条腿的。
额外的好消息是,新推出的軟體更新,也将为买过旧版开发套件的用户带来生成式 AI 性能提升。
有网友表示,黄仁勋就是新的圣诞老人。
参考链接:
[ 1 ] https://blogs.nvidia.com/blog/jetson-generative-ai-supercomputer/
[ 2 ] https://www.theregister.com/2024/12/17/nvidia_jetson_orin/
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>