半精力详细详细介绍RISC的整合

- 编辑:UED·体育官网 -

半精力详细详细介绍RISC的整合

西班牙的半精神分裂已经开发了一个完整的神经IP处理单元,该单元结合了CPU,向量和男高音处理,可用于大型语言模型和AI推荐系统的最高256个顶级吞吐量。本文指出:Cervell NPU基于RISC-V开放指令集体系结构的架构,可以从8个内核扩展到64个核心。这使设计人员可以根据应用要求进行调整性能,从8个TOPS INT8到1GHz,以压缩边缘部署到数据中心芯片的高端AI识别中的256个TOPS INT4。该白皮书详细介绍了12月启动的组合建筑之后发布。 “ Cervell是为新的AI计算时期设计的,在架子外面没有足够的解决方案去除传统的数据瓶颈,为芯片设计师提供了强大的基础,可以为芯片设计师提供多样化,高功能的AI解决方案,” SEMIDYNAILINAGIC首席执行官Roger Espasa说。 Cervell NPU是为AC设计的将密集应用的矩阵固定,以实现更高的吞吐量,较低的电力消耗和实时响应。 NPU具有单个体系结构中具有常见的CPU和矢量处理,设计人员可以消除潜伏期并促进各种AI活动的性能,从推荐系统到研究的深层管道。这与内存请求相吻合,删除的延迟停止,以超过60个字节/周期的持续数据流。此外,可以大规模并行访问片外存储器,这对于大规模的模型理解和稀疏数据处理非常重要。即使在强化带宽的应用中,例如推荐系统和深入的研究,它也保持了管道的充分饱和。核心是完全可自定义的,能够添加标量或向量指令,配置临时内存和自定义I/O FIFO,并确定内存接口和同步方案,以提供未来的AI硬件焦点。深的在RTL级别进行定制,包括输入客户指定的说明,使公司能够将独特的IP直接结合到解决方案,保护其对ASIC的投资免于模仿,并确保对设计的设计已完全优化,以供使用权力,性能和地点。开发模型包括早期的FPGA崩溃,并证明可以减少开发和风险时间。 configurationInt8 @ 1ghzint4 @ 1ghzint8 @ 2GHZINT4 @ 2GHZC88 TOPS16 TOPS32 TOPSC1616 TOPSC1616 TOPSS32 TOPS64 TOPS64 TOPSC3232 TOPSC3232 TOPS64 TOPS128 TOPS128 TOPSC6464