文|半导体产业纵横
近日,Semidynamics 首席执行官 Roger Espasa 讨论了该公司的高性能、可配置 RISC-V IP,该 IP 强调内存带宽和针对 AI 和 HPC 的定制。他重点介绍了他们的 Gazzillion Misses 延迟处理 IP、集成张量单元,并专注于实际性能而非基准测试。Espasa 认为 RISC-V 正在超越 Arm,在标准化与灵活性之间取得平衡,并预测 AI 和 chiplet 的采用将发生转变。
其解决方案范围从独立的 CPU 内核到围绕张量、矢量和 CPU 组合构建的一体化设计(包括 NPU)。Semidynamics 的主要差异化因素之一是其对内存带宽和定制化的重视。Gazzillion TLB(翻译后备缓冲器)和可配置内存子系统等功能使设计人员能够根据特定工作负载调整处理器,尤其是针对 AI 和数据密集型应用。
在接受 JPR 的 David Harold 采访时,Semidynamics 首席执行官 Roger Espasa 谈到了该公司的 RISC-V IP 以及他对 RISC-V 未来的展望。
Espasa表示,“我们大约在 2017 年开始创业。头两年专注于服务,为一家美国初创公司设计 RISC-V 芯片。之后,我们决定开发自己的 IP。到 2020-2022 年,我们的技术已经准备就绪,并且我们确保了全球客户对我们的矢量技术感兴趣。”
“我们是第一个推出 RISC-V 大型向量单元的公司,也是第一个将无序向量单元与无序核心相结合的公司。这在 HPC 中尤为重要,而 HPC 现已与 AI 融合。HPC 和 AI 之间的界限已经消失。转向 AI 的客户表示,他们喜欢矢量单元,但需要更多操作。因此,我们开发并开源了完全符合 RISC-V 的张量指令。这些指令目前正在 RISC-V 工作组中推进。我们的目标是帮助客户使用简单的、仅 RISC-V 软件堆栈部署 AI,确保我们的解决方案在 AI 发展过程中仍然可行。”
RISC-V 内部似乎正在向标准化转变,配置文件确保兼容性,同时允许进行一些定制。您是这样认为的吗?
Espasa表示:“定制是 RISC-V 成功的关键,尽管一些竞争对手似乎对此犹豫不决。配置文件很有用——它们为软件优化提供了基础,并充分利用了多年的开发成果,就像 Linux 一样。
但是,如果 RISC-V 是纯标准化的,为什么不直接使用 Arm 呢?RISC-V 的吸引力在于通过定制提供额外的性能。诀窍是在标准化与灵活性之间取得平衡——利用配置文件,同时添加客户特定的增强功能而不破坏兼容性。”
您的架构支持多种配置,从张量核心到矢量核心。这如何让您与竞争对手脱颖而出?
Espasa:“许多人认为计算仅限于笔记本电脑、智能手机或数据中心,但处理器无处不在——汽车、网关、电视。这些应用程序需要专门的优化,而这正是 RISC-V 的优势所在。
我们专注于高效传输数据,而不是追求峰值基准测试分数。SPECint 或 Dhrystone 等传统 CPU 基准测试都很好,但我们优先考虑实际工作负载,例如 McCalpin 的 Stream 基准测试,它可以测量内存带宽利用率。”
Gazzillion 技术有何不同?
Espasa:“Gazzillion 允许单核实现内存带宽最大化。一位客户原本预计需要四个核心,但很高兴只用一个核心就能实现同样的性能,从而简化设计并缩短上市时间。
为了实现这一目标,我们优化了整个管道(从指令重命名到内存请求),确保核心充分利用可用带宽。如果提供更多带宽,我们会相应地进行扩展。”
AI 需要大量数据传输,Gazzillion 如何支持 AI 工作负载?
Espasa:“ RISC-V 中关于张量单元有两种思想流派——一种主张在总线上使用独立的张量单元,另一种则主张将其集成在核心中。由于我们可以提供高带宽,因此我们选择了集成。
独立张量单元需要复杂的 DMA 编程、同步和数据传输。通过我们的方法,张量单元位于核心内,从而简化了 AI 工作负载并降低了软件复杂性。”
Ventana 和其他公司正在探索小芯片,部分是为了 IP 强化。Arm 现在也在讨论单片设计。您对小芯片和您的商业模式持什么态度?
Espasa:“我们的商业模式是传统的许可加版税。
小芯片是一种显而易见的演进,这不一定是因为 Arm 大力推广,而是因为它们在更接近硅片的地方能获得更多价值。有些客户无法承受三年的设计周期,他们更喜欢能在 18 个月内部署的解决方案。
芯片组还不是一站式解决方案。目前,主要公司(如 Nvidia)正在内部连接自己的芯片组。下一步是让不同的供应商集成他们的芯片组。在此之前,我们预计客户会将现有的芯片组与 PCIe 或 UCIe 等标准接口集成。我们正在积极开展这一领域的工作,但目前还没有宣布任何消息。”
可以采取什么措施来优化电源效率?
Espasa:“你需要优化触发器、时钟门控和时钟树。新设计比几十年来积累的低效率旧设计更具优势。我们的全新设计可实现更精简的电源管理。此外,我们实施了积极的电源门控 — 在运行张量时关闭矢量单元,反之亦然。”
随着 RISC-V 日趋成熟,大规模采用还面临哪些障碍?
Espasa:“ RISC-V 基金会正在努力开发服务器领域,由于需要大量规范,该领域非常复杂。AI 标准化是另一个关键领域——我们需要一种统一的方法来实现软件的可重用性,同时保持灵活性。RISC-V 已经占据了微控制器领域的主导地位。接下来是手机和笔记本电脑,但这取决于主要参与者是否确保软件准备就绪,尤其是针对 Android。”
评论