记者 |
由于服务器芯片战略获得成功,亚马逊云科技(AWS)正乘胜追击。
北京时间12月1日,全球最大的云厂商亚马逊云科技在re:Invent大会上发布了公司定制设计的云端芯片Graviton 3和Trainium,称除了使用成本低外,效能也更加优化。
Graviton 3是亚马逊云科技Graviton系列的最新一代的芯片,基于Arm架构。据称较前一代Graviton 2相比,通用运算力约可以高出25%。但如果特别专注在科学领域、加密领域等使用浮点运算的话,性能最快可达2倍,若是机器学习的话甚至能支持多达3倍性能,且节能最高可达60%。
亚马逊弹性运算云端副总裁Dave Brown表示,预计Graviton 3的性价比将大大超过英特尔芯片。目前,云端CPU绝大部分都是英特尔X86架构的处理器。
Trainium芯片专供机器学习训练(Training)任务,该芯片主要用于训练机器学习运算模型,并针对图片分类、语义搜索、翻译、语音识别、自然语言处理、推荐引擎等深度学习训练工作进行了优化,成本较英伟达的旗舰GPU芯片低40%,预计在不久后推出。
AI计算大致分为两个层面,首先是对模型进行训练(training),整个过程可能耗时数天;之后是训练出的模型响应实际请求,做出推理(inference)。目前,英伟达旗下的GPU(图形处理器)占据训练市场,多数推理任务则仍由传统的英特尔CPU承担。
此前亚马逊云科技已推出基于机器学习推理的服务器芯片Inferentia,支持主流深度学习框架,包括谷歌开发的TensorFlow、Facebook开发的PyTorch和MXNet等。
至此,亚马逊云科技对云端机器学习计算进行了完整的芯片布局。亚马逊云科技大中华区产品部总经理顾凡解释称,Trainium和Inferentia是相辅相成的芯片,可以为客户提供从推理到训练一整套端到端的机器学习计算流程。而且由于Trainium和Inferentia共享相同的神经网络SDK,原本就熟悉Inferentia的开发者很快就能上手Trainium。
不过,亚马逊云科技仍与英特尔、AMD和英伟达保持合作。比如其将Graviton处理器与英伟达GPU搭配使用,为安卓游戏开发商服务。在大会上,亚马逊云科技还宣布采用AMD第三代服务器芯片。
但即使使用英伟达或AMD的芯片,即使算力足够快,亚马逊云科技仍然认为,在机器学习端,训练持续变大的AI模型仍然是非常昂贵和耗时的,自己需要向上游延伸。
亚马逊云科技将其运算能力出租给客户,如今已成为世界上最大的云运算服务提供商,也是服务器芯片最大买家之一,其2020年销售额达453.7亿美元。2015年,亚马逊云科技收购了以色列芯片公司Annapurna Labs,目的就是为了设计定制化芯片,来支持不同的云服务需求,上述的Arm芯片和AI芯片都得益于这一收购。
本次re:Invent大会上,亚马逊云科技除了发布Graviton 3和Trainium两款逻辑芯片外,还有一款SSD(固态存储驱动器,即固态硬盘)产品,用于云端的数据存储和读写。
芯片产品发布后,亚马逊盘前股价上涨1.22%,至每股3550美元。
评论