正在阅读:

成本降低20% ?蚂蚁集团回应自研大模型训练降本

扫一扫下载界面新闻APP

成本降低20% ?蚂蚁集团回应自研大模型训练降本

蚂蚁集团称,会逐步通过开源分享。

图片来源:界面图库

3月24日,针对媒体对蚂蚁百灵大模型训练成本的报道,蚂蚁集团方面回应界面新闻称,蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

此前有报道称,蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术,这将使成本降低20%。知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用混合专家(MoE)机器学习方式来训练模型。他们表示,蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。

其中一位知情人士称,蚂蚁集团仍在使用英伟达的产品进行人工智能开发,但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。

该技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已在预印版Arxiv平台上发表。

除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已通过备案,重点布局在生活服务、金融服务、医疗健康等场景的应用。

 

未经正式授权严禁转载本文,侵权必究。

蚂蚁集团

2.2k
  • 国产算力生态有望迎来重大突破,人工智能ETF(515980)连续4天净流入,最新份额创近1年新高!
  • 科技早报 | 蚂蚁集团回应自研大模型训练降本20%;腾讯领投智元机器人

英伟达

7.5k
  • 英伟达Rubin据悉将采用台积电SoIC技术
  • 美股七巨头全线飙涨,特斯拉暴涨近12%!美国50ETF(159577)放量涨超1%,连续7日吸金

发布评论

您至少需输入5个字

评论

暂无评论哦,快来评价一下吧!
互联网日常
互联网圈日常大事小事。

下载界面新闻

成本降低20% ?蚂蚁集团回应自研大模型训练降本

蚂蚁集团称,会逐步通过开源分享。

图片来源:界面图库

3月24日,针对媒体对蚂蚁百灵大模型训练成本的报道,蚂蚁集团方面回应界面新闻称,蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

此前有报道称,蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术,这将使成本降低20%。知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用混合专家(MoE)机器学习方式来训练模型。他们表示,蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。

其中一位知情人士称,蚂蚁集团仍在使用英伟达的产品进行人工智能开发,但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。

该技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已在预印版Arxiv平台上发表。

除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已通过备案,重点布局在生活服务、金融服务、医疗健康等场景的应用。

 

未经正式授权严禁转载本文,侵权必究。

下载界面新闻

微信公众号

微博