界面新闻记者 |
界面新闻编辑 | 彭朋
DeepSeek火爆出圈之后,国产大模型产业风起云涌,使得2月热闹非凡。
2025年2月21日至23日,“2025全球开发者先锋大会”将在上海举办。界面新闻近期获悉,本届大会上,一批国内外头部人工智能企业将在此次大会期间发布重磅技术与解决方案,涵盖智能开发工具、多模态大模型、企业级服务以及开源生态等多个领域。
其中,在本届大会上,商汤将发布两大产品——代码小浣熊2.0与LazyLLM开源框架。前者可实现端到端的企业代码资产管理能力,帮助企业筛查代码漏洞、优化迭代路径,甚至自动生成测试用例。一站式开源Agent开发框架LazyLLM,则通过模块化设计快速拼接意图识别、知识库检索与大模型能力,实现“搭积木式”应用开发。
2024年,MiniMax发布国内首个商用MoE架构万亿参数大模型MiniMax-abab 6.5,综合能力对标GPT-4,其训练与推理成本较传统Transformer降低超50%。此次大会,MiniMax将展示多项成果,并举办多场技术论坛,探讨大模型开源与多场景应用。
记者注意到,今年年初,DeepSeek火爆出圈,开源、算力成本的大幅降低成为其重点特性。无论是商汤还是MiniMax,头部人工智能企业都纷纷把注意力放在了开源,并致力于算力成本降低。
就在大会召开前夕,阶跃星辰开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。Step-Video-T2V 模型的参数量达到300亿,可以直接生成 204帧、540P分辨率的视频,生成内容具有高信息密度并保持一致性。开源语音交互模型Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。
值得注意的是,不仅是上述三家参会企业,今年2月份,字节豆包、昆仑万维、百度文心、阿里通义千问均推出“开源”模型。
不可否认的是,正是DeepSeek的成功,才让业内看到开源的胜利。图灵奖得主、Meta 首席 AI 科学家杨立昆说,DeepSeek 成功的最大收获是 AI 开源的价值使任何人都能受益,“正确解读应是‘开源模型正超越闭源模型’。”
借助开源,大模型厂商来实现模型能力的提升。
商汤科技产品总监、小浣熊家族产品负责人贾安亚告诉界面新闻记者,“随着DeepSeek的火爆,更多人开始尝试使用。对于整个AI生态和产业发展来说,这都是一个非常利好的消息。一些开源模型在很多能力上有亮点,他们也希望通过保持产品的开放性、博采众家之长,接入更多更好的模型。”
MiniMax公司副总裁刘华同样认为:“高水平大模型的开源,有助于推动行业的加快发展,能够让大众免费体验到优秀大模型的技术能力,有助于提高AI的渗透力,吸引更多的开发者一起参与大模型的研发。”
阶跃星辰副总裁李璟则认为,国内开源生态的成熟,推动了厂商开源动力,“阶跃星辰此次开源大模型发布后,第一时间就得到了云厂商、社区、芯片厂商的跟进适配,这些动作都是自发形成的,说明开源社区的蓬勃生机和力量,也能帮助厂商更好地去做模型迭代。”
开源,还有望解决大模型商业化路径模糊的“痛点”。
浙商证券在研报中指出,开源模型催化推理算力,联合创新推动中国 AI 产业生态崛起:AI应用部署门槛降低以及成本带动应用繁荣,并催化推理算力需求快速增长。 在推理端,软件企业合作趋势强化,例如华为与 SiliconFlow合作推出 DeepSeek R1/V3 推理服务。
商汤科技产品总监、小浣熊家族产品负责人贾安亚向界面新闻记者表示,大模型应用部署门槛降低以及算力成本的降低,会加速大模型向端侧部署,“商汤也正与企业合作,加速大模型与硬件结合,未来有望出现在AI PC等智能硬件中。”
同样,此次阶跃星辰是与吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。吉利汽车集团CEO淦家阅表示:“目前,吉利全栈自研的星睿AI大模型已经与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合,将为用户带来更智能、更高阶的座舱交互与智驾出行体验,推动AI科技在智能汽车领域的普及。”
李彦宏在近期公开信中强调,2025年AI应用将井喷式增长,而规模化离不开开源生态的支持11。随着算力平民化与社区协作深化,开源大模型有望在5-10年内超越闭源模型的技术水平。
作为大模型“开源派”,MiniMax公司副总裁刘华指出,未来,在很多复杂的场景下,大模型会有更多的用处,也能对生产力产生立竿见影的效果。
评论