文|Metaverse元宇宙 贾桂鹏
2月17日,有知情人透露,日本投资界巨头软银集团(SoftBank Group Corp.)创始人孙正义(Masayoshi Son)正在寻求筹集最高达1000亿美元的资金,打造一家规模庞大的合资芯片公司。
据了解,该项目代号为“Izanagi”,标志着这位亿万富翁在软银大幅削减初创公司投资之际的下一个重大尝试。知情人士表示,孙正义设想创建一家公司,能够与芯片设计部门Arm形成互补,并让这位亿万富翁能够打造一家庞大的人工智能芯片公司。
而孙正义的设想与OpenAI CEO山姆·奥特曼的计划不谋而合,日前,奥特曼计划筹集7万亿美元重塑全球半导体行业,如果这两家企业的想法能实现,那对整个半导体行业都会造成巨大的冲击。
其中,在AI时代顺风顺水的半导体巨头英伟达恐怕不乐于看到这样事情发生,因此,他们想出的应对方案就是在大模型领域“狙击”OpenAI。日前,英伟达推出了自家版本的ChatGPT,名叫Chat With RTX。
而回到大模型领域的OpenAI日前也是重磅频出,分别推出ChatGPT记忆功能和文生视频模型Sora,也算是对英伟达进入大模型领域做出回应。两家企业分别在对方“主战场”方向“擦枪走火”好不热闹。
那么,在OpenAI继续高歌猛进的同时,英伟达为何要布局大模型呢?随着英伟达的入局,将会给大模型市场带来怎样的竞争呢?
OpenAI在大模型领域继续开疆扩土
2月13日,OpenAI在一篇最新博客文章中表示,该公司正在测试一项新功能,使这款流行的聊天机器人可以在每次交流时保留用户提供的特定信息。ChatGPT还能够自动判断,与用户对话中的哪些内容应该被记住。
虽然为每个用户建立更详细的历史记录可能会产生新的隐私问题,但这也是互联网公司定制每个人的体验并锁定客户忠诚度的有效方法。OpenAI此前曾允许用户为ChatGPT提供自定义指令,以避免用户在每次聊天中重复赘述他们的偏好,而新功能无疑将进一步超越上述能力。
2月16日,OpenAI在官网正式发布了文生视频大模型Sora,其可以根据用户提示生成长达一分钟的视频,同时保持视频中出现的人物、景色的连贯性,甚至即便切换镜头,人物依然能够保持一致。
在我们看来,Sora模型的发布标志着AI技术在内容创作领域的一个新纪元。
通过简短的文本提示或一张静态图片,Sora能够生成持续一分钟左右的高清视频,并涵盖多个角色、不同类型的动作和背景细节等,几乎达到了电影级别的逼真场景。这种能力不仅为内容创作者提供了前所未有的工具,使他们能够以更低的成本和更快的速度将创意变为现实,而且为观众带来了更丰富和多样化的视觉体验。
根据OpenAI的技术解读文件来看,Sora是一种扩散模型,它能够通过从看似静态噪声的视频,经过多步骤的噪声去除过程,逐渐生成视频,不仅能够一次性生成完整的视频,还能延长已生成的视频,通过让模型能够预见多帧内容,团队成功克服了确保视频中的主体即便暂时消失也能保持一致性的难题。Sora是能够理解和模拟现实世界的模型的基础,OpenAI相信这一功能将成为实现AGI的重要里程碑。
元宇宙新声认为,OpenAI频频的新发布,似乎在告诉所有人自己有足够积累的同时,还会源源不断的进行创新,他们还将继续引领大模型市场的走向,但另一条消息的放出,让我们意识到仅仅是大模型的市场已经不能满足OpenAI了。
山姆·奥特曼要撬动半导体市场
OpenAI的CEO山姆·奥特曼(Sam Altman)WGS(World Government Summit,世界政府峰会)透露,他正在计划筹集7万亿美元重塑全球半导体行业。
值得注意的是,7万亿美元的融资数额,相当于整个西班牙所有房产的总和,而英国2023年的GDP为3.14万亿美元,更可怕的是,美国两家最大的上市公司微软和苹果的市值相加刚刚超过6万亿美元。
而在半导体行业中,去年全球的半导体芯片市场总规模也为5270亿美元,如果没有奥特曼的项目,预计到2030年也不会达到1万亿美元。这项投资也让去年约1000亿美元的芯片制造设备市场相形见绌。
其实,奥特曼长期以来一直在谈论人工智能芯片的供需问题,对于目前的科技公司来说,要想在大模型的竞争中赶上潮流,就必须构建强大的算力设施,AI芯片正在成为瓶颈,而且已经一定程度上限制了OpenAI的成长。
据了解,在AI芯片上,OpenAI获得了微软的全力支持,奥特曼已与微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 和首席技术官凯文·斯科特 (Kevin Scott) 也讨论了奥特曼的计划。
对此,英伟达创始人兼CEO黄仁勋有些讽刺地回应道,奥特曼相信芯片行业将会推动AI成本下降:“(七万亿美元)显然能买下所有的GPU,如果你认为计算机无法发展得更快,可能会得出这样的结论:我们需要14颗行星、3个星系和4个太阳来为这一切提供燃料。但是,计算机架构其实在不断地进步。”
不过,黄仁勋也强调,计算和AI技术仍在加速发展,相关支出在不断增长:“目前全球数据中心的总价值约为一万亿美元,在未来的四到五年内,这个数字将增长到两万亿美元,这些数据中心将成为全球软件运行的原动力,在过去十年中,我们作出的最大贡献之一就是将计算和AI推进了100万倍。”
对于黄仁勋的这次高调发言,元宇宙新声认为,在AI时代OpenAI与英伟达本是上下游合作企业的关系,但是此次奥特曼把心思放到了半导体行业,就有点踏入英伟达的阵地了,这让黄仁勋不得不防,而他们防范OpenAI的方法也非常激进,那就是直接进入到大模型领域。
英伟达入局大模型领域
我们看到,英伟达此次布局大模型并不只是玩玩而已,英伟达的这款AI聊天机器人和目前主流的“选手”有所不同。它不是在网页或APP中运行,而是需要下载安装到个人电脑中。这波操作,不仅是在运行效果上会更快,也就意味着Chat With RTX在聊天内容上或许并没有那么多限制。
不过,我们也发现,Chat With RTX并非英伟达自己开发的大语言模型(LLM)。在它背后是两款开源LLM,分别是Mistral和Llama 2,用户在运行的时候可以根据喜好自行选择。
相较于其他大模型产品,英伟达Chat With RTX由于是在本地运行,其生成答案的速度非常快,而且,它还可以根据在线视频作出回答。对于这项技术,英伟达官方只是简单地说:“用到了检索增强生成 (RAG)、NVIDIA TensorRTLLM软件和NVIDIA RTX等。”看来拥有整个生态的闭环技术后,英伟达的底气很足。
不过,在首次步入大模型领域后,英伟达也显示出自己的弊端,The Verge在英伟达发布Chat With RTX后,立即展开了一波实测。但结果却不尽如人意。例如他们在测试搜索视频功能时,Chat With RTX竟然下载了完全不同视频的文字记录。
而且,如果给Chat With RTX“投喂”过多的文件,例如让Chat with RTX为25000个文档编制索引,它就直接“罢工”崩溃了。
但是The Verge在测试电脑内的文档时,也惊叹了其速度和精准度。
因此,我们也得出了一个结论,Chat with RTX还是一个比较初级的产品,暂时不太适合用于生产。但它代表了一种趋势,即让AI模型更容易地在本地运行。而这也是在硬件端“大幅领先”后最大的优势。
黄仁勋表示:“生成式人工智能是计算史上最重要的一次平台转型,它将改变包括游戏在内的每一个行业。英伟达拥有超过1亿台RTX AI PC和工作站,是开发者和游戏玩家享受生成式人工智能魔力的庞大安装基础。”
元宇宙新声认为,英伟达此次入局大模型市场也不是争一时之快,而是又一次通过软硬结合的方式来布局未来的AI市场,这一次,Chat with RTX能否像CUDA一样成功,就需要时间来给出答案了。
写在最后
我们看到,凭借ChatGPT这款火爆的聊天机器人平台,OpenAI这家成立不到9年的公司,2023年的年收入已达16亿美元,相比前年增长高达56倍。可以预见,随着GPT-5即将推出,2024年的OpenAI或将褪去科技行业最强大的“黑马”的角色,而是“登堂入室”,成为更重量级的角色。
此次,OpenAI与软银的虎视眈眈也让英伟达不得不防。在2024年年初一系列科技厂商们的动态,或许会推动AI、半导体市场甚至整个科技领域都在今年进入到新时代,是新贵高歌猛进,还是巨头继续统领市场?我们拭目以待。
评论