正在阅读:

同一个问题被问100遍,被“封神”的ChatGPT终于穿帮了

扫一扫下载界面新闻APP

同一个问题被问100遍,被“封神”的ChatGPT终于穿帮了

ChatGPT的回答在逻辑性和完整度上都超越了国内的聊天机器人。

文|速途元宇宙研究院 赵佳茹

忽如一夜春风来,ChatGPT成为了这段时间科技圈里最热门的话题。如果逢人不提上两句,甚至都要担心自己“元宇宙KOL”的身份难保了。

事实上,作为由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,ChatGPT实现了人工智能技术处理自然语言的能力突破。据官方介绍,ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动。

在速途元宇宙研究院体验过ChatGPT之后,发现它相比传统的AI聊天工具或AI语音助手,虽然仍然存在一些AI错误理解而导致的瑕疵,不仅拥有远超现阶段语言类AI流畅的表达能力,能够模拟真人来聊天交流,且拥有逻辑清晰的总结能力,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

ChatGPT的强大,也引来了行业大佬的“盛赞”。马斯克表示,“ChatGPT很惊人,我们离强大到危险的人工智能不远了。”微软CEO纳徳拉说,“这辈子第一次见这么大的技术浪潮,AIGC堪比工业革命!微软将全线接入ChatGPT。”连比尔盖茨都赞叹:“AI 将成为2023年最热门的话题,那是合适的。这(AI)与 PC 和互联网一样重要......这让我能一窥未来,整个平台的方法和创新速度都令我印象深刻。”

凭借出色的能力,让ChatGPT成为了史上增长最快的消费者应用,有数据显示,ChatGPT的月活跃用户在今年1月份预计达到了1亿。甚至有调查称,89%的美国大学生已经在用ChatGPT写作业,还有美议员已经开始通过ChatGPT写演讲稿、写文案、写邮件、甚至写代码。

01、爆火的ChatGPT究竟是什么? 

虽然ChatGPT尚未面向中国开启注册使用,但仍然激起了国内科技从业者的关注,在微博上,#专家称ChatGPT对话水平已超过9成人类#等相关话题阅读量达3540万,小红书ChatGPT相关笔记超6200篇,“ChatGPT会取代脑力劳动吗”登上抖音热榜,网友们在社交媒体上表达了对ChatGPT的关注。

 

ChatGpt不仅收获了网友的空前关注,也获得众多企业的认可,接连宣布布局ChatGPT。

2月2日,微软宣布旗下所有产品将全线整合ChatGPT,有消息指预计3月ChatGPT将内置于Bing搜索;百度将在3月推出基于ChatGPT的生成式搜索;数字媒体公司Buzzfeed计划使用OpenAI的 AI 技术来协助创作个性化内容;天娱数科旗下元境科技虚拟数字人宣布已接入ChatGPT等模型。美国数字媒体公司BuzzFeed也宣布,计划使用OpenAI提供的人工智能技术协助创作个性化内容。速途元宇宙研究院也注意到,在“一站封神”之后, ChatGPT被众多媒体、网友认为是人工智能飞速发展的成果,未来必将取代人类的工作,华尔街见闻发布文章称《ChatGPT可能马上取代你,这是它能做的十个工作》,这无不让“打工人”担忧未来会被人工智能替代。 笔者的朋友圈中也不乏出现“开始焦虑AI代替人类”的声音。

虽然ChatGPT一度被演绎的神乎其神,但研究院分析师何煦却为笔者泼了一盆冷水,表示“把同一个问题问上10遍,将打破你对于人工智能的任何期待”。而“不信邪”的笔者亲测了ChatGPT,并把提问次数放大到了100次。没想到,ChatGPT果然“穿帮”了!1、“摆烂”的ChatGPT

为了让提问更有“烟火气”,速途元宇宙研究院第一个问题选择了“情人节送什么礼物,预算500块”,用并不工整的语句,挑战Chat GPT的理解能力。而ChatGPT也十分给力的提供了5种方案:

在得到这样回答的时候,笔者有些惊喜,从开头、礼物推荐分类、结尾,展现出完整的回答逻辑,这与之前笔者体验过的AI对话产品相比,的确优秀很多。

然后紧接着在第2次询问后,得到的答案更加细化,开头、礼物推荐的举例都逐渐饱满,结尾也更加丰满具备了感情色彩,相较第一次的回答更加有了“标准答案”的味道。

接下来,在第3次和第4次的回答中,出现了细分类的改变,比如将首饰、书籍电影的分类替换成鲜花、电子产品,看得出是从几个方案中排列组合的结果,但开头和结尾均未发生变化,让笔者仿佛看到了当年担心论文“查重”而绞尽脑汁修改细节的我。而到了第5次和第6次,笔者惊讶地发现ChatGPT的回答与第4次完全一致,仿佛已经到达了AI的“瓶颈”……

而在接下来第7到第100次的回答中,ChatGPT索性开启了“摆烂”模式,所有的回答不能说十分相近,只能说是一模一样内容均未发生变动,仿佛已经触碰到了人工智能的极限。果真10遍之内就“穿帮”得一览无遗。2、“抖机灵”的ChatGPT

在第二个问题,速途元宇宙研究院选择了“今天中午我吃的四喜丸子,你能用300字描述这道菜的精髓吗?”来测试ChatGPT的语言编撰能力。

在经历前5次轮番询问后,开头均是“很抱歉,因为字数限制,我无法/不能详细描述四喜丸子的精髓”,笔者发现,这一段回复字数在184字左右,仿佛开头也是为了拼凑字数的。就当笔者认为ChatGPT仿佛又要开启“摆烂”模式的时候,ChatGPT经历了一段时间的思考突然“话风一转”,一改刚才“抱歉”的笔风,在第6次回答中实现了356字的转变,以总-分-总的结构对“四喜丸子”进行描述,文案类似文库中摘录的段落,但整体的逻辑性和完整性已经超越了很多AI对话产品。

但就在速途元宇宙研究院希望ChatGPT再次“超常发挥”时,它又双叒叕开启了“反查重”模式,第7-100次的文案几乎与第6次趋同,仅在描述细节上有些许改变。

速途元宇宙研究院在体验中发现,ChatGPT也需要一定的“思考”时间,似乎每个问题的答案都有“极限回答”,经历几次的答案变动后,剩余几十次的内容趋同,而对于人类来讲,同一个问题问几次之后便会出现不耐烦等情绪,但ChatGPT没有情绪表达,更像是智能整合、搜索资料的引擎,回答和搜索能力均受到资料库的限制。

02 、你害怕被AI代替吗?

速途元宇宙研究院向ChatGPT这样提问“你觉得你会取代人类吗?”

笔者收到的回答是这样的:

这让笔者不得不联想到《流浪地球2》中的MOSS,它的背后是达到通用级别的量子计算机,即几乎可用于任何需要强大算力的场景之下,从550A、550A 到550C 再到550W,在进化迭代中,人工智能MOSS拥有了“自我意识”,控制着全球数万台行星发动机,给了“丫丫”七十年的数字生命,甚至是空间站危机、月球危机、木星危机的制造者。让人们感觉到拥有“自我意识”后的AI是极其可怕的事情。但从ChatGPT这种“穿帮”的表现来看,它离我们想象中的“AI自我意识”仍然有很长的路要走。

速途元宇宙研究院与多位大厂算法工程师及AI产品经理交流,他们也纷纷表达了对算法意识的担忧“大模型会催生新的AI浪潮,ChatGPT创作能力得到全球用户的关注,但未来是否会有迁移能力,比如物联网、汽车等”“不怕人工智能模式识别能力强,最怕拥有感性思维和自我意识”“AIGC所生产的感知类(图像、音乐等)内容有可能会取代人类创作,但认知类(文字)等创作内容还有段距离”等等。

为了体验国内AIGC的创作能力,速途元宇宙研究院还体验了一把“小冰虚拟男友”,结果发现“渣男”在“打太极”,连中午吃什么都不愿意和“我”说。

由此看来,ChatGPT的回答在逻辑性和完整度上都超越了国内的聊天机器人。对此,有AI领域资深从业者向速途元宇宙研究院表示,ChatGPT虽然还有很多缺陷,但已经走在AI行业的前列,相比现在市面上的聊天机器人,已经进步很多了,但ChatGPT的发展仍局限在目前为止的人类智慧中,代替人类还不足以担忧,但创作者可以使用ChatGPT进行辅助创作。

但随之而来的问题也逐渐凸显,ChatGPT所创作的内容版权归属问题、学生作弊、文者抄袭等问题,以及ChatGPT出现“说谎”等问题,有不少用户表示,ChatGPT的回答内容有误。

对此,国内律师肖飒团队认为“抛开人工智能产业的整体监管图景和人工智能伦理规制问题,ChatGPT等AI聊天基础存在的现实合规问题也急需重视。倘若ChatGPT应用到搜索引擎、客诉系统等领域,ChatGPT回复的虚假信息问题可能造成极为严重的法律风险。”

此外,肖飒团队表示,如果ChatGPT的答复中拼接了语料库中拥有著作权的作品(虽然依据ChatGPT的工作原理,这种情况出现的概率较小),那么按照中国现行的著作权法,除非构成合理使用,否则非必须获得著作权人的授权后才可以复制。

速途元宇宙研究院认为,虽然ChatGPT在应用中也不乏出现一些劣质回答以及无效信息,但其可以称之为目前AIGC领域的“优等生”,逻辑能力和完整度可圈可点。同时,ChatGPT也并没有外界吹捧的神奇,AI创作能力的发展远没有尽头。速途元宇宙研究院注意到,ChatGPT的成功不仅凭借于自然语言算法国内的进步,背后也依靠着成熟的AI大模型。

而国内例如百度、商汤、科大讯飞等人工智能企业,近年来在AI大模型领域也取得了突破性的进步,他们有实力也有能力,通过技术创新赶超ChatGPT,成为行业新的开拓者。未来AIGC创作是否能代替人类我们不得而知,其应用场景也不仅限于文字、图片等创作,因此我们依旧倡导“创新无限,科技向善”的创新精神,希望与行业一起共同见证AIGC领域的持续健康发展。

 

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

同一个问题被问100遍,被“封神”的ChatGPT终于穿帮了

ChatGPT的回答在逻辑性和完整度上都超越了国内的聊天机器人。

文|速途元宇宙研究院 赵佳茹

忽如一夜春风来,ChatGPT成为了这段时间科技圈里最热门的话题。如果逢人不提上两句,甚至都要担心自己“元宇宙KOL”的身份难保了。

事实上,作为由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,ChatGPT实现了人工智能技术处理自然语言的能力突破。据官方介绍,ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动。

在速途元宇宙研究院体验过ChatGPT之后,发现它相比传统的AI聊天工具或AI语音助手,虽然仍然存在一些AI错误理解而导致的瑕疵,不仅拥有远超现阶段语言类AI流畅的表达能力,能够模拟真人来聊天交流,且拥有逻辑清晰的总结能力,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

ChatGPT的强大,也引来了行业大佬的“盛赞”。马斯克表示,“ChatGPT很惊人,我们离强大到危险的人工智能不远了。”微软CEO纳徳拉说,“这辈子第一次见这么大的技术浪潮,AIGC堪比工业革命!微软将全线接入ChatGPT。”连比尔盖茨都赞叹:“AI 将成为2023年最热门的话题,那是合适的。这(AI)与 PC 和互联网一样重要......这让我能一窥未来,整个平台的方法和创新速度都令我印象深刻。”

凭借出色的能力,让ChatGPT成为了史上增长最快的消费者应用,有数据显示,ChatGPT的月活跃用户在今年1月份预计达到了1亿。甚至有调查称,89%的美国大学生已经在用ChatGPT写作业,还有美议员已经开始通过ChatGPT写演讲稿、写文案、写邮件、甚至写代码。

01、爆火的ChatGPT究竟是什么? 

虽然ChatGPT尚未面向中国开启注册使用,但仍然激起了国内科技从业者的关注,在微博上,#专家称ChatGPT对话水平已超过9成人类#等相关话题阅读量达3540万,小红书ChatGPT相关笔记超6200篇,“ChatGPT会取代脑力劳动吗”登上抖音热榜,网友们在社交媒体上表达了对ChatGPT的关注。

 

ChatGpt不仅收获了网友的空前关注,也获得众多企业的认可,接连宣布布局ChatGPT。

2月2日,微软宣布旗下所有产品将全线整合ChatGPT,有消息指预计3月ChatGPT将内置于Bing搜索;百度将在3月推出基于ChatGPT的生成式搜索;数字媒体公司Buzzfeed计划使用OpenAI的 AI 技术来协助创作个性化内容;天娱数科旗下元境科技虚拟数字人宣布已接入ChatGPT等模型。美国数字媒体公司BuzzFeed也宣布,计划使用OpenAI提供的人工智能技术协助创作个性化内容。速途元宇宙研究院也注意到,在“一站封神”之后, ChatGPT被众多媒体、网友认为是人工智能飞速发展的成果,未来必将取代人类的工作,华尔街见闻发布文章称《ChatGPT可能马上取代你,这是它能做的十个工作》,这无不让“打工人”担忧未来会被人工智能替代。 笔者的朋友圈中也不乏出现“开始焦虑AI代替人类”的声音。

虽然ChatGPT一度被演绎的神乎其神,但研究院分析师何煦却为笔者泼了一盆冷水,表示“把同一个问题问上10遍,将打破你对于人工智能的任何期待”。而“不信邪”的笔者亲测了ChatGPT,并把提问次数放大到了100次。没想到,ChatGPT果然“穿帮”了!1、“摆烂”的ChatGPT

为了让提问更有“烟火气”,速途元宇宙研究院第一个问题选择了“情人节送什么礼物,预算500块”,用并不工整的语句,挑战Chat GPT的理解能力。而ChatGPT也十分给力的提供了5种方案:

在得到这样回答的时候,笔者有些惊喜,从开头、礼物推荐分类、结尾,展现出完整的回答逻辑,这与之前笔者体验过的AI对话产品相比,的确优秀很多。

然后紧接着在第2次询问后,得到的答案更加细化,开头、礼物推荐的举例都逐渐饱满,结尾也更加丰满具备了感情色彩,相较第一次的回答更加有了“标准答案”的味道。

接下来,在第3次和第4次的回答中,出现了细分类的改变,比如将首饰、书籍电影的分类替换成鲜花、电子产品,看得出是从几个方案中排列组合的结果,但开头和结尾均未发生变化,让笔者仿佛看到了当年担心论文“查重”而绞尽脑汁修改细节的我。而到了第5次和第6次,笔者惊讶地发现ChatGPT的回答与第4次完全一致,仿佛已经到达了AI的“瓶颈”……

而在接下来第7到第100次的回答中,ChatGPT索性开启了“摆烂”模式,所有的回答不能说十分相近,只能说是一模一样内容均未发生变动,仿佛已经触碰到了人工智能的极限。果真10遍之内就“穿帮”得一览无遗。2、“抖机灵”的ChatGPT

在第二个问题,速途元宇宙研究院选择了“今天中午我吃的四喜丸子,你能用300字描述这道菜的精髓吗?”来测试ChatGPT的语言编撰能力。

在经历前5次轮番询问后,开头均是“很抱歉,因为字数限制,我无法/不能详细描述四喜丸子的精髓”,笔者发现,这一段回复字数在184字左右,仿佛开头也是为了拼凑字数的。就当笔者认为ChatGPT仿佛又要开启“摆烂”模式的时候,ChatGPT经历了一段时间的思考突然“话风一转”,一改刚才“抱歉”的笔风,在第6次回答中实现了356字的转变,以总-分-总的结构对“四喜丸子”进行描述,文案类似文库中摘录的段落,但整体的逻辑性和完整性已经超越了很多AI对话产品。

但就在速途元宇宙研究院希望ChatGPT再次“超常发挥”时,它又双叒叕开启了“反查重”模式,第7-100次的文案几乎与第6次趋同,仅在描述细节上有些许改变。

速途元宇宙研究院在体验中发现,ChatGPT也需要一定的“思考”时间,似乎每个问题的答案都有“极限回答”,经历几次的答案变动后,剩余几十次的内容趋同,而对于人类来讲,同一个问题问几次之后便会出现不耐烦等情绪,但ChatGPT没有情绪表达,更像是智能整合、搜索资料的引擎,回答和搜索能力均受到资料库的限制。

02 、你害怕被AI代替吗?

速途元宇宙研究院向ChatGPT这样提问“你觉得你会取代人类吗?”

笔者收到的回答是这样的:

这让笔者不得不联想到《流浪地球2》中的MOSS,它的背后是达到通用级别的量子计算机,即几乎可用于任何需要强大算力的场景之下,从550A、550A 到550C 再到550W,在进化迭代中,人工智能MOSS拥有了“自我意识”,控制着全球数万台行星发动机,给了“丫丫”七十年的数字生命,甚至是空间站危机、月球危机、木星危机的制造者。让人们感觉到拥有“自我意识”后的AI是极其可怕的事情。但从ChatGPT这种“穿帮”的表现来看,它离我们想象中的“AI自我意识”仍然有很长的路要走。

速途元宇宙研究院与多位大厂算法工程师及AI产品经理交流,他们也纷纷表达了对算法意识的担忧“大模型会催生新的AI浪潮,ChatGPT创作能力得到全球用户的关注,但未来是否会有迁移能力,比如物联网、汽车等”“不怕人工智能模式识别能力强,最怕拥有感性思维和自我意识”“AIGC所生产的感知类(图像、音乐等)内容有可能会取代人类创作,但认知类(文字)等创作内容还有段距离”等等。

为了体验国内AIGC的创作能力,速途元宇宙研究院还体验了一把“小冰虚拟男友”,结果发现“渣男”在“打太极”,连中午吃什么都不愿意和“我”说。

由此看来,ChatGPT的回答在逻辑性和完整度上都超越了国内的聊天机器人。对此,有AI领域资深从业者向速途元宇宙研究院表示,ChatGPT虽然还有很多缺陷,但已经走在AI行业的前列,相比现在市面上的聊天机器人,已经进步很多了,但ChatGPT的发展仍局限在目前为止的人类智慧中,代替人类还不足以担忧,但创作者可以使用ChatGPT进行辅助创作。

但随之而来的问题也逐渐凸显,ChatGPT所创作的内容版权归属问题、学生作弊、文者抄袭等问题,以及ChatGPT出现“说谎”等问题,有不少用户表示,ChatGPT的回答内容有误。

对此,国内律师肖飒团队认为“抛开人工智能产业的整体监管图景和人工智能伦理规制问题,ChatGPT等AI聊天基础存在的现实合规问题也急需重视。倘若ChatGPT应用到搜索引擎、客诉系统等领域,ChatGPT回复的虚假信息问题可能造成极为严重的法律风险。”

此外,肖飒团队表示,如果ChatGPT的答复中拼接了语料库中拥有著作权的作品(虽然依据ChatGPT的工作原理,这种情况出现的概率较小),那么按照中国现行的著作权法,除非构成合理使用,否则非必须获得著作权人的授权后才可以复制。

速途元宇宙研究院认为,虽然ChatGPT在应用中也不乏出现一些劣质回答以及无效信息,但其可以称之为目前AIGC领域的“优等生”,逻辑能力和完整度可圈可点。同时,ChatGPT也并没有外界吹捧的神奇,AI创作能力的发展远没有尽头。速途元宇宙研究院注意到,ChatGPT的成功不仅凭借于自然语言算法国内的进步,背后也依靠着成熟的AI大模型。

而国内例如百度、商汤、科大讯飞等人工智能企业,近年来在AI大模型领域也取得了突破性的进步,他们有实力也有能力,通过技术创新赶超ChatGPT,成为行业新的开拓者。未来AIGC创作是否能代替人类我们不得而知,其应用场景也不仅限于文字、图片等创作,因此我们依旧倡导“创新无限,科技向善”的创新精神,希望与行业一起共同见证AIGC领域的持续健康发展。

 

本文为转载内容,授权事宜请联系原著作权人。