昨天很多媒体都报道了,在刚刚结束的2017云栖大会·北京峰会上,阿里云发布了堪称迄今为止最全面的阿里AI版图。
但在阿里复杂的AI业务、产品和合作生态背后,也许我们能够发现一个关键词:产业AI。
产业AI到底和其他AI有什么不同?让阿里举重兵投入的道理何在?
什么才是产业AI?
虽然这个问题看起来像….废话….但是没办法,真相往往跟我们的想象或多或少有点不同。
顾名思义,产业AI当然是在具体的一个个产业里发挥作用的AI技术和产品咯。也就是我们经常说的AI赋能传统行业。但有点不同的是,我们在讨论AI赋能行业,或者所谓“AI+”的时候,往往设想的是以AI为主体,来实现某个领域的固有功能。比如一些AI+教育平台,就是用AI的语音交互和NLP能力,来实现远程教育功能。
在这种情况下,一般思考的是用AI替代,而不是用AI结合。它能改善一些情况,却无法真正提高这个产业本身的效率,降低原始成本,更不能融合在整个产业线之中。
所谓产业AI,必须是能够与传统产业无缝结合,推助产业核心部类向前发展的。这也是阿里云从ET大脑到产业AI布局的根本诉求。尤其需要注意的是,深度的产业AI必然指向复杂的行业限制和真实需求,往往比简单的AI替代论复杂很多。
比如说想让AI来计算机场的停机坪使用情况,提高停机坪的使用效率。听起来蛮简单的一件事,但是一名真正的机场调度员,却需要考虑航班号、机型、国际国内分类、近机位优先原则、机上状况、航空公司情况、机场建设状况、流量状况、延误航班对下序航班的影响、天气状况等等十几个因素才能决定飞机停泊的机位。假如AI系统只算了其中一两个,漏算了某些因素,岂不是耽误了大事?
所以说,产业的需求往往比我们一般想象中复杂太多,综合来看,AI想解决产业问题,必须具备四个方面的基础能力:
1多维感知能力:真实世界中,数据和信息常常是从几个方向混杂过来。假如AI只能听、只能看,或者只能连接数据库,那么它就会变成盲人摸象型AI。只能用来炫耀某种能力,却无法真正投入使用。
2全局洞察模式:能感知之外还要能分析和归纳,就像上面说的运算停机坪。AI必须综合各方面信息和实时变化的数据流,随时做出统领全局的最优解。这就是我们所说人类的大局观。没有大局观的人不能胜任管理,没有大局观的AI也是一样。
3人机协同体验:想做产业AI,必须承认的一点是今天的AI绝不可能,也不希望彻底取代人类。必须是人机协同的工作模式,但是人机如何协同,如何在缩减人的工作时间,提高人的工作效率之外,不会浪费大量学习成本和适应成本,也是关键问题。
4持续进化能力:日新月异的工作,必须让人不断去适应和学习新的工作方式,对于AI也是一样,如果产业AI不能进化,那么工作需求一旦变更AI就变成废铁一块,那确实不要也罢。
为了解决这四个问题,阿里云的解决方案是做一个产业综合体:ET大脑。
但是这可能还不够,产业AI之路,绝不是单纯的技术能力可以搞定的。
到底该如何打造产业AI?
如果你身处一个比较传统的行业,不妨想想,假如为你安排一位超级智能的AI助手,你的第一反应是什么?
很兴奋?那么第二反应呢?大概是感觉学起来很麻烦,不知道到底好用不好用,担心成本和收益不相符,等等等等。
这是没有办法的,人在面对新事物时的先验反射永远都是排斥和怀疑。尤其是AI这种先天具有科幻色彩的技术与产品。所以说,实验室和PPT上的AI是相对容易的,但产业AI却要更复杂。其复杂程度很多时候不在于单纯的技术挑战,而在于需要复杂且长期的企业合作、谈判沟通和对细节的苛求。总之,都是苦差事和累差事。
阿里的产业AI构想,至少要满足三个条件:
1、深入场景的需求。很多AI技术走进现实时,往往会太重AI太轻现实,这样做的直接结果是完全低估了产业化进程的难度。
比如阿里云在打造ET工业大脑的时候,面对的都是已经二三十年的老机器。这些机器怎么AI?怎么能够不给企业成本压力,如何让老工厂的工人懂得使用?可能都是科学家一般不会思考的问题,却真实阻挡了工厂的AI化。而阿里云的解决方案蛮简单粗暴的:直接派工程师在车间蹲守。
2、与行业从业者相结合。我们时长忽视的一个问题,是AI技术有时候并不能讨人喜欢。看似有道理的技术解决方案,在真实产业场景里其实是无效的。
比如AI语音解决方案与法院场景的合作。一般我们理解法院使用语音交互,无非就是对庭审进行记录,代替书记员的工作。但事实上却不是这么回事,直接将庭审对话转换成文字,夹杂了大量的口语内容,根本是无效记录,反而加大了书记员工作的难度。真正需要的是AI能够理解文本、抽取逻辑将庭审记录简化,这才能真正帮到书记员。
所以说,真正的产业AI必须以从业者为核心去思考问题,这需要对产业深度的理解,以及关键领域的产业深度合作。
3、跨技术解决方案。另一种AI产业化中必须面对的问题,是真实问题往往比实验与测试中复杂很多。比如AI地铁售票机,让用户用语音交互的方式买地铁票。但在地铁这么嘈杂的环境里,语音识别实在过于复杂。最终的解决方案,是加强收音阵列硬件的同时,用机器视觉技术识别人脸和嘴唇,让售票机听到兼看到买票者,才能最终解决问题。
这三条途径,归根结底是巨大的产业合作任务和工程化工作量。在具备技术基础的同时,还要求执行企业有行业合作能力、工程化能力和个案攻坚能力。
这是一条不好走的路,但是诱惑巨大。
产业化路途中的AI新战场
阿里的产业AI梦,可能给阿里本身带来哪些好处呢?
目前阿里的方案,是通过ET大脑,陆续占领城市、工业、零售、金融、汽车、家庭等场景。将AI能力、产品和解决方案,以阿里云为出口进入各行各业。
用这种 “现实主义AI”思路,阿里可能希望获得多方面的利益和战略优势。比如:
1、从全面场景到良性AI产业循环。从工业、交通,到环境、航空,ET大脑的布局逐渐向全景化、垂直化双向发展。未来的最优结果是能覆盖经济民生关键感知端口的AI系统,可以运用这些场景能力通向整体进化。而良好的产业合作步伐,则给升级能力带来了进一步出口。场景、技术和合作,正在形成AI体系的递增三角关系。
2、可复制的AI解决方案。从航空大脑的案例中不难看出,ET大脑的解决方案和能力基础是具备高度复制化的。当一个领域需要复杂的运算,多种感知数据的结合,并且人工效率始终很低,那么就可以自发引入ET大脑。这种领域在生活中相当多见。当ET大脑的产业AI解决方案复制到某个量级时,生态性、泛在化的产业AI自发衍生或许将会出现。
3、关键领域的直接价值。工业、医疗到交通航空,都是可能带来直接客户和收入的领域,不用太考虑股价和估值的阿里,或许更期待用AI换来真金白银。
无论阿里的产业AI梦是否成立。至少有一点是肯定的:让AI能用,有用,普通人乐于去用,是这个技术不会变成另一个泡沫的根本保障。
评论