前几天,网上传出一条重庆市一座拥有五层桥面,十余条匝道的"最任性"立交桥——黄桷湾立交桥建设完成,只待收尾通车的消息。
经常驾车在一些大城市立交桥上被迷得不知所措的我看到这条消息,正担心重庆的同志们以后如何从这座桥上精彩地"盘"下来,又从当地媒体的新闻中得知,有同样担心的记者们在桥面上采访报道时,已经碰上了百度地图的数据采集员和采集车在采集作业。
据媒体了解,百度地图数据采集团队是最早杀到黄桷湾立交桥进行数据采集,并且也是迄今为止唯一一家前来进行勘测作业的电子地图数据采集团队。现在打开百度地图应用,已经可以查询到黄桷湾立交的相关信息了。高德、腾讯地图等国内其他地图软件目前还没有直接录入这座立交桥的信息。
同样是在3月,《关于进一步加强城市规划建设管理工作的若干意见》颁布后,北京市规划委于这一天公布了首个“拆墙”试点,位于西城区的三里河南二巷将率先拓宽为市政路。百度地图采集团队在消息公布同时,也在第一时间前往三里河南二巷完成新道路上线前的勘察工作。而在刚刚过去的37女生节期间,百度地图分布在全国各地的外采员同步用方言表白女神,引发网友对百度地图自采团队的关注。
这短短几天时间发生的几件事,体现了百度地图正在集中进行一轮外部攻势,但实际上都与地图的基础数据采集有关。尽管在智能化时代,人工数据采集已经看似“神奇”,但由于地图基础数据庞大、变化快的特性,基础采集工作仍是移动地图基础数据采集不可或缺的重要力量。
通俗地说,拼地图的品质和精度,主要靠采集小哥在一线拼命"人肉"。
地图行业的中国式难题:基础数据更新太快
对一款地图APP来说,基础数据的覆盖广度、准确度、实时更新的速度都会直接影响用户体验。为此,有的地图方面甚至宣称不做O2O,称要专注地图基础数据和功能。基础数据对地图产品的重要性由此可见一斑。而对于地图这么庞大的产品,道路信息瞬息万变,要做到实时、精确也的确很困难。
以部分城市的新增道路情况为例,由上海市住房和城乡建设管理委员会、上海市建筑科学研究院(集团)有限公司共同编制的报告显示,2014年全市新增道路299公里,新增桥梁503座,轨道交通运营线路增加10公里。而深圳市交通运输委员会的数据则显示,“十二五”期间,全市已累计新建成道路1234公里,其中94%以上分布在原特区外。一些二三线城市,诸如昆明,也在有计划地推进城市路网建设,从2009年到2014年,全市已新增城市道路684公里,年均增幅约10.7%。
除去新增道路,大修、延长和其他更改状态下的道路同样是地图基础数据实时更新的一大挑战。北京市交通委的计划显示,今年包括地安门内大街、旧鼓楼大街、北河沿大街在内的12条道路确定年内大修。而今年郑州市也有9条道路将进行大修,彩虹桥也将进行改造工程,38条道路将实施车行道改造,市区主次干道将实施硬隔离。
显然,这些道路的大修也将为地图基础数据的采集和更新提出更大的挑战。即便是在人工智能强悍的当下,要做到这些基础数据的采集和实时更新也非易事。
这种情况也是一个中国特色,估计谷歌地图在美国都很少遇到,因为中国是一个城市快速崛起,道路每天都在进行大规模建设的国度。这都给网络地图制造了中国式难题,需要采取更复杂的手段加以解决。
技术水平决定百度地图行业地位“高度”
目前,国内地图数据采集及处理的主要方式有飞行器航拍、机动车及自行车车采和步采等四种方式。不同的数据采集、处理方式决定地图品牌在这一领域上的能力大小,进而决定其在行业里的地位。
与国内其他地图产品相比,百度地图的江湖地位很大程度上即由其先进的数据采集处理技术决定的。其数据采集技术已经形成了前方有“单人全景采集”,上方有“卫星影像道路提取”,后方有“自动化数据生产一体化作业”的组合模式。人工介入的环节主要在前期的采集阶段,先进的自动化处理技术则承担了90%的后期地理信息点处理。
同时,百度地图还在行业内独创了全景图像识别采集模式和卫星影像照片提取道路技术,能更好地识别和记录不同道路的各种细节,并使百度地图的道路要素覆盖率比行业平均水平高6个百分点以上。其高分辨率卫星影像甚至能从高空精准识别晾在阳台上的衣服,在这样的图像识别能力下,百度地图的图片处理能力已经超过全年2000万张。
基于数据采集与处理优势,百度地图最大程度提升了地图数据的更新效率,使其在覆盖率、准确率、非重复率上都领跑于整个行业。譬如,基于强大的数据处理能力,百度地图创新了道路预上线机制,在对道路提前进行数据采集之后,百度地图就能对数据进行后期处理,并在云端预上线。等到道路正式通车,就能直接在云端开通这些新道路,实现对道路的分秒更新。而就行业平均水平看,一条高速道路从开通到上线到地图导航里最短需要5天时间,百度地图因技术带来的领先程度昭然可见。
多轨并行的信息采集体系筑起百度地图“护城河”
技术决定高度,但在没有掌握绝对领先于同行的“黑科技”之前,强大的自采团队让地图精细化经常是征服用户的必杀技。因为用户需要的是“人肉”验证和采集的“鲜活”及时的实时地图数据,这关系到用户使用地图产品的基本体验。
还是以百度地图为例,其之所以能在重庆最“任性”立交进入收尾工作的第一时间就率先完成道路信息的采集,主要就在于其强大的自采团队支撑。事实上,百度地图对黄桷湾立交桥的数据采集主要分两次完成。第一次是由先期赶到的技术人员租用当地车辆采用便携设备进行的概况扫描录入。紧跟其后,百度地图专业采集车又依靠采集车上的固定专业设备对采集了全景等数据,并与之前录入的数据进行了比对。前期的"尖兵"加上紧随而来的"铁马",充分发挥了百度地图"快速反应"、"机动灵活"和"专业而强大"的优势。
2013年,百度全资收购了地图供应商“长地万方”获得了甲级地图导航资质。此后,百度没有做买数据的打算,而是藉此开始打造“狼性”的采集团队,逐步将自采数据用作地图输出端的主要数据来源。
2015年,百度地图自采团队创新自采方案,推行全新的地图数据采集工艺“1+0”模式,从双人改为单人作业,地图采集效率迅速提高,6月所采集的有效里程相当于2015年1月至5月的总和。根据百度地图《出行无小事》视频所提供的信息,百度的采集员们平均每天拍摄30000张全景照片,这也保证了百度地图全景照片的覆盖面和更新频率。
眼下,百度地图的自采集数据基本可以做到自给自足,而全景和高精地图等商业附加值更高的产品制作能力在国内业界已经遥遥领先。
除了自采,百度地图还创新推出包括用户UGC、淘金、商户平台等多种POI数据采集模式。仅2015年就有超过千万用户参与共建地图POI数据,用户每天提供的情报超过50万,提供的照片超过40万张,目前百度地图已经拥有超过4000万POI数据。
当然,对于宏观层面的区域交通架构和信息流,百度从权威性等因素考虑,与政府相关部门达成战略合作。例如,百度地图已经与江苏省交通运输厅、广东省交通运输厅及北京市交管局等多地的交管部门合作,接入当地的交通运输大数据。
类似这样的大数据与无数信息采集员采集的信息、热心地图用户上报的地理线索整合在一起,就构成了百度地图庞大、实时更新的数据库,也筑起了百度地图阻挡竞争对手的护城河。百度2015年Q4财报数据显示,百度地图月活用户达到3.02亿,同比增长43%,获得了中国市场范围1亿车主用户的使用,其中实时导航月活跃车主用户达7500万。百度地图的市场份额达到70.8%,为行业第一。
竞争对手若狙击百度,除了市场和技术,最终还是免不了一场基于自采体系的人肉PK。
评论