近日,图森互联宣布,他们研发的计算机视觉与深度学习算法在自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得优异的成绩。
这是一家国内专注于计算机视觉与人工智能研发的创业企业,图森的CEO陈默是一位连续创业者,他的上一家公司被收购后,他接手了图森互联。
2015年9月图森互联成立,成立之时该公司CTO侯晓迪博士在美国组建了一个20人的视觉识别研究院,团队成员包括来自UCLA、卡耐基梅隆、MIT、 南洋理工等高校的华人。
起初,他们研发的是广告视觉识别技术,例如图森曾经给新浪微博开发了一个“识车神器”:用户只要随手上传汽车图片,微博即可识别主流乘用车品牌、车型,利于精准广告的投放。
在今年3月,陈默给了自己和公司一个巨大的挑战,全面转型。
从广告业转型自动驾驶
图森最开始把北美研究院视觉识别的成果应用在了在广告领域,通过算法实现精准匹配,可以提升广告的转化率。
不过陈默认为,广告的核心竞争力在于销售及资源获取能力,而计算机视觉可以帮助进行优化,起到的作用是的确有限。
它的问题出在了数据造假太多,如Facebook,他们的DSP产品碰到了数量惊人的劣质广告和虚假的机器人流量,尽管他们做了筛选,但依然被无价值流量的规模所打败,最后还是决定以广告质量为先。所以技术公司用很大力气投入并不一定能够带来明显的销量增长。
相比广告投放,自动驾驶的难度非常大,汽车产业链非常长,本身也是一个5-10年才能落地的事情。图森怎么做?
陈默表示,图森短期的目标是自动驾驶L3级,它将会在5年之内实现,让商用车在指定路段(如高速公路)实现自动驾驶功能。
想要让自动驾驶上路有很多问题,传统视觉识别算法很难识别行人和自行车,但是深度学习可以。同时深度学习还可以对周围物体的行为作出预测。陈默举例:“不能车旁边一有人就报警,它还要去预测人与车碰撞的可能,需要预测双方的行驶轨迹。”所以一个性能好的摄像头是不够的,物体的检测分类、地标的识别、驾驶行为的适配以及车辆的行为决策,每一步都需要深度学习的参与。
陈默很肯定,视觉识别的传统算法是不可行的,普通的前车防碰撞是远远不够的,它将会在一两年后被深度学习替代。
为商用车提供自动驾驶功能
对罕见的突发事件的反应,是训练自动驾驶系统至关重要的,需要两个重要策略:
获取海量驾驶数据的渠道;
具有从传感器数据中精细还原物理世界的能力。
让自动驾驶在全国各地收集数据不可能,但是在特定路段可以。陈默发觉,这种情况下将自动驾驶用在乘用车上面并没有发挥很大的价值,甚至大材小用。
在普通乘用车行驶中,人们观察前车动向时走神的概率其实很低。反而大型的交通工具以及货运车存在的盲点更加危险,很容易把行人卷入车下。另外大型运输车司机疲劳驾驶存在很大的安全隐患。
目前,图森互联已与北奔重汽、北京理工大学签订合作,帮助第三代解放军运输车做自动驾驶功能。最快需要1年的时间出原型车,在这段时间,车的不同位置还需要重新采集数据作为样本,重新构建模型。
商用车是生产工具,比乘用车对自动驾驶技术更有需求。当然,图森选择做商用车还有很多原因:
中国有两千多万的运营车辆市场很大,自动驾驶可以减少货运公司雇佣成本;
数据好采集,从一个集散地到另一个集散地重复路线,且高速路段的复杂程度比城市路段低;
人脸识别技术保障司机疲劳时的安全驾驶,车辆周身传感器可减少盲区保证行人安全;
货运公司大多靠近高速匝道而建,可以提供方便落地的解决方案。
在陈默的计划中,他们将会组建一个自动驾驶的运输车车队。只需要第一辆车有司机,其余的车辆自适应巡航,因此可以减少司机数量。这个原型化方案最快将在1年半之内达成,届时只需司机将车开到规定路段的起点,自动驾驶车便可以在高速上自动行驶并且下高速后会自动在匝道停车。这个方案类似美国Otto无人驾驶卡车,不过即便原型化方案落地,商用还要再等上至少1年的时间。
控制成本是核心
未来图森的目标就是做运输车的自动驾驶车队,只用1-2个司机。做这个事的目的就是节约成本、保证驾驶安全和快速提供解决方案。他认为将自动驾驶应用在商用车上可以尽快实现,不希望给出的方案都是未来10年8年才能实现的。
目前国内公开的地图数据不足以支持自动驾驶的导航,图森以分米级精度建立矢量模型,包括车道线、隔离带、交通标志牌、路面坑洼等,解决方案的成本也可比Nokia Here低至少两级(HERE使用了LiDAR和4个1689万像素的高精度摄像头)。
他们为了控制成本选用NVIDIA的PX1通用芯片,未来可能升级到PX2。陈默表示,虽然通用芯片比专用芯片性能差一些,但它的出货量不大,成本降不下来。
目前图森的自动驾驶系统用的是双目摄像头加毫米波雷达的综合解决方案。系统全部Offline,避免网速和服务器信号问题带来的延时误差,也控制了数据存储的成本。考虑成本是产品能否落地的前提,陈默预测,有一天计算机视觉识别和深度足够强大的时候,再也不需要激光雷达了。
汽车与自动驾驶是个需要复杂工艺和高端技术的行业,车企、Tier 1和技术提供商以及互联网企业现在都在这个市场并肩作战。或对立、或合作,在各自的领域物尽其用,这比那些PPT公司更加让人兴奋和期待。而他们改变的不仅是一辆交通工具,还是一种更多空间的生活方式、一个交通出行飞跃式的进步、一个改变很多行业和从业者现状的技术。