而其中最大的技术瓶颈无疑是在感知能力上。除了算法和硬件的支持,训练数据的质量也起到了决定性的作用——数据量是否足够大,标注质量是否足够好,覆盖的场景是否足够全等,已经成为了间接衡量一家自动驾驶公司技术好坏的重要标准之一。
百度智能云数据众包率先推出了针对自动驾驶行业的“私有化标注平台+基地标注团队”的AI数据整体解决方案,帮助平台服务型企业建设完整的数据基础服务,“上海国际汽车城”就是其中的典型代表。
政策利好,数据和平台能力也要跟上
近年来,各地方政府持续加大对自动驾驶的基础设施建设投入,通过政策扶持自动驾驶落地,打造汽车产业生态,提升城市竞争力。
而国际化的汽车之城上海,在自动驾驶上的政策布局早已有所举措。2018年,《上海市智能网联汽车道路测试管理办法(试行)》正式发布,上海就成为了国内自动驾驶公开路测的第一座城市,为上汽、宝马等企业的自动驾驶实路测试提供重要的基础建设。2019年,“AI+交通场景计划”落地上海国际汽车城,旨在打造以上海汽车博览公园为载体的自动驾驶常态化运营半开放示范区,在基建和测试场景上为产业发展提供支持。
作为全国最早开展智能网联汽车示范推广的产业示范区,其规划从感知和决策层入手,打造硬件、软件、数据、路测整体解决方案。而这其中决策层是最关键但也是最复杂的,算法训练需要一系列配套建设,包括数据层面的训练数据和场景库评测数据,以及软件层面深度学习数据标注平台和管理训练平台。但由于自动驾驶数据精度高、量级大、标注规则复杂,且软件平台具有业务场景适用性特征研发难度高,业内往往会选择专业的AI数据公司提供数据和平台服务。
如何基于业务特征提供平台能力建设,同时保证数据标注质量和安全,实现自动驾驶超智“双眼”已成为汽车城乃至整个自动驾驶行业的难题。
兼顾数据安全与质量
上海国际汽车城选择百度智能云数据众包是最优选。
作为业内专业、高质量的AI数据服务商,2011年起,百度智能云数据众包即为百度内、外部客户提供数据服务。尤其在自动驾驶领域,累计成功标注数据上亿帧,积累了丰富的行业经验。据艾瑞咨询:《2019年中国人工智能基础数据服务行业研究报告》显示,百度智能云数据众包目前已成为国内最大的AI数据服务商。
上海国际汽车城在找到百度智能云数据众包之后,双方一拍即合,很快就确立了合作方向:从深度学习数据标注平台入手搭建软件能力,并通过平台和百度标注基地实现数据安全高质标注。“在众多服务商中,选择与百度智能云数据众包合作主要看重百度智能云在这方面的数据经验和产品技术能力,以及其提供的数据标注安全方案能够很好的满足我们的需求。”上海国际汽车城副总工程师李霖如是说。
针对上海国际汽车城需求,百度智能云数据众包推出了“私有化标注平台+基地专属团队”方案,结合国际汽车城的自动驾驶标注场景和组织管理需求做定制化开发,将百度领先的标注平台能力抽取并做私有化部署。
其中,百度智能云数据众包“私有化标注平台”支持2D、3D、连续帧、融合标注等数十个标注场景,引入了AI预标注和自动质检算法。经百度上万项目科学验证,在标注效率上领先行业20%,并且还具备全面的任务、数据、标注人员管理功能,有效支撑企业做标注管理。同时,由于平台具有私有化特征,可以实现数据不出库从而保证数据安全。
数据安全如何保证?在“基地专属团队”上,百度与山西政府合建了业内最大的数据标注基地,拥有超过2000名经过多年专业培训的标注员。基地按照百度数据安全等级规定采取了保密协议签署、密闭房间作业、实时摄像监控、USB封口等多种严格的安全控制措施,从人的源头上保证数据安全,同时能够做到高质量和高效率交付。对此,百度智能云数据众包业务负责人施佳樑介绍:“数据安全一直是我们关注的,也是整个AI行业发展的共同课题,我们从很早开始就在内部建立了严苛的安全机制,确保客户数据安全。”
赋能共建 推动产业升级加速度
目前,双方关于平台及数据的合作均已落地。深度学习标注平台的部署增强了国际汽车城的软件设施能力,“平台部署+基地标注”的模式在保证数据安全的同时也极大提升了汽车城的数据处理能力。大量基于自动驾驶场景的高质量数据源源不断地从百度山西标注基地输出,并依托汽车城平台支撑着行业算法的成熟。
同时,百度智能云数据众包也在不断对外开放自己的自动驾驶数据采集和标注能力,根据行业需求打造基于数据标注、存储、管理、训练、清洗、评测的全套产品能力。并先后与多个地方政府在人工智能数据层面开展深入合作,助力地方产业的转型升级。
上海国际汽车城拥有国家智能网联汽车试点示范区及众多公共实验室等平台资源,为自动驾驶企业提供更多学习、交流、研究、测试、数据分析机会。双方协作互通,持续在产品和生态上创新、赋能行业。毫无疑问,在行业的共同努力下,汽车产业的智能化未来即将到来。