澳鹏Appen(中国)如何助力自动驾驶?

根据ML大牛吴恩达提出的著名二八定律:80%数据+20%模型=更好的AI。他认为,一个机器学习团队80%的工作应该放在数据准备上,确保数据质量是最重要的工作。如果更多地强调以数据为中心而不是以模型为中心,那么机器学习的发展会更快。

根据ML大牛吴恩达提出的著名二八定律:80%数据+20%模型=更好的AI。他认为,一个机器学习团队80%的工作应该放在数据准备上,确保数据质量是最重要的工作。如果更多地强调以数据为中心而不是以模型为中心,那么机器学习的发展会更快。

而随着中国自动驾驶产业商业化落地的高速推进,市场对于数据的需求也正在呈现急速上升的趋势。根据公开数据,预计至2030年,中国运营的自动驾驶车辆将达3000万辆,或将成为全球最大的自动驾驶市场。

总体来看,整个自动驾驶正处于L2级自动驾驶向L3级发展的阶段,场景越来越复杂的同时,也带来了对于3D等更高维度、更高质量数据的巨大需求。而另一方面,自动驾驶全产业链的企业数量正在飞速扩展,包括传统车企、车企相关互联网公司、跨界互联网公司、新型自动驾驶相关公司等在内的企业,也让我们看到了更大的数据需求。

  自动驾驶数据的重要程度正在持续上升

如果说智能化1.0阶段,车企拼的是技术的快速落地和高阶能力的标杆效应,那么2.0阶段就是拼规模化搭载。

根据高工智能汽车研究院发布的《2023-2025年智能网联产业趋势报告》显示,今年1-10月,前向ADAS(L2含NOA)同比上年增长67.11%。NOA(导航辅助驾驶)同比上年增长116.25%。

当前,软件和数据已成为智能汽车的核心增量。在很多业内人士看来,打造一套可用的智能驾驶系统并不难,但开发和维护可扩展和可靠的完整数据驱动解决方案才是真正面临的挑战。这意味着,智能驾驶系统真正实现基于数据+软件定义的全新模式。

众所周知,数据贯穿了整个AI的生命周期,从数据获取,数据准备、模型训练和部署、再到人工模型评估。可以看到,在中国市场,数据服务的价值也已然明朗。

高工智能汽车研究院预计,接下来两三年仍是摄像头上车的市场红利期,预计到2025年中国市场单车搭载摄像头将提升至7-8颗。同时前向双目、三目,周视等更多摄像头配置成为主流,基于数据认知的训练也成为刚需。

另一方面,4D毫米波雷达以及激光雷达的搭载也正处于最关键的导入期,这带来了一个全新的市场:多传感器感知的数据融合。此外,舱内人机交互的体验升级,也同样需要数据迭代支持。这也再次表明,无论是在自动驾驶还是辅助驾驶领域,数据标注的需求量都将迎来增长的高峰期。

  自动驾驶数据标注当前面临的难点

作为产业链的重要一环,澳鹏Appen同样深刻感受到自动驾驶市场需求的火热:尤其在今年,自动驾驶的数据标注需求更是呈现爆发式增长。

2020年澳鹏Appen(中国)做到4.7m美金的营收,2021年是24.7m美金,实现了421%的增长;2021年上半年141%增长大部分是来自自动驾驶,目前自动驾驶占总业务量60%以上,澳鹏Appen(中国)一半以上的客户来自自动驾驶。

然而,随着业界对于数据标注需求量的爆发,过去简单粗暴的“人力堆叠”已无法满足当前对于“高质高量”数据供不应求的行业痛点。

要知道,在自动驾驶领域,数据标注几乎没有出错的余地,也不容缺少关键用例。这就导致自动驾驶汽车的数据采集和标注是非常耗时的资源密集型过程。同时这也是为什么一直以来自动驾驶企业会面临上市时间延迟、产品性能堪忧以及推广困难等问题。

澳鹏Appen(中国)产品及研发总监钱程表示,伴随L3级自动驾驶的进阶升级,自动驾驶厂商对舱外数据服务的需求与日俱增,其中既包括数据需求量的增长,也有更复杂的数据类型的变化。行业对于激光雷达3D点云数据的大量需求,也让数据标注的工作变得更为复杂,数据成本急剧上升。

而对于下游企业而言,如何低成本获取高质量数据就成了他们在这个时代的刚需。

澳鹏Appen(中国)产品及研发总监钱程认为,自动驾驶数据标注当前的技术主要面临以下难点:

1:随着自动驾驶市场的爆发式增长,总体数据量增大使得平台业务吞吐量增大,这对于工作流的数据流转效率、稳定性提出了更高要求;

2:采集到的数据精度提高、数据稠密度的提升,导致需要处理的单条数据变大,标注员设备可能比较低端,需要加大力度在研发上支持工具在各种高低端设备上的正常使用;

3:采集设备越来越多样化和复杂,使得数据类型增多,产生包括4D传感器数据等多传感器数据融合标注的需求;

4:数据成本和企业降本增效的需求,对标注效率和管理能力的要求越来越高,需要不断打磨和优化工具功能以及项目管理功能;

5:随着自动驾驶商业化落地进程的加快,客户需求也越来越细化和多变,需要加大投入模型辅助标注的研发并针对不同项目进行定制化的模型开发。

可以看到,为了解决以上难点,数据服务企业采用的数据标注技术已然从最早的单机标注工具演进为数据标注平台,继而升级为现阶段的智能数据标注平台/企业级AI数据标注平台。

THE END
责任编辑:赵智华
免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!