当你需要使用大量的计算能力并行地训练系统,或者让研究人员花很长时间手工清除坏的系统时,训练自动驾驶汽车的过程很少是有效的。Waymo正在试验新的方式:这一方式与指导进化的原理相同。
Waymo与DeepMind合作开发了一种基于人口的训练方式,用于做行人检测,该方法拥有最好的神经网络,就像生命体在自然选择方面所做的那样,可以节省时间和精力。
这种方式通常会让神经网络进行彼此竞争,较弱的网络会被较强的“子代”所取代,这些“子代”网络其实是性能较好的网络的副本,只不过在参数上进行了调整,就像父母的孩子,有父母的基因,但是又不是父母的克隆体一样。这样做的好处是,可以自动清理掉性能较差的网络,同时不需要从零开始重新训练。
不过这种方式的风险在于过于注重短期的改进,为了解决这一问题,Waymo创造了一个微型生态环境,在这个生态中,神经网络在小群体中相互挑战,以获得
最好的结果,同时也保持了多样性,这更适合现实的驾驶环境。
该方法在行人检测中具有良好的应用前景,基于人口的训练方式误报率下降了24%,时间却较以往缩短了一半,试验进行的很顺利,以至于Waymo开始在其他模型中使用这一方法,这也许能让自动驾驶汽车更好的应对驾驶环境的复杂性,以避免碰撞。