语义分割——解读无人车眼中的世界
转载 2020-08-10 11:50 一清创新UDI 来源:一清创新UDI无人驾驶公交车上路!
无人驾驶出租车上路!
无人驾驶物流车上路!
铺天盖地的无人驾驶信息接踵而至,大家在惊叹无人车炫酷操作的同时,也在深度思考无人驾驶技术!
今天让我们走进无人驾驶,解密无人车是如何看这个世界的~
如果说相机是无人车的眼睛,那语义分割就是无人车看到世界的方法。我们通过眼睛对眼前的每一个画面进行即时拍照,而无人车将每一个画面进行记录,并通过语义分割对图像进行解析~
一张图片存在计算机里只是一堆二进制的编码,但是语音分割可以让无人车理解图中的每一个像素代表的真实含义。
左:你眼中的世界 右:无人车眼中的世界
一清无人车实际运营中,人类视角VS机器视角基础
提问一
什么是图像语义分割?为什么要进行图像语义分割?
趣味解读
无人车就像刚出生的小孩,需要不断的学习进化,才能了解这个世界。图像语义分割,将肉眼所见的世界翻译成无人车理解的语言,让无人车学习。通过不断的训练,最后无人车能准确了解每个符号或标志的意义。图像语义分割主要是以像素为单位,对画面中的内容进行标识,并分割为块状的区域。
专业解读
图像语义分割(Semantic Segmentation)是人工智能-计算机视觉领域的一个重要的分支,它结合了图像分类、目标检测和图像分割等技术,针对图像进行像素级的分类。由于在显示世界中视野内的大多数像素是与周围与自己同属一类的像素相临的,所以语义分割的结果就变成了带有一定语义信息的色块。不仅如此,语义分割技术可以识别出每个色块的语义类别,并给每个像素都标注上其对应的标签,从而实现了从底层到高层的语义推理过程,最终得到一张具有各个像素语义标注信息的分割图像。如下图所示,计算机将“路面”这一类的像素标注为紫色,而路两边的“小汽车”被标注成了蓝色。
成长
提问二
无人车需要学习,那语义分割技术是否也在不断的进化?
趣味解读
牙牙学语时,婴儿只能分辨颜色、识别简单特征的物品,随着年龄的增长,接触了更多的事物,认识除颜色外,物品还有更多的区别,比如材质、形状等,能通过多个特征判断一个物品。语义分割亦是如此,传统的语义分割感受的特征比较少,而随着卷积神经网络技术的发展,无人车通过深度学习,能识别更多的特征,语义分割的结果也更加精准。
专业解读
图像的语义分割有多种手段。传统的语义分割技术有基于统计学方法的语义分割和基于几何学方法的语义分割等。随着深度学习(Deep Learning)技术的发展,基于深度学习尤其是基于卷积神经网络(Convolutional Neural Networks, CNN)的图像语义分割得到了飞速的发展。与前几种方法相比,基于深度学习的语义分割可以自动地学习图像的特征,大大提升了图像语义分割的精确度,降低了学界和工业界使用语义分割技术的门槛。
成熟
提问三
深度学习的过程是怎样的?图像语义分割技术如何运用深度学习提升精确度?
趣味解读
人类在学习的过程中,由于经验的不足,会因一些接近的相似项导致对结果判断有误差,无人车也是一样,因此在解读特征的过程中,需要将事物进行多角度多层次的剖析,一层一层的分解,最后再自我消化,重新进行解读,得到对事物的判断和理解。
专业解读
深度学习是深度神经网络算法,简单来讲,就是利用人工搭建的神经元系统形成的网络对特征进行学习。卷积神经网络是目前深度学习技术领域中非常具有代表性的神经网络之一。卷积神经网络的核心思想是加权叠加,这使得图像可通过卷积神经网络进行更加方便的处理。如下图所示,原有的图片通过卷积神经网络,特征被逐层提取,经过卷积、池化、反卷积等一系列处理,最终得到了最右边的预测图像。
有没有感觉十分神奇?你眼前不再是冰冷的引脚排线和悄无声息穿梭的电流,而是一个同经历了几万年漫长进化过程的人类一样具有理解图像能力的智能体,是一个每秒可进行上亿次运算并对看到的世界做出解释的无人车。
图像语义分割的意义远不只是吸引你的眼球,它在自动驾驶、医学图像等领域也有着重要的应用潜力。如上图所示的图片中,车辆在道路上如能对摄像头采集的图片或视频进行精确且快速的语义理解,就能在很大程度上对障碍躲避、路径规划等做出指导,这为自动驾驶提供了成本相对较低、部署较简易的信息补充。一清创新应用了当前最先进的语义分割技术,实时性、准确性等指标均居于业界前沿,稳定精确的语义分割结果为自动驾驶提供了丰富可靠的数据支持。