如何通过SAM缓解小目标数据标注难题
自动驾驶技术的发展一直以来都是围绕着如何减少车辆发生事故的目标展开的。其中最大的难点之一就是小目标障碍物的检测和识别。小目标障碍物是指大小不规则、形状多样、像素点较少的障碍物,如行人、自行车、电动车等,这些障碍物不仅数量巨大,而且容易被忽略,导致了不少交通事故。而要解决这个问题,就必须要对小目标数据进行准确的标注,以便训练出高精度的模型。然而,小目标数据的标注难度较大,会面临着unbalance的问题、容易漏标和误标的问题等,这也就是我们今天要讨论的问题。
一、小目标数据的收集
小目标数据的收集是标注工作的前置工作,也是非常关键的一步。目前,常用的数据采集方法有两种,一种是实地采集,另一种是影子模式自动采集。
影子模式自动采集,是指在真实的驾驶环境下,通过一些特定的设置,使车辆只记录GPS、惯性传感器等信息,从而在保证数据真实性的同时,也减少了车辆的操控风险。影子模式可以采集到大量的数据,但是对于小目标数据的采集,仍然存在一些问题,例如:数据收集的质量不一、数量有限等。
为了解决这个问题,可以在影子模式的基础上,加入SAM(Sequential Attention Model)模型,对PnC(perception and control,感知与控制)表现异常的数据进行自动采集。SAM模型是一种序列化的注意力模型,它可以根据历史信息预测未来情况,可以极大地提高数据采集效率。同时,SAM模型也可以对每帧图像进行判别,如果地面部分出现最小包围框小于一个预设pixel面积的时候,该部分数据被截取出来进行预标注。这种方法不仅可以缓解小目标数据采集的问题,而且可以大大提高数据的质量和数量。
二、小目标数据的标注
小目标数据的标注是训练模型的关键步骤,准确的标注可以提高模型的精度,但是由于小目标数据的特殊性,标注难度较大,容易出现漏标和误标的情况。下面介绍一些解决漏标和误标问题的方法。
解决过分割和欠分割问题
在标注小目标数据时,可能会出现过分割和欠分割的情况。过分割是指将一个物体分成多个部分进行标注,欠分割则是指将一个物体标注为一个整体,而实际上它由多个部分组成。
为了解决这个问题,可以采用连续帧的结果判断,比如某个小物体只出现了一帧,则可以将它合并为一个整体进行标注。同时,也可以通过投影激光雷达点的方法,对投至此区域的点进行高度判断,如果和附件的点高度差不多,则极有可能是误标。通过这些方法,可以有效地解决过分割和欠分割的问题。
解决漏标问题
漏标问题是指在标注小目标数据时,遗漏了一些物体,导致训练出的模型无法准确地识别它们。
为了解决漏标问题,可以采用半自动标注的方法。具体来说,可以先利用SAM模型进行预标注,然后再人工检查和修正标注结果,确保没有遗漏物体。这种方法不仅可以提高标注效率,而且可以保证标注结果的准确性。
另外,还可以采用多人标注的方法,即让多个标注员对同一张图片进行标注,然后将不同标注员的结果进行比较,最终确定正确的标注结果。这种方法虽然效率较低,但是可以保证标注的准确性。
三、总结
小目标数据的标注是自动驾驶技术中的一个关键问题,也是训练模型的前置工作。在标注小目标数据时,会面临着unbalance的问题、容易漏标和误标的问题等。为了解决这些问题,可以采用影子模式自动采集和SAM模型进行预标注的方法,同时还可以通过连续帧的结果判断和投影激光雷达点的方法,解决过分割、欠分割和漏标的问题。总之,小目标数据的标注虽然难度较大,但是采用正确的方法和工具,可以提高标注效率和准确性,为自动驾驶技术的发展提供有力支持。
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
纽北(Nürburgring Nordschleife)赛道介
2024-11-22 09:17
-
虚拟验证先行丨集成多学科方法,让电池生产
2024-11-22 09:10
-
新品上市 | Fusion-LN 数据采集的下一个飞
2024-11-22 09:08
-
车规级V2X芯片- 汽车移动通信功能核心
2024-11-22 09:03
-
BEV端到端视觉论文合集|从不同的视角解析BE
2024-11-22 09:00