万字分析汽车毫米波雷达点云技术( 五 )


 
表 II 不同输入特征的分类分数
 

万字分析汽车毫米波雷达点云技术

文章插图
 
C.     测试车辆B的数据到目前为止 , 只应用了车辆A的数据进行训练和测试 , 现在 , 我们使用一个仅用车辆A的数据进行训练的网络 , 来预测车辆B所测得的反射的类别 。这种设置的差异在于两个方面 。一方面 , 车辆B配备了8个而不是4个雷达传感器 , 因此提供了车辆周围的360°视野 , 不同于车辆A的主要是正面和侧面的设置 。另一方面 , 车辆A的数据是在德国城市和乡村道路上收集的 , 而车辆B只在美国收集数据 。不同的道路和街道设计以及平均较大的汽车对算法构成了挑战 。
 
在这些新数据上应用我们性能最好的网络 , 其F1分数为0.46 , 明显低于我们用五重交叉验证得到的数值 。如果测试车辆前部的四个传感器与后部的四个传感器独立评估 , 则F1分数可增加到0.48 。
 
由于车辆B的数据集与车辆A的数据集相比非常小 , 所以我们必须谨慎地解释结果 。然而 , 很明显 , 改变传感器的设置对分类器的性能有一定的影响 。
D.      与以往方法的比较在前面的工作中 , 我们使用DBSCAN进行聚类 , 并使用LSTM网络进行分类 , 以生成特征向量序列的类标签 。此前 , 我们对在地面真实集群上生成的特征向量进行了性能测量 。在本文中, 这种方法的评估是通过将特征向量的类标签投影回集群的原始反射来完成的 。
 
我们在同一个数据集上训练LSTM网络和我们的新方法 , 并在相同的测试集上评估这两种方法 。为了进行公平的比较 , LSTM不是在地面真实聚类的特征向量上进行测试的 , 而是在点云上应用DBSCAN得到的聚类中产生的特征向量上进行 。与我们当前的方法不同 , 如果特征向量来自不属于真实对象的聚类 , LSTM还学习将其分类为垃圾 。如果LSTM拒绝这样一个特征向量 , 我们就会在比较中把相关的点当作静态的 。
 
我们的新方法在这个选定的测试集上达到了0.734的F1分数 , 而DBSCAN+LSTM的方法只得到了0.597分 。新方法创建的假阳性动态对象更少 , 并且在所有类中具有更高的真阳性计数 。最吸引人的特点是 , 被错误地认为是静态的反射物少了三倍 , 因此可能有更少的物体被忽略了 。源自动态物体的反射与来自静态类的反射的混淆不仅源于LSTM的不良分类结果 , 而且主要是由于聚类不足 , 使得LSTM无法对某些反射进行分类 。
E.    可视化在一个场景的前向传递过程中 , 可视化不同网络层的输出是很有用的 。图2显示了一个示例场景在输入级和三个MSG模块之后的空间位置以及多普勒速度 。
 
不同层的卷积核很难可视化 , 因为只执行1×1的卷积 , 因此不存在滤波器本身的有意义的图像 。然而 , 我们可以通过网络传递不同的场景 , 并在最后一个卷积层之前收集网络输出 。在这个输出中 , 我们从每个类中随机选择1000个点 , 以及它们的128维特征向量 , 并通过t-SNE降维算法传递这个高维点云 , 得到一个二维点云 。这在图7中得到了体现 , 在图7中可以观察到可以看到汽车、卡车、自行车和静态类别的四个不同的集群 。根据图5中的混淆矩阵 , 来自行人或行人组的反射没有被很好地分开 。汽车和自行车类的反射丰富了点云的中心 , 显示了那些难以分类的点 。最后 , 图8显示了与图2相同的场景 , 但现在显示的是预测类标签 , 而不是多普勒速度 。所有三个类别行人、卡车和汽车都被正确识别 。然而 , 最右侧行人后面的一些杂乱被错误地归类为行人组 , 汽车后面的一些反射也被错误地标记到汽车类 。尽管如此 , 场景的语义信息还是得到了很好的表达 。
 
万字分析汽车毫米波雷达点云技术

文章插图
 
【万字分析汽车毫米波雷达点云技术】图7 我们网络中倒数第二卷积层的128维特征向量的二维嵌入 。用非线 性t-SNE方法进行嵌入 。


推荐阅读