
教师
上图为HDETrack框架图,其教师网络模型位于上半部分,仅用于训练阶段,测试阶段则用下半部分的学生网络。HDETrack的训练包含两个阶段:单独对教师网络进行训练。在第一阶段,要训练一个强鲁棒性的教师网络。输入RGB和事件流这两种模态的数据,以Transformer为骨干网络提取特征,让信息交互融合,再把Transformer的输出送进跟踪头,以预测跟踪响应结果。② 训练学生网络且开展知识蒸馏。在教师网络的第一阶段训练结束后,把教师网络已学好的网络参数冻结,从而开启第二阶段的学生网络训练。第二阶段训练属于知识蒸馏过程,教师网络的输入依旧为RGB和事件流的双模态数据,而学生网络输入的是单模态的事件数据(像事件帧、Voxel、Time - surface、重构灰度图等形式的数据)。学生网络也是以Transformer为骨干网络提取特征,再将输出特征输入跟踪头以预测跟踪结果。并且,借助三层知识蒸馏,利用教师网络的参数监督学生网络的学习。本文推出了一个大规模的高分辨率(1280×720)事件跟踪数据集EventVOT。这个数据集包含1141个视频,有19个类别与14个挑战属性,其目标物体的属性、类别和边界框中心点分布可视化效果图如下。
数据集可视化的示例。

无人机
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号