背景
-
自动驾驶中的智能体运动预测极具挑战性,因为每个智能体的下一步行动有多种可能性,并且它们在时空上存在复杂的交互 。
-
在实际应用中,运动预测是随着自动驾驶汽车的移动而重复连续地进行的 。
-
然而,现有的预测方法通常独立处理每个特定范围内的驾驶场景,完全忽略了连续驾驶场景之间的情境和上下文关系 。
-
这种简化使得解决方案次优且在实践中效率低下 。
RealMotion 框架
-
它包含两个主要的场景级别流 :
-
场景上下文流 (Scene Context Stream):逐步积累历史场景信息,捕捉场景元素之间的时间交互关系 。
-
智能体轨迹流 (Agent Trajectory Stream):通过顺序传递过去的预测来优化当前预测 。
-
-
此外,RealMotion 还引入了一种数据重组策略,以缩小现有基准与实际应用之间的差距 。
-
这些方法使得更广泛地利用跨时空的动态运动情境和渐进式洞察成为可能 。
-
每个流都利用了专门设计的交叉注意力机制来实现场景状态的转换和功能的实现 。