法国蔚蓝海岸大学和普瓦提埃大学团队利用CREATTIVE3DVR数据集,提出了一种名为DiVR的多模态Transformer模型,用于动态场景中的人类轨迹预测。该模型整合了静态环境、动态交互和用户注视数据,通过异构图卷积网络和跨模态注意力机制提升预测精度。实验表明,DiVR在复杂任务(如过马路、模拟视觉障碍)中显著优于现有方法,并展现了在元宇宙和智能交通中的潜在应用价值,但依赖高质量数据集仍是当前限制。
2025-04-22 18:10:31来源:YiVian
法国蔚蓝海岸大学和普瓦提埃大学团队利用CREATTIVE3DVR数据集,提出了一种名为DiVR的多模态Transformer模型,用于动态场景中的人类轨迹预测。该模型整合了静态环境、动态交互和用户注视数据,通过异构图卷积网络和跨模态注意力机制提升预测精度。实验表明,DiVR在复杂任务(如过马路、模拟视觉障碍)中显著优于现有方法,并展现了在元宇宙和智能交通中的潜在应用价值,但依赖高质量数据集仍是当前限制。
原文链接:https://news.nweon.com/129305
来源媒体:YiVian