文件列表:
可视化转换叙述【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:Visual Transformation Telling中文摘要:本文提出了一种新的视觉推理任务:Visual Transformation Telling (VTT),并设计了一种基于 VTT 的机器学习模型 TTNet,该模型使用 CrossTask 和 COIN 等视频数据集进行训练与测试并在具有表现力和泛化性方面优于其他模型。英文摘要:In this paper, we propose a new visual reasoning task, called VisualTransformation Telling (VTT). This task requires a machine to describe thetransformation that occurred between every two adjacent states (i.e. images) ina series. Unlike most existing visual reasoning tasks that focus on statereasoning, VTT emphasizes t
加载中...
已阅读到文档的结尾了