文件列表:
ANetQA:针对未修剪视频的细粒度组合推理的大规模基准测试【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:ANetQA: A Large-scale Benchmark for Fine-grained Compositional Reasoning over Untrimmed Videos中文摘要:本研究介绍了 ANetQA,这是一个支持对挑战性非剪辑视频进行精细组成式推理的大规模基准测试。与现有的基准测试相比,它通过自动从预注释场景图中生成 QA 对,使得可以对多样化的推理能力进行粒度控制。与 AGQA 相比,ANetQA 的 QA 对具有更细粒度的语义特征,因此可以更好地帮助评估 VideoQA 模型。英文摘要:Building benchmarks to systemically analyze different capabilities of videoquestion answering (VideoQA) models is challenging yet crucial. Existingbenchmarks often use non-compositional simple questions and suffer fromlanguage biases
加载中...
本文档仅能预览20页