AI“读图会意”首超人类,阿里巴巴达摩院刷新全球VQA纪录

据财联社,国际权威机器视觉问答榜单 VQA Leaderboard 在近日出现关键突破,阿里巴巴达摩院的 AliceMind 以 81.26% 的准确率创造了新纪录,让 AI 在“读图会意”上首次超越人类。

VQA 是 AI 领域难度最高的挑战之一,在该测试中,AI 需要根据给定的图片、自然语言问题生成正确的自然语言回答。也就是说,AI 需要同时具备计算机视觉和自然语言算法,先扫描图像,然后理解文本,最后再推理作答。解决该挑战,对研发通用人工智能具有重要意义。

VQA 挑战自设立以来,吸引了包括微软、Facebook、斯坦福大学、阿里巴巴等众多机构和公司参与,形成了国际规模最大、认可度最高的 VQA 数据集,包括 20 万张真实图片、110 万道考题等。

除了本次“读图会意”挑战,阿里巴巴的达摩院还在 2018 年的斯坦福 SQuAD 挑战赛中,令机器阅读理解首次超越人类。

作者:小屋
链接:http://www.rumenwu.com/itnews/1786.html
来源:入门屋
入门屋著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。部分内容复制其他平台,如有侵权请联系删除。