达摩院|重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类
从阿里云官方获悉,近日,国际权威机器视觉问答榜单VQA Leaderboard出现关键突破,阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。
近10年来,AI技术保持高速发展。然而在视觉问答VQA(Visual Question Answering)这一涉及视觉-文本多模态理解的高阶认知任务上,AI始终未取得超越人类水平的突破。
【 达摩院|重大突破!阿里达摩院创全球新纪录:AI“读图会意”首次超越人类】

文章插图
自然语言技术与计算机视觉交融,是多模态领域重要的前沿研究方向。其中,VQA是AI领域难度最高的挑战之一,对研发通用AI具有重要意义。
VQA的任务是根据给定图片及自然语言问题,生成正确的自然语言回答。
例如下面这张图,图中玩具人的IP出自哪部电影?AI先提取了问题关键信息——玩具人;再根据常识做出回答——星球大战。

文章插图
在首届VQA挑战赛上,AI的最高准确率仅能达到55%。今年8月,达摩院以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。
这是VQA测试以来,AI第一次超过人类水平,是标志性的重大突破。

文章插图
- 领军企业|30个!中国科协发布2022年科技领域重大问题难题
- 我国首个海洋油气装备投产!还有一批重大工程取得新进展→
- CPU|网友:畅享50八核麒麟处理器的量产隐含2点重大意义!
- |华为上诉失败,瑞典法院宣布维持禁令,将在2025年前拆除中企设备
- 重大发现!云南出现5亿年前的虾,它或能揭开“寒武纪爆发”之谜
- 突破!广州商学院学子在“挑战杯”广东省大学生创业计划竞赛获得首金
- 华为|瑞典法院驳回华为针对5G禁令的上诉
- 智能驾驶|倪光南院士该感到欣慰了:多年的呼吁,终于要一个一个实现了
- iPhone14|中科院:招博士后,研发7nm芯片技术
- 来自月球的“快递”已签收!嫦娥五号的返回,意义极其重大
