beings|少女小冰为什么要创造一个岛?( 二 )


beings|少女小冰为什么要创造一个岛?
文章插图
为何要创造一个岛?“从某种意义上来讲,小冰是一场庞大的实验。”李笛在接受品玩采访时提到。
这场实验的目的就是为了寻找出合适的途径,让人工智能可以很好的融入人类的世界。小冰团队认为,未来的世界,将是无数个AI beings与人类混居的世界。而这场实验的目的,可能就是在尝试让AI与人类感情连接,建立更稳固长久的信任纽带。
过去,为了让人类尝试与AI建立更紧密的联系,科学家们也确实尝试过很多方法,比如建立一个可以回答所有问题的人工智能系统—Q&A Bot(专家系统的语音机器人)。但Q&A Bot的问题在于,它本身是一种结果,而非是内容本身。
李笛称,“经过几年的发展以后,我们反而发现最自然的声音其实是带有人类瑕疵的声音,因为这样的声音,我们的听感最为舒适。”
一个更好的AI系统,应该和消费者产生更紧密的联系。
小冰公司一开始就走了一条与别人完全不一样的路。
过去几年,小冰在公布开放域对话、情感计算框架、全双工、超级自然语音等重要技术升级时,还被一些做Q&A Bot的同行说看不懂。但一年半到两年后,基本都得到了圈内的认同和追随,比如最著名的全双工语音,小冰团队2016年8月实现,2018年5月谷歌跟进发布,后被戳穿为“人工”智能后还在技术圈里成为段子。
小冰团队几代更新就是一直坚定围绕这些反而“不完美”的AI beings沉淀小冰背后的计算框架。
这个计算框架,迄今为止可以堪称复杂度最高的AI being系统。在这其中,它包括应用层、驱动层、信号调度、内容生成、交互层、搜索引擎、空间衔接以及AI being Instance等结构,简而言之,这是一个以NLP和情感计算框架为底层,融合多项功能应用的人工智能计算框架。
beings|少女小冰为什么要创造一个岛?
文章插图
有意思的是,后来巨头们也纳过闷来,Google Meena和Facebook Blender的论文里也都是拿小冰框架做对标。
小冰公司产品副总裁彭爽称,每一位AI being背后都是由于小冰计算框架上已经具备的事件图谱,以及多模态的预训练技术成果,才造就了他们发朋友圈的能力,这些内容和真实世界的知识、信息热点,保持了同步。
而在这个计算框架中,最重要的其实就是数据。
【 beings|少女小冰为什么要创造一个岛?】按照人工智能科学家吴恩达最新的说法,更好的机器学习20%是算法,80%是优质数据。而小冰过去多年都是30%投入在算法,70%投入在数据。
“我们其实是在迭代一个系统,而这个迭代的数据丰富度也是最高的。”李笛举例称,在过去,人工智能进入智能音箱,其实产生了大量的一个人和一个AI之间的交互数据。“但其实几个人的对话,比如私聊,在群里,甚至是很多个AI和一个人的对话,本身产生的交互数据也是不一样的。”
换句话说,人是多样性的,那么与人类共居的人工智能也必须具备多样性的特性。在面对不同场合以及不同情景会有不同行为,按照这个理论,此前作为智能音箱的交互数据其实收集得再多,可能也是“无效数据”。
人工智能的多样性需要更多更好的数据,也必须创作一个空间让足够多的人使用,需要能让人直接感受和体验的独立AI产品。
而独立的AI产品,更像是小冰AI beings这样的封装形式。过去几年,小冰框架孵化的首个AI少女小冰,尝试验证了这一封装形式的正确性。
从人工智能少女小冰开始,小冰团队一直努力让不同AI也具备多样性。比如这次之前小冰已经尝试过创造了1700万个“虚拟男友”,这次以唱功著称的新声代小冰陌笙,也演唱了一曲周深升4 key版的《大鱼》,在小冰岛的万千“网红脸”中,小冰特意强调了一位操着山东口音的大哥在中国画艺术上的造诣。