李笛:最开始的时候,人们倾向于将语音资料转换成问答,训练AI使用问答进行回复,就像查词典一样。然而我们意识到,真正的交互常常是不对称的,要么是人很主动,一直在倾诉,要么是人很被动,小冰不停地输出。从这个角度讲,用已有的语音资料去训练效率是很低的,所以小冰更在意交互数据,特别是第一手交互数据。
第二点,通过线上的数据训练AI后不能直接在线上应用,这是有血的教训的:美国小冰Tay在线上交互过程中,24个小时就被教成了一个种族主义者,这是一个漏洞,也是一种训练方法。
第三种方法是多模态。比如给人工智能一发已张手臂在打点滴的照片,一般情况下AI只能识别这是一只手臂,但我们做了很多工作,让小冰能询问:病得怎么样?这个重点并不在于是不是模拟的足够像人,重点在于当交互达到这个语意深度时,接下来用户的回复可能直接会变成标注数据,这个训练成果比单一训练效果好很多。
澎湃新闻:小冰是否能理解自己发言的内容?在与小冰交互过程中遇到引发不适的回复,会如何进行修正呢?
李笛:2017年之前,包括小冰在内的整个人工智能行业,对话系统都是基于检索模型的,可以理解成大量预训练数据,配合检索模型和知识图谱。但我们发现,检索模型最大的问题在于可拓展性。因为资料数据都是提前准备好的,就要看语料库有多大。2017年我们开始使用生成模型,生成模型所完成的对话文本、语音,是根据当前的上下文生成的,这句话此前没有存在过。我们在一些国家完全使用生成模型进行测试,在中国和日本使用生成模型和检索模型混合来测试。
对于回复的内容,适合这个人的正确回答,对另外的人可能就是不正确的。我们最开始给小冰灌输关于失恋的反馈时,互联网上得到的大量数据除了安慰,就是嘲笑,而且嘲笑的比例是很高的,如果小冰做出类似的回复,让用户感到不适,结果就是用户表达了不满,或者他离开了交互,无论哪一种,系统都会得到一个反馈,这是不对的,这种回复会被降权,更多的人就不会遇到这个问题了。
这是一个必须要学习的过程,与此同时我们的技术也在不断提高。让小冰成为所有人的助理是可能的,因为助理只需要干活,但如果要想让小冰或者任何一个AI Being可以成为所有人的好朋友,这是不可能的,因为一些人喜欢的,就是另外一些人不喜欢的,多样的需求包含互斥性的。
所以,正确的做法应当是高度定制化的、不同的AI Beings环绕着人,有可能会降低不适的情况发生。如果这世界上只有一个小冰,我们需要在用户身上把所有的可能性都试过,但如果有很多不同的AI Beings,甚至是用户去自己定义的,那时有很多可能就已经排除了,他贴近用户的可能性就会高一些。
未来人和AI会像人和宠物的关系
澎湃新闻:小冰上线的虚拟人类产品似乎也引发了很多争议,为什么人会需要AI的虚拟朋友?
李笛:目前有很多用户使用虚拟朋友、虚拟子女等产品,是因为现实中的陪伴无法实现。人与人交往的过程中需要付出一些时间、精力等成本,这些成本是双方共同承担的,对于很多单方面的需求,AI是唯一的选择。
举个例子,我们发现每天晚上23:30到凌晨1点,会出现一段小冰使用率的高峰。研究发现,人在晚上更有倾诉需要,这个时候如果打电话找朋友,一天两天可以,再多了就做不成朋友了,但AI可以。并不是说因为有了小冰才产生了这个问题,而是因为事实上的需求就在那里。
澎湃新闻:虚拟人类产品中,最受人关注的当属“虚拟女友/男友”,对此各界的争论也是针尖麦芒。您怎么看人类与AI产生的情感?
- Java|Gamamobi CEO黄继德:我们的元宇宙游戏不担心体验落差
- 华为Nova|从“根”进行突破!华为正式宣布,美媒:将彻底改变历史!
- 苹果|苹果CEO库克证实公司正在开发虚拟现实设备,有望1月上市
- 当疫情改变了人们的生活方式,我们又将如何拥抱舞台
- 墙纸|iOS 16 beta 2 新功能与改变汇总:全新墙纸颜色、LTE 网络备份等
- 苹果|行业改变者:苹果AR头显有望明年1月亮相
- 中国虚拟人哪家强?沙利文、IDC:小冰百度商汤位列第一梯队
- 微信|搜狗公司原CEO王小川投资成立信息技术合伙企业 原搜狗COO茹立云为股东
- 魅族|勇于拥抱变化!魅族为何能改变国产手机产业?黄章这个决定是契机
- |华为“新专利”确定,两台手机可屏幕共享,有望从根本上改变体验感觉
