Jurassic-X: 让神经模型学会符号推理( 二 )

文章图片
对标GPT-3的LLM:Jurassic-1
3混合系统尽管基于神经模型的方式获得了令人印象深刻的性能 , 不过GPT-3在涉及到一些哪怕是很简单的推理时也会犯一些低级错误 , 尤其涉及到比较复杂的语言描述 , 例如多个数相加;涉及到最新的消息 , 例如纽约现在的天气 。 它仅仅从过去训练好的数据中进行推断天气情况 , 难以迁移到新的场景下 , 而如果用更新的数据 , 则需要重新训练模型 , 而这需要巨大的代价 。

文章图片
不同专家系统之间的连接
因此MRKL使用了代表当代AI在商业角度下的第三个趋势——使用神经和符号结合的混合系统 。 MRKL融合了不同的模块 , 有些模块使用了深度学习 , 有些则使用符号推理模式的专家系统 , 例如直接从某些数据知识库中进行检索等模块 , 来获取更新的信息 。
MRKL中一个出色的设计被称作是路由(router)的模块 , 它可以根据用户的问题匹配一个专家系统:例如如果问题涉及到数学 , 它会转向一个计算器 , 如果问题涉及到汇率 , 它会路由到一个汇率转换器 , 如果是天气的话 , 它会转到一个天气网站等等;如果路由对于问题不确定 , 它会先通过Jurassic-1等语言模型利用上下文推断出应该转向哪个专家模块 。
4权重更新方式MRKL还采用了prompttuning的方式对于模型的下游任务进行更新 , 如上述 , 这种方式避免了灾难性遗忘的微调模式以及零样本学习的低性能 。 与传统的prompttuning方式相比 , Jurassic-X使用了更加精细的设计:(1)依赖于模型输入的prompt学习方式 。 (2)检索增强的prompt生成方式 。 (3)递归式地应用冻结了的LM模型 。 论文中做了更加详细的技术介绍 , 感兴趣的读者可以直接阅读论文 。

文章图片
MRKL中采用递归方式涉及promptlearning
5应用实例博客中介绍了几种MRKL的应用场景举例 , 都是一些值得关注和实用的一些话题 , 涉及到方方面面可能出现在日常场景中的问题 。
用人类语言去阅读和更新数据库

文章图片
问题:买玫瑰味的洗发水
Jurassic-X会从人类语言中提取中关键信息 , 并从商店清单中去检索产品 , 加入到购物车的数据库中 。 这在智能助理 , 电子商务等都有应用前景 。
对于当下问题的文本生成

文章图片
问题:谁是当下的美国总统
Jurassic-X会融合当下及时更新的外部数据库 , 例如维基百科去产生更及时的数据 。
数学操作

文章图片
问题:公司的655400份份额被94个员工平均分配 , 每个员工得到多少?
Jurassic-X会通过语言模型提出去关键信息 , 并且应该去寻找一个“数学专家” , 也就是计算器 , 从而得出正确结果 。
组合型问题

文章图片
问题:更多的人住在TelAviv还是Berlin?
Jurassic会将组合型问题分解为若干子问题:TelAviv的人口是多少?Berlin人口是多少?哪个数字更大?等 , 解决了每个子问题后再把它们汇总在一起 。 更重要的是 , 这样也增加了可解释性 , 说明了模型给出答案的依据 。
- 炸锅|酷暑之下,莫让这些谣言再增“热”度
- 科学家为何要在太空放火?会有什么后果?答案让人意外
- 黄渤让四位导师演戏演到崩溃,王一博撒娇,钟汉良一秒入戏
- 让骁龙8+“凉”了 ROG游戏手机6预热:散热升级
- 虽然正式版还尚早|iOS 16第二个测试版更新细节揭晓:苹果让锁屏更个性化
- 腾讯|8个免费的神级APP,让你的ipad不再吃灰
- OPPO|iPhone14ProMax渲染图:两个王炸让我破防,苹果将再次成功
- 空调|空调移机“坑”巨多,这些套路一定要牢记,别让自己再花冤枉钱了
- iPhone 13深度使用半年,体验虽然流畅,但两个缺点却让人无奈!
- Apple Watch|热搜第一!饿了么的免单活动,为什么如此让人上头?
