现在大家都知道,在技术领域里,人类容易接触到的一切都很难反映出来。这也难怪,我们是六百万年进化的产物时,先进的计算机系统和数字机器人只有几十年的历史。然而,它的发展正朝着正确的方向发展,计算机对世界的感知能力的提高,也正好证明了这一点。
我们需要在计算机系统感知世界的方式上做出重大的改进。

文章插图
今天,大多数计算机视觉系统远远没有达到标准和合理。在悬浮物体、或“走进”某个物体或“重叠”某个物体的背景下,物体的方向性差是目前为止最小的问题。如果我们越来越依赖机器人、自动化甚至是自主系统,我们(不是我们,而是专家)需要在相关系统如何感知世界方面做出重大改进。
麻省理工学院的研究人员是如何提高计算机对世界的认知的?
【 计算机|随着科技的进步,计算机会像人类一样去“看东西”】我们希望乘坐自动驾驶汽车,乘坐无人驾驶的出租车,将繁琐的工作外包给机器人,并尽可能实现一切自动化,因此我们肯定需要开发基于光学相机的系统。
最近,麻省理工学院的研究人员完成了这项工作,向世界展示了他们的最新成果——3DP3,即通过概率编程实现的3D场景感知。
这是一个新的人工智能系统,它尝试达到人类感知世界的水平,而且做得非常好。它通过几张图片学习感知现实世界的物体,并通过那些之前学习过的物体来感知场景。它将真实照片与通过传统深度学习系统和最终3DP3读取的照片进行对比。

文章插图
在这两种情况下,算法都应该专注于一个特定的对象,并为研究人员提供他们如何准确地看到它的结果。在测试中,研究人员表明,3DP3无法匹配这项任务,仅仅5张基线图像就足以让它有效工作。因此,现在负责的研究人员想要改进它,使其即使在单一来源的材料下也有效,并测试它训练其他神经网络的潜力。
至于3DP3本身的发展,研究人员从人工智能研究的开始就受到概念的启发。根据它,计算机视觉系统可以被看作是计算机图形学的“逆”,正如techny.org指出的那样。考虑到这一点,研究人员开发了概率编程,允许系统根据输入数据检查检测到的物体,看看从相机捕捉到的图像是否与任何场景可能匹配。重要的是,系统能够识别可能的不匹配并纠正它们。
- ZOL科技早餐:华为千元手表官宣,腾讯QQ回应大规模盗号
- 苹果|美科技巨头每秒能赚多少钱?苹果11376元
- 科技入黔|“科技入黔”助力贵州高质量发展
- 领军企业|30个!中国科协发布2022年科技领域重大问题难题
- 为何人类科技几乎停滞?谁影响了人类发展?又被科学家猜对了?
- 一加科技|618手机黑马清单:小米这次直接杀疯了
- 一加科技|荣耀好戏不断,16+256GB新机露面,还有5000mAh大电池陪同
- 物流|科技赋能封管控区,无人车助力物流配送
- 小米科技|小米两款“Ultra”新机齐遭曝光,分别搭载骁龙8+和天玑9000+芯片
- 小米科技|雷军晒小米12 Ultra的随手拍!可惜手挡住了,什么都看不清
