计算机|随着科技的进步，计算机会像人类一样去“看东西”

现在大家都知道，在技术领域里，人类容易接触到的一切都很难反映出来。这也难怪，我们是六百万年进化的产物时，先进的计算机系统和数字机器人只有几十年的历史。然而，它的发展正朝着正确的方向发展，计算机对世界的感知能力的提高，也正好证明了这一点。
我们需要在计算机系统感知世界的方式上做出重大的改进。

文章插图

今天，大多数计算机视觉系统远远没有达到标准和合理。在悬浮物体、或“走进”某个物体或“重叠”某个物体的背景下，物体的方向性差是目前为止最小的问题。如果我们越来越依赖机器人、自动化甚至是自主系统，我们（不是我们，而是专家）需要在相关系统如何感知世界方面做出重大改进。
麻省理工学院的研究人员是如何提高计算机对世界的认知的？
【计算机|随着科技的进步，计算机会像人类一样去“看东西”】我们希望乘坐自动驾驶汽车，乘坐无人驾驶的出租车，将繁琐的工作外包给机器人，并尽可能实现一切自动化，因此我们肯定需要开发基于光学相机的系统。
最近，麻省理工学院的研究人员完成了这项工作，向世界展示了他们的最新成果——3DP3，即通过概率编程实现的3D场景感知。
这是一个新的人工智能系统，它尝试达到人类感知世界的水平，而且做得非常好。它通过几张图片学习感知现实世界的物体，并通过那些之前学习过的物体来感知场景。它将真实照片与通过传统深度学习系统和最终3DP3读取的照片进行对比。

文章插图

在这两种情况下，算法都应该专注于一个特定的对象，并为研究人员提供他们如何准确地看到它的结果。在测试中，研究人员表明，3DP3无法匹配这项任务，仅仅5张基线图像就足以让它有效工作。因此，现在负责的研究人员想要改进它，使其即使在单一来源的材料下也有效，并测试它训练其他神经网络的潜力。
至于3DP3本身的发展，研究人员从人工智能研究的开始就受到概念的启发。根据它，计算机视觉系统可以被看作是计算机图形学的“逆”，正如techny.org指出的那样。考虑到这一点，研究人员开发了概率编程，允许系统根据输入数据检查检测到的物体，看看从相机捕捉到的图像是否与任何场景可能匹配。重要的是，系统能够识别可能的不匹配并纠正它们。