AI的眼睛:为什么LiDAR是未来人工智能的关键
目录
AI的眼睛:LiDAR为人工智能的未来提供关键支持
为了实现人工智能在各种任务中的最大潜能,有一个鲜为人知但至关重要的技术需要脱颖而出——LiDAR。本文由Satyen K. Bordoloi撰写。
第一个被人工智能直接夺走生命的人是Elaine Herzberg。2018年3月18日,她骑着自行车穿越4车道的高速公路时,一辆由人工智能控制的自动驾驶汽车(AV)撞上了她。AV配备了复杂的摄像头和传感器系统,用以感知周围环境。在这起事故中,主要的故障出现在它的LiDAR系统上。
AI不能思考。不能看见。也不能理解。我们所谓的“思考”只是模仿。成千上万的人类工作者花费数月甚至数年的时间培训人工智能执行最终任务,期望一旦投入使用,它们能够自主学习和进化,然而这一期望正在被证明是不准确的。在培训自动驾驶汽车等领域的人工智能系统时,其中一个最大的问题是如何使车载计算机“看见”。你可能认为这很容易。然而,这个领域——称为计算机视觉——是极其棘手的。
Cruise AV车辆上最高的点是五个Velodyne LiDAR单元,通过向周围投射激光来扫描环境。 (图片来源: Wikipedia)
计算机视觉的定义:
这基本上是为数字系统赋予看和解释世界的能力。ChatGPT、Bard和其他生成型人工智能系统是盲目的。它们不需要看到周围的环境,只需根据其数据集、训练和查询重新生成文字。对于像Bard或ChatGPT这样的系统,如果您想让它告诉您椅子后面的照片是什么,您需要将照片上传到系统中,AI会运行搜索并告诉您。然而,它无法告诉您照片距离椅子有多远,或者照片的框架是木制还是金属制。
这对于Bard或ChatGPT这种应用来说是可以接受的。但是,如果您需要构建复杂的人工智能系统,比如用于自动驾驶的AV,或者用于盲人使用的系统,深度就变得至关重要。盲人佩戴的智能眼镜上配备了多个摄像头和传感器,不仅必须解释前方的物体,还必须告诉她左侧的汽车距离有多远,以多大的速度靠近,以及是否足够安全过马路。
如果她能看见,她会毫不犹豫地知道汽车大约在50米的位置,然后在观察一秒钟后,她会知道汽车的速度足以计算出她可以安全过马路。我们所有人每时每刻都在不经思考地做出这样的决策。然而,当我们试图让AV“看见”时,我们才意识到这些小决策是多么复杂,以及它们可能会对生活产生多大的影响。
要实现这一点,AI系统不仅需要“看见”,还需要以3D视角查看周围的环境。这就是LiDAR发挥作用的地方。
iPad Pro第四代上的LiDAR扫描仪。 (图片来源: Wikipedia)
LiDAR——AI的“眼睛”:
LiDAR代表光探测与测距。它听起来与RADAR——射频探测与测距相似,因为它们都用于探测远处物体的存在和体积。主要区别在于它们的波长以及它们捕获的信息量。RADAR使用无线电波,而LiDAR使用光波。因此,RADAR具有更宽的波束发散,可以探测更远处的物体,而LiDAR具有更窄但更聚焦的波束,因此具有更长的探测距离。
因此,LiDAR更准确,可以提供更详细的3D地图,而RADAR更灵活,可以在更广泛的条件下工作。
LiDAR通过向周围发射脉冲光波来工作。如果遇到障碍物,光会反弹回传感器,然后计算每个脉冲返回所花费的时间,从而计算出距离
。系统每秒执行数百万次此操作,以创建实时的环境3D地图,称为点云。在AV上,车载计算系统利用此LiDAR点云了解周围情况,从而安全地驾驶车辆。
使用单个LiDAR在移动车辆上生成的点云,仅用时18秒。 (图片来源: Wikipedia)
LiDAR不仅可以检测物体的距离,还可以根据反射光的强度估计物体的组成。例如,金属几乎会完全反射激光,而木材会吸收一些激光。通过将普通相机拍摄的图像与其编程进行分析,AV可以准确地预测物体是什么。
在像AV这样的正常人工智能导航系统中,大约有30个传感器,包括摄像头,用于帮助车辆在世界中导航。车辆的最高点就是LiDAR,它通过向周围发射光束来扫描环境。除了RADAR外,它还配备了多个摄像头、声纳、惯性测量单元、GPS、里程表、轮子编码器等。
使用单个LiDAR在移动车辆上生成的点云,仅用时18秒。 (图片来源: Wikipedia)
在行驶的自动驾驶汽车中,来自这些多个传感器和摄像头的数据是实时获取并进行分析的。车速越快,车载计算机进行计算的时间就越少。理想情况下,基于风险的考虑,它应该有更多的时间来进行更准确的计算。可悲的是,情况却相反。
盲人佩戴的智能眼镜需要执行与AV相同的任务,即使用这些传感器“看见”周围的环境,包括3D环境。然后,它可以通过生成型AI系统(如Bard或ChatGPT)将相同的信息描述给佩戴者,并告知他们周围的情况,或者警告他们有危险。因此,在派对上,盲人会比有眼睛的人更有吸引力,因为他们的AI系统不仅会告诉他们每个人的名字,还会描述他们穿着什么,帮助他们开玩笑或引起注意。
高分辨率多光束LiDAR地图显示了一个构造复杂且充满故障的海底地质形态,以阴影效果和深度着色显示。 (图片来源: Wikipedia)
LiDAR之所以是未来:
无论是对ChatGPT等表示满意还是警惕,世界都没有意识到人工智能的未来范围。人工智能已经在大多数行业、企业和工作中使用。然而,它最深刻的用途将是在我们的个人生活中,作为我们设备中的个人助手,帮助我们完成大部分工作,从而提高我们的生产力。
我们希望AI系统能够在现实世界中帮助我们。然而,如果AI系统没有一个强大的LiDAR系统以及支持它的相应机器学习工具,它就无法理解现实世界。我们在使用AI的每个设备上都需要LiDAR。想象一下,如果您的手机上有一个个人助手,当您在重度饮酒后从酒吧里跌跌撞撞地走出来,试图停好您的车时,您把它指向您的肩膀,以查看您的女朋友是否在跟随您,如果它甚至无法根据她的步伐速度和表情判断她是否生气,那有什么用呢?
从LiDAR点云生成个体树木或地块级别森林信息的典型工作流程。 (图片来源: Wikipedia)
除了摄像头之外,LiDAR是AI实现其承诺并发挥作用的关键工具。
我们手机上的当前AI和ML工具已经具备了许多功能。它们可以翻译标志。将语音转化为文字。如果您对着相机指着,就能告诉您是什么树。并且,通过安装像ChatGPT和Bard这样的生成型AI功能,它可以通过蓝牙耳机直接在我们的耳朵里告诉我们这些信息。然而,当您经过重度饮酒后从酒吧里跌跌撞撞地走出来,试图停好您的车时,它不能告诉您您的车停在多远的地方,也不能分析您走了多长时间走了10米到您的车
,以及您走了一条蜿蜒的路径。如果您的手机上有LiDAR,就像iPhone和iPad一样,它可以进行这些计算,也许在这个过程中可以挽救您的生命,因为它会为您预订Uber。
使用无人机进行的LIDAR测量。 (图片来源: Wikipedia)
LiDAR在除个人辅助功能之外的许多领域都非常有用。除了自动驾驶汽车,它还是绘制环境以创建详细地图的关键工具。在无人机上,它可以快速制作您感兴趣的地方的3D地图——在考古学、灾难应对、执法和安全、战场等各个方面都是至关重要的工具。
就像在AV中一样,LiDAR对于机器人也是必不可少的。在每个家庭中的机器人仆人——科幻作品的主题——如果没有LiDAR系统,它们就无法实现。在任何培训模拟中,它们也是至关重要的。通过使用LiDAR创建的3D模型可能对设计和制造非常关键,甚至在远程手术或患者诊断中也是如此。它们在农业领域变得不可或缺,用于分析农作物产量。
LiDAR的用途如此广泛和多样,只受限于我们的想象力。AI的“眼睛”像“老虎之眼”一样,不仅推动着洛奇·巴尔博亚,还在艰难的努力中推动着整个人类走向成功的高峰。