以更少的资源做更多的事情

弗洛朗·普是Twente大学的高级科学家(ITC),数据科学和三维机器学习领域的领军人物,致力于探索新兴技术。作为3D Geodata Academy的课程主任,弗洛朗特从头设计了课程,让任何人都可以学习三维数据分析、点云处理、自动化、摄影测量和最新的三维地理数据的人工智能应用。

这次采访经过了一些简单的编辑,以缩短长度并提高清晰度。

在你所从事的行业中,你认为人工智能在哪些方面取得了重要的进展?与几年前相比,我们现在能做到哪些以前不可能的事情?

有很多答案。对于那些比我年长的人来说,这个领域的发展是令人疯狂的。但这还不及从Rotring(德国绘图仪器品牌)到计算机绘制地图的转变!我在研发中花费的时间主要是在这个(三维)人工智能革命中。当然,我们一直在追随创新的模式!以土地测量为例,以前我们只能测量一个点,并赋予该点在现场的意义。然后,我们从一个点到每秒几千个甚至百万个点的激光扫描,但在此过程中失去了即时赋予语义含义的能力。现在,我们不得不回归到赋予每个点以意义的阶段,这是繁琐的。这就是我们试图通过利用人工智能的巨大能力来在数据集中进行测量并注入更多专业知识的地方,我们正在努力取得很大进展。


这是由IGN提供的来自Louhans城市的航空LiDAR点云数据视图,突出显示了三个感兴趣的类别(地面、植被和建筑物)。© F. Poux

我们看到的最重要的事情是,我们现在能够提高语义分辨率和分析的规模,这主要体现在改进现有的任务和流程上。从长远来看,人工智能带来的最重要的东西是自动化。所以我们追求的是“以更少的资源做更多的事情”,提高生产力,提高可靠性。我们今天可以自动化很多过程;例如,我们可以节省大量时间和避免人为错误,但在结果的可靠性或认证方面,我们仍有很多工作要做。自动化以及我们现在可以分析数据的规模是我们以前无法做到的。

在哪些领域中,你看到应用人工智能产生了最大的影响?

我认为最主要的是广泛应用的物体识别。我们需要进行三维物体检测 – 在二维或三维场景中,尝试在感兴趣的物体周围拟合边界框。然后,你还有语义分割,为图像中的每个点、点云中的每个点或网格中的每个三角形赋予语义标识。接下来是实例分割,将两者结合起来。通常,我们想要做的是检测和分类,对特定资产进行组织,并附加我们的专业知识以创建可交付的成果物。在这方面,我看到了人工智能的巨大飞跃。

例如,最近我参与了一个公司的项目,我们需要检测井盖,而你需要在成千上千公里的范围内进行检测。在这种情况下,你可以依靠人工智能来完成大部分流程,或者通过优化将栅格数据转换为矢量数据。另一个很好的例子是“扫描到BIM”,今天借助人工智能,你可以自动对建筑的某些部分进行分类,以及最初需要手动完成的其他流程。现在,你只需专注于最后一部分,其中有最高的附加值。我从中看到的第一个积极的结果是,我们现在能够处理大范围的区域,而以前只能处理较小的区域,同时节约时间(提高生产力)。其次,你可以开发一个明确的系统,对于特定的应用,它总是以相同的方式运行,并且有确定的交付时间。

所以这非常有趣,但目前为止,它还是“窄人工智能”(针对特定的应用)。如果你想针对多个应用领域,你需要为每个应用构建一个系统。在这些领域内,你可以确保至少对交付时间有把握。所以这是一个重要的事情 – 以前你拥有更多的浮动元素,现在,由于自动化并将人工智能应用于受控环境中,你可以知道如果你开始流程,你将在这个时间内交付,并且你可以降低生产成本。

然而,这也是一个棘手的说法,因为通常意味着你需要在公司中拥有一些知识渊博的研究人员或编码人员,以便他们能够为你建立

完整的流程。然后,生产成本会转化为投资成本。这意味着你将把注意力集中在高价值的任务上,而那些重复性的任务或需要扩展的任务 – 人工智能会帮你完成,这样你就不需要亲自完成了。所以对我来说,这是我在这些不同项目中看到的最大好处。

尚未解决的问题是什么,以及实现人工智能的好处还面临哪些挑战?

在行业中,根据客户、任务或你想改变世界的项目,你会有不同的期望和不同的认证。所以例如,今天在控制空中交通、铁路或其他应用领域使用“黑盒子”人工智能将是一个大错误,或者那些要求事故概率低于10^-6的应用领域。当你开发你的人工智能时,它可能非常好,但如果你无法解释其中的过程,那将是一个大问题。因此,在可解释性或可理解性人工智能方面,还有很多空间需要填补。我认为我们将看到一些希望的进展。

我们看到很多争论,今天它们无处不在。我认为,人们很难理解人工智能所发生的一切。它发展得如此之快。现在,不是每个月,而是每天都有新的东西出现。很难理解 – 通常你处于一个竞争激烈的领域,或者希望与最新的元素合作等。

就个人而言,我一直是无监督学习的粉丝,尝试以很少的人工监督完成任务。然而,要实现这一点,你需要确保或拥有一些明确的东西,以便进入系统。

新闻上也有很多事情。我们看到了与大型语言模型有关的许多进展,例如ChatGPT和MidJourney,以及文本到图像生成的技术。这非常有趣,因为这种技术的分享不仅限于研究论文,它包括研究论文、工具、代码和许可证。这意味着有很多创意涌现出来,这扩大了任何一个研究团队或整个研究和学术界的视野。今天很难预测未来几年会发生什么,但我相信我们会看到很多!很难的一点是如何理解所有的信息 – 因为每件事情看起来都很好,都很重要,改变了世界,改变了我们对行业的看法。但事实上,如果我们看看过去一年或高影响力创新的创新,那比工业革命之前的进展要慢。我认为这更多是一些小的渐进式的创新。但因为它触及到每个人,而不仅仅是起源于军事领域,所以感觉像是一次大爆炸。

你对未来有什么期待?

似乎一切都很令人兴奋。我非常喜欢将现实转化为可以模拟现实的数字资产,包括广泛的模拟应用,而不仅仅是单一应用。

我们需要做很多工作的一件事是从狭义人工智能发展到人工通用智能(AGI)。然后,我将期待的下一个阶段是人工超级智能(ASI),当你超越我们作为人类的概括能力时。这种类型的人工智能可能还需要20多年才能实现,这是肯定的。但拥有广义化的能力 – 从能够自主驾驶的能力到与孩子一起玩游戏,或者可以对整个国家进行地图绘制或检测山体滑坡等能力。我对这种通用化的轨迹很感兴趣;拥有在不同场景中工作的东西。最近的一个很好的例子是Meta的“Segment Anything”模型,它确实朝着这个方向发展。你可以在不同的应用中使用相同的模型。这太神奇了,因为你可以创建有趣的工作流程,并将其归结为在特定事物上投入更高的价值。这是我作为应用的一部分真正兴奋的地方。

当然,自动化也非常重要。例如,检测和绘制土地覆盖变化,如果你有一个非常可靠的系统,那将是非常好的。但是当然,然后之后的问题是你是否可以将其扩展到全国甚至全球范围内?监测和编目自然资源也可以非常有意义,特别是对于木材或矿物等资源。此外,如果我们聚焦于卫星图像,天气预报、灾害响应或所有这些因素肯定也会包括人工智能的应用。

You may also like...