资讯

n/e/w/s

智创未来 | 城市视觉智能:以AI技术与街景影像重塑城市研究

发表时间:2024-05-28

在人工智能技术的影响下,我们对城市环境的理解和分析方式正在经历一场革命性的变化。城市视觉智能,作为这一变革的前沿领域,融合了先进的AI技术和丰富的街景影像数据,为我们提供了一种全新的视角来观察和量化城市的物质特征、社会经济状况以及人的行为模式。通过自动识别城市特征、预测社会经济状况、量化分析城市视觉环境,以及构建多尺度的城市分析框架,城市视觉智能不仅增强了我们对城市复杂性的认识,而且为城市规划、治理和可持续发展提供了新的工具和方法。本期文章将探讨城市视觉智能的核心概念、技术挑战,旨在揭示这一跨学科领域如何重塑我们对城市研究的认知,并推动城市科学向更深层次的发展。

图片
近日,备受瞩目的学术期刊《美国地理学会会刊》(Annals of AAG)在线发布了一篇重要论文,题为“Urban Visual Intelligence: Studying Cities with Artificial Intelligence and Street-level Imagery”。该论文深入探讨了“城市视觉智能”的理论框架,系统地揭示了街道尺度的图像数据和人工智能技术在城市空间感知以及人地关系理解中的核心作用,并全面剖析了当前面临的挑战以及未来可能的发展机遇。

此项研究由北京大学张帆博士领衔,他不仅是论文的第一作者,还担任了通讯作者的角色。此外,研究团队还汇聚了包括麻省理工学院的Lawrence Value、Gary Hack、Carlo Ratti,北京大学的刘瑜,以及伦敦大学学院的Micheal Batty等在内的国内外知名学者,共同为城市视觉智能的研究贡献智慧。



01 内容导读/ABSTRACT

从19世纪末至20世纪中期,卡米洛·西特(Camillo Sitte)、凯文·林奇(Kevin Lynch)、鲁道夫·阿恩海姆(Rudolf Arnheim)和简·雅各布斯(Jane Jacobs)等杰出学者率先对城市的视觉维度进行了开创性的探索,奠定了这一城市研究领域的基石。随着时间的推移,尤其是进入大数据和人工智能的时代,人类的行为、感知以及与城市的互动方式正经历着前所未有的变革。

本文回顾了城市视觉空间研究的历程,并在此基础上提出了“城市视觉智能”的理论框架。该框架系统地探讨了图像数据和人工智能技术如何革新城市研究者对城市感知和量化的方法,使我们能够在多个尺度上深入剖析城市物质环境与人类活动、社会经济环境之间的复杂关系。

图片

这些新兴方法不仅促使我们重新审视和反思传统的城市理论和研究领域,更在当今这个以人工智能和数据驱动为研究主流的时代,为我们提供了创造更符合人类行为模式和需求的城市空间的有力工具。通过这一框架,我们有望构建出更加智能、宜居和可持续发展的城市环境。



简介/

02 简介/INTRODUCTION


图像在城市研究中始终占据着不可或缺且历久弥新的地位,它们为我们提供了对物质环境的深刻洞察,并深刻影响了城市规划理论的发展。这种历史重要性在塑造我们对城市空间、个人以及社区间互动影响的理解上发挥着关键作用。

自十九世纪起,图像就成为了评估城市空间审美的有力工具,使研究人员能够直观地观察、记录和评估城市空间的设计、美感和功能运转(Freestone 2011)。图像在构建城市规划理论方面也发挥了关键性的角色,强调了城市环境中美学价值的重要性及其对人类行为的深远影响(C. Mulford 1899; Cullen 1961; Nasar 1990; Robinson 1903)

过去,使用图像研究城市主要依赖于手动收集和人工的观察分析。这一领域的先驱者,如林奇(1960),就通过第一手观察和城市照片样本来理解和认知城市的主要视觉要素;而怀特(1980)则通过手工收集和分析数小时的社区摄像头视频,以研究人类在城市空间中的行为模式。这些方法虽然为我们提供了宝贵的洞见,但在可扩展性和大时空尺度研究的可行性上存在着明显的局限性(Sampson and Raudenbush 1999; Clifton, Livi Smith, and Rodriguez 2007)

然而,随着传感技术、社交媒体平台和志愿者地理信息技术的飞速发展,我们现在能够更高效地收集和利用图像数据,极大地扩展了城市研究的范围和规模(Biljecki and Ito 2021)。更为激动人心的是,强大的计算机视觉和人工智能方法的出现,彻底改变了对这些海量图像数据集的分析方式(Ibrahim, Haworth, and Cheng 2020)。这种数据收集和分析技术的转变,为城市视觉研究注入了新的活力,引领我们进入一个全新的研究领域。

尽管图像数据在城市研究中具有巨大潜力,但我们也面临着如何区分和高效利用不同视觉数据的挑战。发展标准化的方法框架以提取和理解这些视觉信息仍是一个亟待解决的问题。目前,用于量化城市空间物质环境的概念化方法论尚未完善,这也导致了一个疑问:我们如何系统地通过物质空间的量化来深化对人地关系的理解,并整合或增强经典理论和实践?

在本文中,我们深入探讨了基于视觉信息理解城市的理论和最近的实证研究,并引入了一个名为“城市视觉智能”的概念框架。这一框架旨在将街道尺度的自然影像与人工智能技术紧密结合,以此观察、理解和量化城市的物质环境。我们的目标是进一步揭示城市物质环境与人类活动、社会经济环境之间的相互作用和共同演化关系,从而为城市规划和发展提供更为精准和全面的指导。



03 城市视觉智能框架/ FRAMEWORK

图片
城市视觉智能的概念框架

城市视觉智能的概念框架旨在不同尺度下——包括视角(Vista)、场景(Scene)、场所(Place)、以及城市(City)——揭示城市物质环境及其与社会经济环境之间的复杂联系,回答其中的关键问题。

视角(Vista)层面回答了街景大数据如何提供一种全新的方式来观察城市物质环境。这种方法不仅超越了传统的实地勘察方法,同时与经典的遥感手段形成互补,强调不同数据源的语义及时空分布特点。

场景(Scene)层面强调街景影像的语义挖掘,回答如何基于前沿的计算机视觉和深度学习方法来理解图片中的对象、语义、及对象间的空间和语义关系。文中详细综述了常见的深度学习模型、地理人工智能方法、面向城市视觉环境的数据集、针对街景影像的计算机视觉任务、以及场景分析和理解技术。

场所(Place)层面回答在影像的语义挖掘基础上,如何基于人工智能技术对场所的物质环境进行量化表达,进一步讨论这些视觉环境是如何影响和塑造个体的空间认知,从而更全面地刻画场所。文中从场所认同(Place identity)、场所构成(Place structure)、场所感知(Place perception)三个方面对当前工作进行了梳理。
图片

城市(City)层面视城市为一个有机整体,探讨基于场所的量化表达,如何在精细时空尺度上理解物质环境与居民活动、社会经济环境之间的相互作用和长期演化关系,及其对城市规划和治理策略的影响。文中从公共健康,交通与移动性、社会经济三方面综述了现有研究。



04 讨论/DISCUSSION

仅仅使用视觉数据可能无法完全捕捉城市的复杂性,新的数据源和方法也带来了一系列新的挑战。文章讨论这了这一过程中目前存在的问题,其中包括:从场所内建模到场所间推断的可迁移性挑战,从场所个体感知到群体认知中的主观性和文化性挑战,街景分析中的各种不确定性挑战等。同时,文章也讨论了几个未来的工作方向,包括:从街景中挖掘隐含的语义信息,将视觉模态与文本、位置、声音等其他模态进行融合以更好地支持决策,AI驱动的城市场景生成,可解释和可靠的AI模型,以及在挖掘和理解城市的隐藏规律中的机遇。

文中详尽地对每一个层级中的问题、方法、以及现有工作进行了展开,详细内容请参考原文。





来源:未名时空

部分图片来源于网络,版权归原作者所有,如有异议可联系删除。


-END-











































Copyright  ©  2020 版权所有:上海空间规划设计研究院有限公司  沪ICP备20007340号-1