Masques du génie du lieu
prototype d’un instrument pour déchiffrer l’identité des rues urbaines avec les données massives et les algorithmes d’apprentissage-machine
Avec le soutien du Fonds de recherche du Québec — Société et culture, Programme de Soutien à la recherche pour la relève professorale
Description du projet
Problématique : L’identité du lieu est relative à tous les autres lieux
Ce projet de recherche s’interroge sur l’identité du lieu à l’époque de l’intelligence artificielle et des données massives (big data). Il tente de profiter de la performance croissante des ordinateurs et de la disponibilité et gratuité des algorithmes d’apprentissage-machine et des données sur les villes pour construire un modèle numérique qui se servira de terrain pour répondre à plusieurs questions de recherche. Ce projet exploratoire fera travailler des étudiants en génie informatique et en architecture, tout en s’appuyant sur d’autres disciplines comme l’anthropologie, la philosophie, les mathématiques et la géographie. Il propose 1) de développer et déployer une application Web qui permettra aux chercheurs et au public de découvrir autrement leur rue, leur quartier ou leur ville, et 2) de se servir de la même application pour répondre à plusieurs questions de recherche qui émergent à notre époque ou qui demeurent encore pertinentes au XXIe siècle.
Le concept du lieu est un terme clé pour l’architecture et l’urbanisme. Au milieu du XXe siècle, le concept du genius loci (« génie du lieu » ou « esprit du lieu ») prend une place importante en architecture [1]. L’esprit du lieu est une réalité concrète saisissable par l’expérience sensible du lieu [2]. L’architecture cherche à rendre visible cet esprit du lieu à travers ses interventions sur le milieu naturel et construit [3]. Respecter l’esprit du lieu signifie aussi respecter l’identité du lieu, d’être fidèle à sa nature [4,5]. Le corps en mouvement dans l’espace est la façon privilégiée de connaître, de façon surtout intuitive et viscérale, l’esprit du lieu [6–8]. Parler d’un tel esprit peut, si on s’appuie sur les recherches sur les cosmologies animistes, être compris comme une façon de raisonner le sentiment étrange de se faire interpeller par un lieu [9]. Se faire transformer en sujet par cette interpellation surnaturelle peut générer un sentiment d’attachement qui devient fondateur pour l’identité individuelle et collective, comme observe la psychologie de l’environnement [10,11].
L’intérêt pour l’identité et l’esprit du lieu est né à une époque où les transformations urbaines d’après-guerre furent jugées insensibles aux qualités intrinsèques des rues et des quartiers des villes [12,13]. S’il ne faut pas négliger le rôle d’un sentiment populaire antiscientifique qui revient souvent lors de grandes transformations sociétales [14], il importe de souligner que les sciences qui guidaient l’urbanisme relevaient de l’économie urbaine et des grands modèles théoriques qui abordaient la ville comme un système d’entités et de relations régi par des lois statistiques et habitée d’acteurs rationnels [15,16]. Les recherches sur l’esprit du lieu contestaient l’application générale de ces modèles théoriques (qui traitaient le lieu comme une localisation dans un espace neutre) et ramenaient la conscience du lieu à la manière dont l’esprit du lieu se présente à l’esprit humain, s’appuyant notamment sur la phénoménologie [17].
La réalité informatique et computationnelle du milieu du XXe siècle ne ressemble plus guère à la nôtre. Ceci n’est pas uniquement en raison de l’amélioration des processeurs d’ordinateur, mais aussi à l’évolution des techniques mathématiques et algorithmiques employées pour la modélisation de phénomènes [18]. Deux types de modélisation se côtoient aujourd’hui : 1) celui qui applique une conception théorique du phénomène à un jeu de données et 2) celui qui tente d’approximer un modèle à partir d’un jeu de données [19]. Le premier rassemble les approches géométriques comme la typomorphologie [20] et la syntaxe spatiale [21,22] mais aussi les modèles théoriques urbains hérités de la Renaissance [15,23]. On y trouve également les approches mathématiques et de simulation qui constituent chez certains les techniques pour une « nouvelle science des villes » [24].
Le deuxième type de modélisation comprend les algorithmes d’apprentissage-machine. Ces derniers cherchent à approximer la structure d’un jeu de données hautes dimensionnelles, c’est-à-dire dont les cas sont nombreux et hétérogènes [19]. Par exemple, les cartes auto-organisantes (self-organizing maps) déploient un réseau de n par n neurones sur un jeu de données qui regroupe (« indexe ») les cas selon leurs propriétés similaires, dégageant ainsi des structures latentes et des tendances autrement difficiles à déceler par un processus manuel comparable ou par un traitement statistique [18,25,26]. Ce type de modélisation a l’avantage de traiter chaque élément comme une singularité plutôt que comme membre d’une distribution statistique ; il a le désavantage d’avoir besoin, pour « voir » la singularité d’un cas, d’un grand nombre d’autres cas similaires [19]. L’identité d’un élément dépend de sa relation à tous les autres éléments. C’est pour cette raison que les jeux de données massives intéressent autant pour ce type de traitement. Toutefois, plus de données et plus de complexité algorithmique ne permettent pas d’affirmer que la machine lit les phénomènes à notre place. La nature probabiliste du fonctionnement des algorithmes et l’ambiguïté des résultats font appel à une responsabilité plus importante de la part du chercheur [27,28].
Questions de recherche : Interroger l’esprit du lieu urbain avec l’intelligence-machine
Ce projet cherche à profiter de l’évolution des techniques algorithmiques pour aborder l’esprit du lieu de façon novatrice. Il demeure exploratoire, compte tenu du nombre limité d’études ayant tenté dans un contexte de recherche de traiter l’esprit du lieu de cette manière. Il vise à répondre à trois groupes de questions. Q1) Quelles caractérisations des lieux urbains un algorithme d’apprentissage-machine propose-t-il ? En quoi la caractérisation proposée par l’algorithme diffère-t-elle des façons dont l’urbanisme tend à caractériser les lieux urbains ? Quelle lumière apporte-t-elle sur les façons dont la ville se fait analyser en éléments par la théorie urbaine ? Q2) En quoi la caractérisation change-t-elle selon le nombre de lieux inclus dans la base de données, de l’échelle provinciale à celle du pays ou de la région géographique ? En quoi la manière de représenter les données change-t-elle cette caractérisation ? Q3) Si on considère la façon dont les lieux sont connectés dans la forme urbaine, quelle est l’impact de la connectivité sur la caractérisation algorithmique ? Quel est l’impact de l’échelle de cette connexion, à plusieurs distances ? Quelle est sa relation avec les limites administratives ou des ruptures topographiques ?
Approche théorique : l’esprit du lieu, un sujet impersonnel dans un monde déjà en communication
Pour répondre à ces questions, le projet abordera le lieu de la manière suivant : Si l’esprit et l’identité du lieu tendent à être traités par une approche théorique ancrée dans la phénoménologie, celle adoptée dans le cadre de ce projet se rapproche de ce que l’architecte et chercheur Lars Spuybroek appelle une phénotechnique [29]. La phénotechnique s’intéresse à la manière dont les apparences se présentent à des objets, en plus de se présenter au sujet humain [30]. Toutefois, il ne s’agit pas de limiter la réception d’apparences à des objets techniques, mais plutôt de l’inclure dans une posture philosophique qui se positionne par rapport à l’intelligence artificielle. Le philosophe Michel Serres définit la pensée comme le fait d’émettre, de recevoir, de stocker et de traiter de l’information [31]. Il observe que le monde, qu’il soit vivant ou non vivant, « sait » sans (à notre connaissance) le savoir. En étudiant l’œuvre de Michel Serres, Crahay y voit l’émergence d’une philosophie qui embrasse l’intelligence non humaine [32]. Cette particularité de sa philosophie gagne en intérêt notamment pour les courants philosophiques du posthumanisme [33,34] et du néomatérialisme [35,36]. Serres observe que les sciences naturelles contemporaines nous décrivent un monde déjà en communication [37] et développent des instruments pour intercepter et décoder des informations qui circulent dans l’univers entre tous les vivants et non-vivants [38]. Physicien et mathématicien Elias Zafiris abonde dans le même sens en appelant récemment cette façon de comprendre la nature un modèle de « communication naturelle » [39].
En suivant ce cadre théorique, le projet abordera l’esprit du lieu comme une agentivité communicationnelle intrinsèque à l’ensemble des lieux urbains (peu importe si le sujet humain les qualifie d’espaces ou de lieux). Cette agentivité, que nous pouvons aussi appeler une forme de subjectivité impersonnelle, émet, reçoit, stocke et traite de l’information. Si l’approche phénoménologique se sert du corps humain comme l’intercepteur par excellence de ses informations [8,16], l’approche phénotechnique adoptée par ce projet se sert d’un instrument algorithmique. Ce dernier, suivant le modèle de communication naturelle [39], situe l’esprit du lieu dans un domaine accessible seulement de façon indirecte par l’instrument. La mise en relation par les algorithmes d’apprentissage-machine permettra de traiter de manière indexicale un grand nombre de lieux et faire apparaître l’identité de chacun des lieux qui se définit en fonction de tous les autres lieux. Le traitement algorithmique nécessitant une description commune de tous les lieux pour les mettre dans un jeu de données, le projet prendra les tronçons de rue (le segment entre deux intersections) de toute la province. En effet, la rue est un élément principal en architecture et en urbanisme [12,15,22,40].
Objectifs de recherche : Instrument algorithmique et nouvelle caractérisation des rues urbaines
Les objectifs de recherche et les livrables s’organisent selon les groupes de questions de recherche. Indépendant des livrables qui cherchent à communiquer les résultats de recherche, le projet publiera le code Python du projet sur la plateforme ouverte GitHub et déploiera une application Web qui permettra une consultation publique de la caractérisation de l’identité des lieux proposée par l’instrument algorithmique.
Objectifs de recherche
-
Recenser les techniques analytiques pour caractériser et classer les rues.
-
Croiser les façons dont les théories urbaines et architecturales abordent la rue comme élément clé avec les caractérisations proposées par l’algorithme.
-
Analyser la caractérisation des rues urbaines en faisant varier le nombre de tronçons de rue traité par l’algorithme.
-
Analyser la caractérisation des rues urbaines en faisant varier les types de données utilisées pour les décrire dans la base de données.
-
Analyser la caractérisation des rues lorsque l’algorithme tient compte de leur connectivité aux autres rues à plusieurs échelles.
Méthodologie de recherche : De l’instrument algorithmique à l’analyse des résultats.
Les données utilisées pour ce projet viendront principalement d’Open Street Map (OSM), de Google StreetView (GSV) et des données ouvertes de la province de Québec (donneesquebec.ca). L’objectif étant de maximiser plutôt que de faire une sélection limitée des façons de représenter les rues dans la base de données du projet, celle-ci comprendra également des données issues de photos satellites et de cartes géologiques ou pédologiques et des modèles numériques de terrain. Les données d’OSM (les routes et les points d’intérêt) et de GSV (des vues prises d’un véhicule au milieu de la voie) seront téléchargées avec un robot d’indexation (web crawler) écrit en Python suivant d’autres recherches [41]. De manière générale, les sources gratuites seront privilégiées. L’accès au téléchargement programmatique d’images de GSV étant payant, le prix de cet accès est inclus dans le budget. Les données brutes seront stockées sur un serveur chiffré à l’Université. Un·e étudiant·e de maîtrise en génie informatique sera engagé·e pour aider à monter les scripts de téléchargement avec les API d’OSM et de GSV. La collecte de données est prévue pour l’année 1, avec des mises à jour effectuées par le chercheur chaque été.
Les données sur les rues seront organisées dans un jeu de données à partir d’OSM qui fournira les métadonnées sur les rues et tous les points d’intérêt ou des objets identifiés par les contributeurs à la plateforme OSM (lampadaires, arrêts de bus, piste cyclable, etc.). Deux vues seront extraites de GSV par tronçon de rue et traitées en premier avec un algorithme d’extraction de traits caractéristiques (comme celui de scikit-learn) avant d’être analysées avec un réseau de neurones convolutif (comme le modèle VGG16 [42], disponible gratuitement) pour identifier le contenu de l’image [43]. Les éléments identifiés par OSM et le contenu des images GSV, inspiré des pratiques courantes en analyse textuelle [44], seront traités comme des « mots », comptés et normalisés pour éviter que la longueur de la rue biaise sa lecture par l’algorithme d’apprentissage-machine. Trois autres jeux de données seront créés pour répondre aux questions du groupe 3 sur l’impact de la connectivité des rues à leur caractérisation. Il s’agira d’utiliser un algorithme d’analyse réseau (comme OSMnx) pour donner à chaque tronçon de rue tous les attributs de ses voisins à des distances topologiques d’une tronçon, deux tronçons et trois tronçons, suivant la méthode employée par le chercheur dans le cadre de son doctorat [45,46].
Suivant plusieurs travaux de thèse récents qui en ont fait une utilisation novatrice [47,48], l’algorithme de carte auto-organisante (self-organizing map, ou SOM) sera employée pour traduire les données brutes des tous les jeux de données en un seul chiffre (le neurone qui indexe les caractéristiques les plus similaires). Avant le traitement avec la SOM, une réduction par décomposition en valeurs singulières (SVD) sera menée sur les données pour réduire les rédondances présentes dans une matrice éparse dont beaucoup de champs sont vides (des éléments urbains qui ne sont pas présents partout, comme des mots rares d’un corpus). La réduction de dimensions fait partie du travail de calibration de l’instrument algorithmique dont les paramètres choisis sont à justifier par le chercheur lors de la présentation et l’interprétation des résultats.
La caractérisation des lieux par la SOM prend la forme d’une valeur donnée à chaque tronçon de rue qui indique sa place dans un ordre de similarité. La SOM adapte un réseau neuronal aux données brutes (l’étape « d’apprentissage »). Pour répondre aux questions de recherche, les analyses croisera la caractérisation algorithmique des lieux avec des informations externes tels que les cartes contemporaines ou historiques des villes québécoises (disponibles gratuitement par la cartothèque de l’Université Laval), des visites sur le terrain lorsque possible pour vérifier « l’intuition » de l’algorithme avec l’intuition du chercher ou des étudiants auxiliaires engagés par le projet ainsi que des lectures des textes qui abordent la rue comme un élément clé de la ville [15,21,40], suivant les approches des modèles théoriques. Ces derniers serviront surtout à répondre au premier groupe de questions (Q1) de recherche qui interrogera à la fois les écrits à travers une recension des écrits (O1a) et l’algorithme à travers une analyse informée par la recension (O1b). Pour le deuxième groupe de questions (Q2), il s’agit de faire varier le nombre de tronçons de rue (O2a) et les types de représentation pour comprendre la contribution de certains d’entre eux à la caractérisation algorithmique (O2b). Enfin, les trois jeux de données préparés par les analyses à plusieurs distances topologiques serviront à comprendre l’influence des rues avoisinantes sur la caractérisation (O3) et à répondre au troisième groupe de questions (Q3).
Ce projet a également comme objectif de faciliter la consultation publique des caractérisations algorithmiques des tronçons de rue en développant une application Web qui sera déployée et accessible pendant la deuxième année du projet ainsi qu’au-delà. L’application sera programmée dans un langage comme Go sur des modules écrits en Python et déployés avec Amazon Web Services (AWS). L’Université Laval hébergera les données nécessaires pour consulter les différentes caractérisations de façon cartographique et pour interroger les métadonnées issues des sources gratuites. L’architecture de cette application s’inspirera du projet Nemo (nemo.profmrdoyle.com) dont la première phase du déploiement Web a été complétée par le chercheur et un étudiant en génie informatique à l’été 2022.
Originalité et impacts potentiels du projet
Ce projet offrira aux architectes et aux urbanistes (actuels et futurs) une plateforme pour analyser et comparer les rues urbaines de la province du Québec. Les plateformes cartographiques actuelles, de la carte interactive de la ville aux données disponibles sur OSM et Google Maps, ne permettent pas de voir les rues en relation et à grande échelle. Les techniques d’analyse offertes par les systèmes d’information géographique (ArcGIS et QGIS) ne permettent pas encore de faire ce type d’analyse par apprentissage-machine. Si ArcGIS offre un module d’extension avec un algorithme de cartes auto-organisantes, ce dernier ne permet pas d’assigner des éléments géographiques à un index du réseau neuronal. En dehors du milieu professionnel, les citoyens et visiteurs pourront également consulter les caractérisations algorithmiques, découvrant des rues similaires à celle de leur résidence ou de leur ville. Ce projet étant exploratoire, l’application Web ne pourra pas permettre une grande interaction autre que la consultation. Cependant, elle fournira une base pour des phases futures où les citoyens, résidents ou visiteurs peuvent corriger ou ajouter des informations manquantes sur les rues qu’ils fréquentent. La première phase du projet aura l’avantage tout de même de pouvoir être mise à jour en ajoutant les informations manquantes sur OSM, initiant les utilisateurs à la cartographie collective. Une future phase pourrait aussi élargir la zone d’analyse à l’échelle du pays, du continent ou de la planète. L’instrument algorithmique pourrait en principe s’appliquer à n’importe quel milieu urbain et donc aura un grand potentiel de généralisation, même si la caractérisation évoluera toujours en fonction des nouvelles rues ajoutées.
Ce projet offrira à la communauté scientifique une façon d’aborder les notions d’identité du lieu et d’esprit du lieu qui traduit une approche théorique en un instrument algorithmique. Il cherche à revenir sur un jugement issu du milieu du XXe siècle qui affirme que les modèles numériques sont inaptes à sonder l’identité du lieu [2], en distinguant deux types de modèles et en présentant à la communauté scientifique une démonstration concrète du potentiel d’application tout en soulignant les forces et faiblesses. Le projet s’appuie sur et cherche à participer aux discours portant sur le rôle des algorithmes et de l’intelligence artificielle en architecture, en urbanisme et dans la société [18,49,50]. Si la grande majorité des recherches sur l’identité du lieu et de l’esprit du lieu depuis les années 60 ancrent les deux concepts dans le sujet humain (personnel), comme le montre une recension récente [51], ce projet propose de les situer du côté du lieu compris comme un sujet impersonnel et de chercher à faire apparaître l’identité du lieu par un instrument algorithmique qui entre en communication avec ce sujet.
Bibliographie
-
Rossi, A. The Architecture of the City; Oppositions books; MIT Press: Cambridge, Mass, 1982.
-
Norberg-Schulz, C. Genius Loci: Towards a Phenomenology of Architecture; Rizzoli: New York, 1980.
-
Rasmussen, S.E. Experiencing Architecture; M.I.T. Press: Cambridge, Mass., 1978.
-
Descola, P. Par-delà nature et culture; Éditions Gallimard.; Paris, France, 2005.
-
Jacobs, J. The Death and Life of Great American Cities.; Random House: New York, 1961.
-
Mumford, L. The Culture of Cities; Harcourt Brace Jovanovich: New York, 1970.
-
Dowek, G. Ces préjugés qui nous encombrent; Le Pommier: Paris, 2009.
-
Portugali, J. Complexity, Cognition and the City; Springer complexity; Springer: Heidelberg, 2011.
-
Oliveira, V. Urban Morphology; The Urban Book Series; Springer International Publishing: Cham, 2016.
-
Hillier, B.; Hanson, J. The Social Logic of Space; Cambridge University Press: Cambridge, 1984.
-
Batty, M. The New Science of Cities; MIT Press: Cambridge, Massachusetts, 2013.
-
Spuybroek, L. Grace and Gravity: Architectures of the Figure; Bloomsbury Visual Arts: London, 2020.
-
Posthuman Glossary; Braidotti, R., Hlavajova, M., Eds.; Theory; Bloomsbury: London, 2018.
-
Serres, M. L’incandescent; Editions le Pommier : Diffusion Harmonia Mundi: Paris, 2003.
-
Simonyan, K.; Zisserman, A. Very Deep Convolutional Networks for Large-Scale Image Recognition. 2014, doi:10.48550/ARXIV.1409.1556.