# Liste des packages
ListePackages <- c("adespatial", "car", "corrplot", "DHARMa", "dplyr", "future",
"future.apply", "gamlss", "GGally", "ggplot2", "ggpubr", "geoR",
"GWmodel", "kableExtra", "mgcv", "mgcViz", "mgwrsar", "plm",
"ProbitSpatial", "randomcoloR", "RColorBrewer", "sf", "spatialreg",
"spdep", "spgwr", "splm", "spmoran", "tmap")
# Packages non installés dans la liste
PackagesNonInstalles <- ListePackages[!(ListePackages %in% installed.packages()[,"Package"])]
# Installation des packages manquants
if(length(new.packages)) install.packages(PackagesNonInstalles)
Méthodes de régression spatiale : un grand bol d’R
Résumé : Ce livre vise à décrire une panoplie de méthodes de régression spatiale avec le logiciel ouvert R. La philosophie de ce livre est de donner toutes les clés de compréhension et de mise en œuvre des méthodes abordées dans R. La présentation des méthodes est basée sur une approche compréhensive et intuitive plutôt que mathématique, sans pour autant négliger la rigueur statistique.
Remerciements : Ce manuel a été réalisé avec le soutien de la fabriqueREL. Fondée en 2019, la fabriqueREL est portée par divers établissements d’enseignement supérieur du Québec et agit en collaboration avec les services de soutien pédagogique et les bibliothèques. Son but est de faire des ressources éducatives libres (REL) le matériel privilégié en enseignement supérieur au Québec.
Maquette de la page couverture et identité graphique du livre : Andrés Henao Florez.
Mise en page : Philippe Apparicio et Marie-Hélène Gadbois Del Carpio.
Révision linguistique : Denise Latreille.
© Philippe Apparicio, Jérémy Gelb, Jean Dubé et Joan Carles Martori.
Pour citer cet ouvrage : Apparicio Philippe, Jérémy Gelb, Jean Dubé et Joan Carles Martori (2025). Méthodes de régression spatiale : un grand bol d’R. Université Laval et Université de Sherbrooke. fabriqueREL. Licence CC BY-SA.
Préface
Un manuel sous la forme d’une ressource éducative libre
Pourquoi un manuel sous licence libre?
Les logiciels libres sont aujourd’hui très répandus. Comparativement aux logiciels propriétaires, l’accès au code source permet à quiconque de l’utiliser, de le modifier, de le dupliquer et de le partager. Le logiciel R, dans lequel sont mises en œuvre les méthodes de régression spatiale décrites dans ce livre, est d’ailleurs à la fois un langage de programmation et un logiciel libre (sous la licence publique générale GNU GPL2). Par analogie aux logiciels libres, il existe aussi des ressources éducatives libres (REL) « dont la licence accorde les permissions désignées par les 5R (Retenir — Réutiliser — Réviser — Remixer — Redistribuer) et donc permet nécessairement la modification » (fabriqueREL). La licence de ce livre, CC BY-SA (figure 1), permet donc de :
Retenir, c’est-à-dire télécharger et imprimer gratuitement le livre. Notez qu’il aurait été plutôt surprenant d’écrire un livre payant sur un logiciel libre et donc gratuit. Aussi, nous aurions été très embarrassés que des personnes étudiantes avec des ressources financières limitées doivent payer pour avoir accès au livre, sans pour autant savoir préalablement si le contenu est réellement adapté à leurs besoins.
Réutiliser, c’est-à-dire utiliser la totalité ou une section du livre sans limitation et sans compensation financière. Cela permet ainsi à d’autres personnes enseignantes de l’utiliser dans le cadre d’activités pédagogiques.
Réviser, c’est-à-dire modifier, adapter et traduire le contenu en fonction d’un besoin pédagogique précis puisqu’aucun manuel n’est parfait, tant s’en faut! Le livre a d’ailleurs été écrit intégralement dans R avec Quarto. Quiconque peut ainsi télécharger gratuitement le code source du livre sur github et le modifier à sa guise (voir l’encadré intitulé Suggestions d’adaptation du manuel).
Remixer, c’est-à-dire « combiner la ressource avec d’autres ressources dont la licence le permet aussi pour créer une nouvelle ressource intégrée » (fabriqueREL).
Redistribuer, c’est-à-dire distribuer, en totalité ou en partie le manuel ou une version révisée sur d’autres canaux que le site Web du livre (par exemple, sur le site Moodle de votre université ou en faire une version imprimée).
La licence de ce livre, CC BY-SA (figure 1), oblige donc à :
Attribuer la paternité de l’auteur dans vos versions dérivées, ainsi qu’une mention concernant les grandes modifications apportées, en utilisant la formulation suivante : Apparicio Philippe, Jérémy Gelb, Jean Dubé et Joan Carles Martori (2025). Méthodes de régression spatiale : un grand bol d’R. Université Laval et Université de Sherbrooke. fabriqueREL. Licence CC BY-SA.
Utiliser la même licence ou une licence similaire à toutes versions dérivées.

Suggestions d’adaptation du manuel
Pour chaque méthode d’analyse spatiale abordée dans le livre, une description détaillée et une mise en œuvre dans R sont disponibles. Par conséquent, plusieurs adaptations du manuel sont possibles :
Conserver uniquement les chapitres sur les méthodes ciblées dans votre cours.
En faire une version imprimée et la distribuer aux personnes étudiantes.
Modifier la description d’une ou de plusieurs méthodes en effectuant les mises à jour directement dans les chapitres.
Insérer ses propres jeux de données dans les sections intitulées Mise en œuvre dans R.
Modifier les tableaux et figures.
Ajouter une série d’exercices.
Modifier les quiz de révision.
Rédiger un nouveau chapitre.
Modifier des syntaxes R. Plusieurs packages R peuvent être utilisés pour mettre en œuvre telle ou telle méthode. Ces derniers évoluent aussi très vite et de nouveaux packages sont proposés fréquemment! Par conséquent, il peut être judicieux de modifier une syntaxe R du livre en fonction de ses habitudes de programmation dans R (utilisation d’autres packages que ceux utilisés dans le manuel par exemple) ou de bien mettre à jour une syntaxe à la suite de la parution d’un nouveau package plus performant ou intéressant.
Toute autre adaptation qui permet de répondre au mieux à un besoin pédagogique.
Comment lire ce manuel?
Le livre comprend plusieurs types de blocs de texte qui en facilitent la lecture.
Bloc packages
Habituellement localisé au début d’un chapitre, il comprend la liste des packages R utilisés pour un chapitre.
Bloc objectifs
Il comprend une description des objectifs d’un chapitre ou d’une section.
Bloc notes
Il comprend une information secondaire sur une notion, une idée abordée dans une section.
Bloc pour aller plus loin
Il comprend des références ou des extensions d’une méthode abordée dans une section.
Bloc astuce
Il décrit un élément qui vous facilitera la vie : une propriété statistique, un package, une fonction, une syntaxe R.
Bloc attention
Il comprend une notion ou un élément important à bien maîtriser.
Bloc exercice
Il comprend un court exercice de révision à la fin de chaque chapitre.
Comment utiliser les données du livre pour reproduire les exemples?
Ce livre comprend des exemples détaillés et appliqués dans R pour chacune des méthodes abordées. Ces exemples se basent sur des jeux de données structurés et mis à disposition avec le livre. Ils sont disponibles sur le repo github dans le sous-dossier data
, à l’adresse https://github.com/SerieBoldR/RegressionsSpatiales/tree/main/data.
Une autre option est de télécharger le repo complet du livre directement sur github (https://github.com/SerieBoldR/RegressionsSpatiales) en cliquant sur le bouton Code
, puis le bouton Download ZIP
(figure 2). Les données se trouvent alors dans le sous-dossier nommé data
.

Liste des packages utilisés
Dans ce livre, nous utilisons la version 4.4.0 de R avec de nombreux packages que vous pouvez installer avec le code ci-dessous.
Bref historique sur les modèles de régressions spatiales en économie et en géographie
Depuis une cinquantaine d’années, les économistes et les géographes conçoivent et utilisent largement des méthodes de régression prenant en compte la dimension spatiale : modèles d’économétrie spatiale, régressions géographiquement pondérées, modèles généralisés additifs intégrant une dimension spatiale, modèles avec des vecteurs propres spatiaux, etc.
La notion d’autocorrélation spatiale, étroitement liée aux régressions spatiales, remonte à une période encore plus ancienne. Elle a été introduite notamment par les travaux de Patrick Moran, d’abord en 1948 puis en 1950, suivis par ceux de Robert Geary en 1954 et de Nathan Mantel en 1967 (Moran 1948; Moran 1950; Geary 1954; Mantel 1967). La formalisation des relations spatiales trouve son origine, plus précisément, dans la première loi de la géographie énoncée par Waldo Tobler qui stipule que « tout interagit avec tout, mais les objets proches ont plus de chance de le faire que les objets éloignés [Everything is related to everything else, but near things are more related than distant things] » (Tobler 1970).
En économie, le terme « économétrie spatiale » a été utilisé pour la première fois par Jean Paelinck (1978) à la fin des années 1970. Cependant, il est resté relativement peu exploité jusqu’aux travaux de Luc Anselin, qui a publié en 1988 un ouvrage de référence sur le sujet intitulé Spatial econometrics: methods and models (Anselin 1988). Il faut néanmoins attendre le développement des outils informatiques avant de voir les applications affluer. Ainsi, au début des années 1990, l’économétrie spatiale a véritablement pris son essor (voir Anselin (2010) pour un historique détaillé). Depuis, ce domaine a gagné en importance, s’établissant presque comme un incontournable pour la prise en compte des effets spatiaux, mais aussi, et surtout, des fameux effets de débordement. Ces dernières décennies, plusieurs ouvrages traitant des modèles économétriques spatiaux ont été publiés, principalement en anglais (Anselin et Florax 1995; Anselin, Florax et Rey 2013; LeSage et Pace 2009; Bivand et al. 2008; Anselin et Rey 2014). Ils méritent grandement d’être consultés, particulièrement celui de LeSage et Pace (2009). Peu de références sont disponibles en français. Le livre de référence de Dubé et Legros (2014) constitue vraisemblablement une référence intéressante, notamment par la présentation vulgarisée des modèles et des concepts.
En géographie, Daniel Griffith est certainement l’un des géographes les plus actifs dans le domaine des régressions spatiales, ayant fait plusieurs propositions pour contrôler la présence d’autocorrélation spatiale résiduelle. Ses premiers travaux remontent aux années 1980, et il a publié depuis un grand nombre d’ouvrages (notamment, Griffith 1988; Griffith 2003; Griffith, Chun et Li 2019). Puis, dans les années 1990, trois géographes – Stewart Fotheringham, Chris Brunsdon et Martin Charlton – ont introduit la régression géographiquement pondérée (Geographically weighted regression - GWR), une méthode permettant d’analyser localement les relations entre la variable dépendante et les variables indépendantes d’un modèle de régression (Fotheringham, Charlton et Brunsdon 1996; Brunsdon, Fotheringham et Charlton 1996; Brunsdon, Fotheringham et Charlton 1998). En 2003, la parution de leur ouvrage intitulé Geographically weighted regression: the analysis of spatially varying relationships (Fotheringham, Brunsdon et Charlton 2003) a largement contribué à la popularisation de cette méthode. Depuis, de nombreuses extensions de la GWR ont été proposées.
Structure du livre
Le manuel est structuré en six parties.
Partie 1. Notions de base
Dans cette première partie, nous présentons les jeux de données utilisés pour mettre en œuvre les différentes méthodes de régression spatiale présentées dans le livre (chapitre 1 Autocorrélation spatiale, dépendance spatiale et hétérogénéité spatiale d’un modèle de régression). Nous discutons aussi de plusieurs notions fondamentales et méthodes qu’il importe de bien maîtriser avant d’aborder les chapitres suivants consacrés aux méthodes de régression spatiale, notamment l’autocorrélation spatiale, la notion de variable spatialement décalée et la régression linéaire multiple. Nous conclurons ce chapitre en exposant les raisons qui justifient l’utilisation de différentes formes de régressions spatiales pour modéliser des données spatiales ou spatiotemporelles.
Partie 2. Spécification de la structure de covariance spatiale
Dans cette seconde partie, les types de régression spatiale retenus introduisent l’espace en spécifiant directement la structure de covariance induite par l’autocorrélation spatiale dans les matrices de covariance de distribution normale (chapitre 2 Modèles intégrant une structure de covariance spatiale (en cours de rédaction)). La méthode des moindres carrés généralisés (GLS) permet d’étendre le modèle des moindres carrés ordinaires (MCO) pour tenir compte de cette structure de covariance entre les observations. Cette approche est similaire à l’introduction d’effets aléatoires, ce qui a notamment conduit à la construction de GLMM (modèles linéaires généralisés à effets mixtes) introduisant des effets aléatoires distribués normalement avec une matrice de covariance structurée spatialement. Finalement, nous décrirons le modèle d’autorégression conditionnelle (conditional autoregressive model, CAR) qui s’applique à une variable dépendante continue dont la valeur pour une entité spatiale dépend de celles des entités spatiales proches ou voisines.
Partie 3. Modèles d’économétrie spatiale
Cette troisième partie comprend trois chapitres qui sont consacrés aux modèles d’économétrie spatiale qui vise à modéliser la dépendance spatiale. D’emblée, nous décrivons les principaux modèles spatiaux autorégressifs pour une variable dépendante continue qui permettent d’introduire l’autocorrélation spatiale sur les variables indépendantes (modèle SLX), la variable dépendante (SAR), le terme d’erreur (SEM), à la fois la variable dépendante et les variables indépendantes (SDM) et à la fois les variables indépendantes et le terme d’erreur (SDEM) (chapitre 3 Modèles d’économétrie spatiale). Puis, nous abordons les modèles probit spatiaux pour modéliser une variable qualitative dichotomique (binaire) (chapitre 4 Modèles probit spatiaux pour une variable dépendante dichtonomique (en cours de rédaction)). Finalement, nous décrivons d’autres extensions des modèles autorégressifs, soit les modèles spatiaux en panel qui permettent de modéliser des données spatiales longitudinales (chapitre 5 Modèles d’économétrie spatiale en panel (en cours de rédaction)).
Partie 4. Variable latente spatiale : lissage et filtrage spatial
Dans cette troisième partie, les modèles retenus ont la particularité d’ajouter un terme spatialement structuré dans leur équation de régression. Ce terme spatial est construit à partir d’un ensemble de fonctions de base multipliées par des coefficients. Ces fonctions de base suivent des patrons géographiques, ce qui leur permet de capturer une variable latente spatialement autocorrélée qui autrement aurait fini dans les résidus. Le premier chapitre de cette partie est consacré aux modèles généralisés additifs (GAM) qui permettent d’introduire l’espace de deux manières différentes : avec une spline bivariée construite à partir des coordonnées géographiques (x, y) pour capturer les variations continues dans l’espace; avec un lissage par champ aléatoire de Markov (Markov Random Field – MRF) pour modéliser la dépendance spatiale entre les unités spatiales voisines (chapitre 6 Modèles généralisés additifs). Dans le second, nous abordons les modèles linéaires généralisés avec des vecteurs spatiaux (Spatial Eigenvector Generalized Linear Models, SEVM) (chapitre 7 Modèles linéaires généralisés avec des vecteurs spatiaux). Ces modèles SEVM ajoutent des variables construites à partir de la décomposition de la matrice de pondération spatiale en vecteurs propres (Moran Eigenvectors). Ces deux types de modèles (GAM et SEVM) se ressemblent énormément dans leur conceptualisation de l’espace.
Partie 5. Régressions spatiales et hétérogénéité spatiale
Dans cette cinquième partie, nous abordons plusieurs types de régression spatiale qui permettent de faire varier les coefficients de régression dans l’espace. Premièrement, les régressions géographiquement pondérées (Geographically weighted regression - GWR) permettent d’explorer et de visualiser l’hétérogénéité spatiale, soit l’instabilité des relations entre la variable dépendante et les variables indépendantes. Premièrement, nous décrirons les formes dites classiques de la GWR qui s’appliquent à des variables dépendantes continues, dichotomiques (logistique) et de comptage (Poisson) (chapitre 8 Régressions géographiquement pondérées classiques). Puis, nous abordons des extensions de la GWR, particulièrement la GWR mixte, la GWR multiéchelle et les GWR mixtes avec des variables spatialement décalées (MGWR-SAR) (chapitre 9 Extensions de la régression géographiquement pondérée (en cours de rédaction)). Finalement, nous verrons comment il est possible d’introduire des coefficients variant spatialement avec des modèles GAM (modèles généralisés additifs) et GLMM (modèles linéaires généralisés à effets mixtes) (chapitre 10 Modèles GAM et GLMM avec des coefficients variant spatialement (en cours de rédaction)).
Partie 6. Conclusions
Cette dernière partie regroupe les exercices corrigés (chapitre 11 Correction des exercices), une conclusion générale (chapitre 12 Conclusion générale (en cours de rédaction)) et la bibliographie.
Remerciements
De nombreuses personnes ont contribué à l’élaboration de ce manuel.
Ce projet a bénéficié du soutien pédagogique et financier de la fabriqueREL (ressources éducatives libres). Les différentes rencontres avec le comité de suivi nous ont permis de comprendre l’univers des ressources éducatives libres (REL) et notamment leurs fameux 5R (Retenir — Réutiliser — Réviser — Remixer — Redistribuer), de mieux définir le besoin pédagogique visé par ce manuel, d’identifier des ressources pédagogiques et des outils pertinents pour son élaboration. Ainsi, nous remercions chaleureusement les membres de la fabriqueREL pour leur soutien inconditionnel :
Marianne Demers-Desmarais, bibliothécaire, Université Laval.
Julie-Christine Gagné, conseillère en pédagogie universitaire, Université Laval.
Claude Potvin, conseiller pédagogique à la fabriqueREL, Université Laval.
Nadia Villeuneuve, bibliothécaire, Université Laval.
Nous remercions aussi les membres du comité de révision pour leurs commentaires et suggestions très constructifs. Ce comité est composé de plusieurs personnes étudiantes du Département de géomatique appliquée de l’Université de Sherbrooke et de l’École supérieure d’aménagement du territoire et de développement régional (ÉSAD) de l’Université de Laval.
Diego Andres Cardenas Morales, étudiant au doctorat en aménagement du territoire et développement régional.
Marie-Clara Delage, Victor Bibeau, Liam Messier et Jean-François Darveau, personnes étudiantes de troisième année au baccalauréat en géomatique appliquée à l’environnement.
Marie-Hélène Gadbois Del Carpio, étudiante à la maîtrise en géomatique appliquée et télédétection (type recherche). Elle a participé activement à la mise en page du manuel; elle est désormais une grande spécialiste des feuilles de style en cascade (CSS), de Quarto et LaTeX.
Finalement, nous remercions Denise Latreille, réviseuse linguistique et chargée de cours à l’Université Sherbrooke, pour la révision du manuel.