Introduction aux séries temporelles interrompues

Les séries temporelles interrompues (ITS) permettent d’évaluer l’effet d’une intervention à partir de données observationnelles. Cet article présente le principe, le modèle, les coefficients et les conditions d’utilisation de cette méthode, illustrée par des exemples en santé.
Auteur·rice

Antoine Lamer

Date de publication

21 février 2026

Mots clés

Séries temporelles interrompues, Interrupted time series, ITS, Évaluation, Épidémiologie, Causalité

Introduction

En santé publique et en épidémiologie, on souhaite souvent savoir si une intervention — une politique de santé, un changement de réglementation, une recommandation clinique — a eu un effet mesurable sur un indicateur de santé. L’essai contrôlé randomisé reste la référence pour établir un lien causal, mais dans de nombreuses situations, la randomisation est impossible. Comment randomiser l’effet d’un confinement national ? D’un changement de politique de remboursement ? D’une catastrophe naturelle ?

Les séries temporelles interrompues (Interrupted Time Series, ITS) offrent une approche quasi-expérimentale adaptée à ces contextes. Le principe est simple : on observe un indicateur au cours du temps, avant et après une interruption, et on compare la trajectoire observée à celle qu’on aurait attendue sans intervention. Ce design est considéré comme l’un des plus robustes parmi les méthodes non randomisées pour évaluer l’effet d’interventions populationnelles1.

Cet article présente les fondements de l’ITS : le principe du contrefactuel, le modèle statistique, l’interprétation des coefficients, et les conditions d’utilisation.

Le principe : comparer dans le temps

Le contrefactuel

Dans un essai randomisé, on compare un groupe traité à un groupe contrôle. Dans une ITS, la comparaison se fait dans le temps : on compare ce qui s’est passé après l’intervention à ce qui se serait passé si l’intervention n’avait pas eu lieu.

Cette trajectoire hypothétique est le contrefactuel (counterfactual). Il est construit en prolongeant la tendance observée avant l’intervention. L’écart entre la trajectoire observée et le contrefactuel constitue l’estimation de l’effet de l’intervention.

Figure 1: Le contrefactuel (pointillés) prolonge la tendance pré-intervention. L’écart avec la tendance ajustée (trait plein) représente l’effet estimé de l’intervention.

Conceptuellement, le contrefactuel en ITS est analogue au groupe contrôle d’un essai randomisé : c’est la référence contre laquelle l’effet est mesuré2.

Un design quasi-expérimental

L’ITS est classée parmi les designs quasi-expérimentaux : elle permet d’approcher l’inférence causale sans randomisation, à condition que certaines hypothèses soient remplies3. Elle est particulièrement adaptée à l’évaluation d’interventions populationnelles qui s’appliquent à un moment précis, à l’échelle d’une région, d’un pays, ou d’un système de soins.

Quand utiliser une ITS ?

Conditions d’utilisation

Un design ITS est approprié lorsque les conditions suivantes sont réunies :

  • La date de l’intervention est connue. On doit pouvoir définir a priori le moment où l’intervention a été mise en place. Une mise en œuvre progressive peut être modélisée, mais elle doit être explicitement définie.

  • L’outcome est mesuré de manière répétée. L’indicateur (taux, nombre d’événements, proportion, moyenne) doit être disponible à intervalles réguliers, avant et après l’intervention.

  • Un nombre suffisant de points temporels est disponible. Il n’existe pas de seuil strict, mais la puissance statistique dépend fortement du nombre total de points, de leur répartition avant et après l’intervention, de la variabilité de la série et de la présence d’autocorrélation. Les séries courtes (< 12 points) doivent être interprétées avec prudence1.

Hypothèses clés

L’inférence causale en ITS repose sur plusieurs hypothèses2 :

  • Pas d’autre intervention concomitante affectant l’outcome au moment de l’interruption.
  • Stabilité de la relation temps-outcome en l’absence d’intervention (la tendance pré-intervention se serait poursuivie).
  • Pas de changement majeur dans la population étudiée ou dans les modalités de mesure de l’outcome.

Si ces hypothèses ne sont pas respectées, l’effet estimé peut être confondu avec d’autres facteurs.

Exemples d’application en santé

L’ITS est largement utilisée dans la littérature en santé4. Parmi les applications typiques :

  • Politique de remboursement : évaluer l’effet d’un déremboursement de médicament sur les volumes de prescription1.
  • Crise sanitaire : mesurer l’impact du confinement COVID-19 sur la consommation de psychotropes chez les jeunes5.
  • Recommandation clinique : évaluer l’adoption d’un nouveau protocole de soins sur un indicateur de qualité6.
  • Catastrophe ou événement exogène : mesurer l’effet d’un tremblement de terre ou d’une crise économique sur un indicateur de santé.

Le modèle

La régression linéaire segmentée

Le modèle ITS le plus courant est la régression linéaire segmentée (segmented regression). La série temporelle est divisée en deux segments — avant et après l’intervention — et on estime une droite dans chaque segment.

Le modèle complet s’écrit :

\[Y_t = \beta_0 + \beta_1 \times time_t + \beta_2 \times intervention_t + \beta_3 \times time\_since\_intervention_t + \epsilon_t\]

ou, pour un modèle de comptage avec lien log (Poisson) :

\[\log(E[Y_t]) = \beta_0 + \beta_1 \times time_t + \beta_2 \times intervention_t + \beta_3 \times time\_since\_intervention_t\]

Les variables

Chaque variable du modèle a un rôle précis :

Variable Définition Valeurs
\(time\) Indice temporel 1, 2, 3, …, \(n\)
\(intervention\) Indicatrice de la période post-intervention 0 avant, 1 après
\(time\_since\_intervention\) Temps écoulé depuis l’intervention 0 avant, 0, 1, 2, … après

Attention : la variable \(time\_since\_intervention\) doit compter le temps écoulé depuis l’intervention, et non depuis le début de la série. Elle vaut donc 0 (et non 1) au premier point post-intervention. Utiliser à tort le produit \(time \times intervention\) au lieu de \(time\_since\_intervention\) conduit à un biais sur l’estimation de \(\beta_2\)7.

Pour une série de 60 mois avec une intervention au mois 37, les variables sont construites ainsi :

Mois \(time\) \(intervention\) \(time\_since\)
1 1 0 0
2 2 0 0
0 0
36 36 0 0
37 37 1 0
38 38 1 1
1
60 60 1 23

Les coefficients

Chaque coefficient capture un aspect de l’effet :

Coefficient Interprétation
\(\beta_0\) Niveau initial — valeur de l’outcome au début de la série (\(time = 0\))
\(\beta_1\) Tendance pré-intervention — variation de l’outcome par unité de temps avant l’intervention
\(\beta_2\) Changement de niveau — saut immédiat de l’outcome au moment de l’intervention
\(\beta_3\) Changement de tendance — modification de la pente après l’intervention, par rapport à la tendance pré-intervention

La tendance post-intervention est donnée par \(\beta_1 + \beta_3\). Si \(\beta_3\) est négatif, la pente diminue après l’intervention ; s’il est positif, elle augmente.

Les types d’impact

L’effet d’une intervention peut prendre différentes formes. Ces formes doivent être hypothésées a priori, et non choisies a posteriori sur la base des résultats2.

Changement de niveau seul

L’intervention provoque un saut immédiat, mais la pente reste identique. On inclut \(\beta_2\) et on fixe \(\beta_3 = 0\).

Exemple : un changement brutal du prix d’un médicament provoque une chute immédiate des ventes, mais la tendance de fond (croissance ou décroissance) n’est pas modifiée.

Figure 2: Changement de niveau seul : l’intervention provoque un saut immédiat (β₂), mais la pente reste identique (β₃ = 0).

Changement de tendance seul

L’intervention modifie progressivement la trajectoire, sans effet immédiat. On inclut \(\beta_3\) et on fixe \(\beta_2 = 0\).

Exemple : un programme de formation des prescripteurs modifie graduellement les habitudes, sans effet du jour au lendemain.

Figure 3: Changement de tendance seul : pas de saut immédiat (β₂ = 0), mais la pente se modifie progressivement après l’intervention (β₃ ≠ 0).

Changement de niveau et de tendance

C’est le cas le plus courant. L’intervention provoque à la fois un saut immédiat et une modification de la pente.

Exemple : le confinement COVID-19 a provoqué une hausse immédiate du nombre de consommateurs de psychotropes chez les jeunes adultes, suivie d’une augmentation soutenue dans les mois et années suivantes5.

Figure 4: Changement de niveau et de tendance : l’intervention provoque un saut immédiat (β₂) et une modification de la pente (β₃).

Formes plus complexes

Des designs plus élaborés permettent de modéliser :

  • Un effet retardé (lag) : l’intervention met du temps à produire un effet. On décale le point d’interruption de quelques périodes. Ce choix doit être justifié a priori par des considérations cliniques ou organisationnelles.
  • Un effet temporaire : l’outcome revient à son niveau initial après une perturbation transitoire.
  • Plusieurs interruptions : un design à trois segments ou plus, par exemple pour distinguer une période de crise (comme la pandémie de COVID-19) d’une période post-crise.

Spécifier le modèle : quels termes inclure ?

Par défaut, inclure le modèle complet

Il est recommandé d’inclure à la fois \(\beta_2\) (changement de niveau) et \(\beta_3\) (changement de tendance) et de rapporter les deux coefficients, même s’ils sont non significatifs1.

Les raisons sont les suivantes :

  1. \(\beta_2\) et \(\beta_3\) sont corrélés. En retirant l’un, l’autre absorbe une partie de l’effet, ce qui biaise son estimation.
  2. Non significatif ne signifie pas nul. Un \(\beta_2\) non significatif peut simplement refléter un manque de puissance.
  3. Le coût de conserver un terme non significatif est minime : on perd un degré de liberté, ce qui est négligeable avec des séries de taille raisonnable.

Ne simplifier que sur la base d’hypothèses a priori

Si des considérations théoriques ou cliniques permettent d’anticiper la forme de l’effet, la spécification peut être simplifiée avant l’analyse :

Hypothèse a priori Spécification Exemple
Effet uniquement immédiat Omettre \(\beta_3\) Changement de prix brutal
Effet uniquement progressif Omettre \(\beta_2\) Programme de formation à effet graduel
Effet mixte (cas général) Modèle complet Nouvelle réglementation

Le choix doit être fait avant d’examiner les résultats et justifié dans la section méthodes. Retirer un terme parce qu’il n’est pas significatif dans le modèle complet relève de la sélection de modèle basée sur les p-values (specification searching), ce qui gonfle le risque de faux positifs2.

Considérations pratiques

Granularité temporelle

Le choix de la granularité (jour, semaine, mois, trimestre) influence la capacité à détecter un effet. Une agrégation trop large peut masquer des effets immédiats, tandis qu’une granularité trop fine peut accentuer le bruit et l’autocorrélation. Ce choix doit être guidé par la fréquence attendue de l’outcome et la temporalité de l’intervention.

Autocorrélation

Dans une série temporelle, les observations successives sont souvent corrélées entre elles : une valeur élevée à un instant donné tend à être suivie d’une valeur élevée à l’instant suivant. Cette autocorrélation viole l’hypothèse d’indépendance des résidus et peut conduire à des erreurs standards sous-estimées et des intervalles de confiance trop étroits.

Plusieurs approches permettent de corriger l’autocorrélation : les erreurs robustes de Newey-West, la méthode de Prais-Winsten, ou les modèles ARIMA. Nous y reviendrons dans un prochain article.

Saisonnalité

De nombreux indicateurs de santé présentent des variations saisonnières (hospitalisations, prescriptions, suicides). Si elle n’est pas prise en compte, la saisonnalité peut mimer un effet d’intervention ou masquer un effet réel. Elle peut être modélisée par des variables indicatrices (mois, trimestre) ou des termes sinusoïdaux (Fourier).

Le groupe contrôle

L’ajout d’un groupe contrôle (controlled ITS) renforce considérablement l’inférence causale. On compare l’évolution de l’outcome dans le groupe exposé à celle d’un groupe non exposé, soumis aux mêmes tendances temporelles générales8.

Le groupe contrôle peut être :

  • un territoire non exposé à l’intervention,
  • un groupe de population non concerné (tranche d’âge, catégorie non ciblée),
  • un outcome de contrôle, supposé insensible à l’intervention.

Le choix doit être justifié a priori, et la comparabilité des tendances pré-intervention doit être vérifiée.

Présentation des résultats

Les recommandations de la littérature insistent sur plusieurs points9 10 :

  • Rapporter les quatre coefficients (\(\beta_0\), \(\beta_1\), \(\beta_2\), \(\beta_3\)) avec leurs intervalles de confiance.
  • Distinguer les effets absolus et relatifs : un changement de niveau de 50 consultations par mois n’a pas la même signification selon que la base est de 100 ou de 10 000.
  • Représenter graphiquement la série observée, les tendances ajustées et le contrefactuel.

Pour les graphiques, Turner et al.10 recommandent de :

  • tracer les points de données sans les relier,
  • marquer la date d’interruption par une ligne verticale,
  • utiliser des lignes pleines pour les tendances ajustées,
  • utiliser un style différent (pointillés) pour le contrefactuel,
  • utiliser des couleurs accessibles.

Conclusion

Les séries temporelles interrompues constituent un outil précieux pour évaluer l’impact d’interventions en santé, en particulier lorsque la randomisation est impossible. Leur force réside dans leur simplicité conceptuelle — la comparaison d’une trajectoire observée à un contrefactuel — et dans la richesse des informations qu’elles fournissent : effet immédiat, effet progressif, tendances avant et après.

Cette simplicité apparente ne doit cependant pas masquer les enjeux méthodologiques : autocorrélation, saisonnalité, choix de la granularité temporelle, sensibilité au choix de la période pré-intervention. Ces aspects feront l’objet d’articles dédiés.

Références

1.
Wagner AK, Soumerai SB, Zhang F, Ross-Degnan D. Segmented regression analysis of interrupted time series studies in medication use research. Journal of Clinical Pharmacy and Therapeutics. 2002;27(4):299‑309.
2.
Bernal JL, Cummins S, Gasparrini A. Interrupted time series regression for the evaluation of public health interventions: a tutorial. International Journal of Epidemiology. 2017;46(1):348‑55.
3.
Kontopantelis E, Doran T, Springate DA, Buchan I, Reeves D. Regression based quasi-experimental approach when randomisation is not an option: interrupted time series analysis. BMJ. 2015;350:h2750.
4.
Jandoc R, Burden AM, Mamdani M, Lévesque LE, Cadarette SM. Interrupted time series analysis in drug utilization research is increasing: systematic review and recommendations. Journal of Clinical Epidemiology. 2015;68(8):950‑6.
5.
Lamer A, Saint-Dizier C, Levaillant M, Hamel-Broza JF, Ayed E, Chazard E, et al. Prolonged increase in psychotropic drug use among young women following the COVID-19 pandemic: a French nationwide retrospective study. BMC medicine. juill 2024;22(1):274.
6.
Penfold RB, Zhang F. Use of interrupted time series analysis in evaluating health care quality improvements. Academic Medicine. 2013;88(11):1659‑65.
7.
Xiao H, Augusto O, Wagenaar BH. Reflection on modern methods: a common error in the segmented regression parameterization of interrupted time-series analyses. International Journal of Epidemiology. 2021;50(3):1011‑5.
8.
Lopez Bernal J, Cummins S, Gasparrini A. The use of controls in interrupted time series studies of public health interventions. International Journal of Epidemiology. 2018;47(6):2082‑93.
9.
Hategeka C, Ruton H, Karamouzian M, Kirgwagaire T, Law MR. Achieving high external validity in enhanced observational studies using interrupted time series analysis with multiple populations: a worked example and guidance. Journal of Clinical Epidemiology. 2020;73:93‑100.
10.
Turner SL, Karahalios A, Forbes AB, Taljaard M, Grimshaw JM, Cheng AC, et al. Creating effective interrupted time series graphs: Review and recommendations. Research Synthesis Methods. 2020;7(3):83‑98.