1. Base de données timeseries
Les bases de données “séries temporelles” en anglais Timeseries représentent un type de base de données optimisé pour stocker, manipuler et interroger les données de séries temporelles par le biais de paires associées de temps et de valeurs.
Mais… Qu’est-ce qu’une série temporelle ?
1.1 Les données de séries temporelles
Elles sont une collection de métriques (régulières) ou de mesures (irrégulières) qui sont suivies dans le temps. Ces données, représentent des mesures ou événements qui sont suivis, contrôlés, sous-échantillonnés et agrégés au fil du temps, en d’autres termes la manière dont un système, un processus ou un comportement évolue dans le temps.
Une série temporelle indexe une série de points de données dans l’ordre chronologique, généralement sous la forme d’une séquence à intervalles réguliers. La température d’une maison au cours d’une journée constitue un cas de figure ou la valeur mesurée correspond à l’heure à laquelle la lecture de la valeur a eu lieu.
Les premières bases de données de séries temporelles étaient associées à des applications financières et des applications industrielles qui pouvaient stocker efficacement des valeurs mesurées à partir d’équipements sensoriels. De par leur évolution au fil des années, elles sont maintenant utilisées pour soutenir une gamme beaucoup plus large d’applications. Leur portée d’utilisation peut s’agir de mesures de serveur, de monitoring d’applications, de données réseau, de données capteurs, d’événements, de clics. Par ailleurs, elles sont utilisées dans les transactions sur un marché et de nombreux autres types de données analytiques et solutions axées sur des données changeant fréquemment. Comme l’indique leur nom, « séries temporelles », il s’agit de données qui évoluent dans le temps.
1.2. Pourquoi nous en parlons aujourd’hui ?
Aujourd’hui les données de séries temporelles sont omniprésentes et nous pouvons les trouver dans plusieurs applications et dans diverses industries et entreprises. Cette omniprésence est une conséquence de l’évolution de l’informatique et principalement de l’essor de l’internet des objets au fil des dernières années. Nous vivons entourés d’objets de plus en plus connectés et donc dotés d’un nombre croissant de capteurs. Semblerait-il même que les humains seront dotés de capteurs sous peu (ne nous dispersons pas 😅).
Dans ce contexte, il est devenu de plus en plus nécessaire de prendre en charge ce flux ininterrompu de données horodatées.
Bien qu’il soit possible de stocker des données de séries temporelles dans de nombreux types de bases de données, la conception de ces systèmes avec le temps comme index clé est nettement différente des bases de données relationnelles. Ces dernières réduisant les relations discrètes par le biais de modèles référentiels