Développement d’une plateforme de dommages multipéril
(1) Léa Boittin - Département R&D Modélisation, CCR
(2) Gilles Kieffer - FoxPlan
(3) Frédéric Drapeau - Département Data Science, Actuariat et Provisionnement, CCR
(4) Jean-Philippe Naulin - Département R&D Modélisation, CCR
(5) Damien Dronsart - Direction des Systèmes d’Information, CCR
(6) David Moncoulon - Département R&D Modélisation, CCR
INTRODUCTION
Pour estimer son exposition aux catastrophes naturelles, CCR a besoin de calculer les coûts occasionnés sur son portefeuille par plusieurs types de catastrophes. CCR a choisi de constituer au fil du temps son propre modèle de dommages, lui permettant ainsi de maîtriser l’ensemble des chaînes d’estimation des pertes consécutives à un événement et par là même de disposer d’un outil parfaitement adapté aux périls couverts par le régime Cat Nat en France.
Comme dans la plupart des modèles Cat commerciaux, le calcul des pertes assurantielles repose sur trois modules :
- un module d’aléa, dans lequel l’occurrence, la localisation et l’intensité du phénomène sont modélisées par des approches physiques (hydrologiques, sismologiques, etc.) ;
- un module de vulnérabilité, dans lequel on caractérise les risques (ou biens assurés) potentiellement exposés à l’aléa. Il s’agit de connaître la localisation des risques, leur type (résidentiel, professionnel, agricole), leur nature (maison, immeuble, appartement, etc.), leur usage (propriétaire occupant, propriétaire non-occupant, locataire, etc.) et leur valeur assurée ;
- un module de calcul des dommages, dans lequel on croise l’aléa aux données de vulnérabilité pour calculer le montant des pertes. Que l’on s’intéresse à un unique événement réel, ou à un événement issu d’un catalogue probabiliste, la méthode de calcul est la même. Classiquement, la méthode repose sur des courbes d’endommagement, choisies en fonction des caractéristiques des bâtiments exposés, qui font le lien entre l’intensité du phénomène physique et un taux d’endommagement. Les modèles CCR ont également la particularité d’utiliser des courbes de probabilité de survenance d’un sinistre et d’une reconnaissance de l’état de catastrophe naturelle.
En 2022, CCR a fait le choix de réécrire sa solution de calcul des dommages afin de disposer d’une plateforme plus performante, qui anticipe l’intégration de périls futurs et la prise en compte de périls conjoints. Ce nouveau code est en cours d’écriture dans le langage Matlab. La plateforme multipéril porte uniquement sur le troisième module, à savoir le calcul de dommages. À l’heure actuelle, elle concerne les périls inondation, sécheresse, séisme et submersion marine. À terme, elle intégrera de nouvelles fonctionnalités à savoir les dommages automobiles, les pertes d’exploitation, les pertes de récoltes agricoles.
MÉTHODOLOGIE
Un noyau de calcul robuste
Afin de proposer une plateforme la plus robuste possible, il est préférable de séparer au maximum les phases de lecture des données (par exemple données de portefeuille et d’aléa), de calcul des dommages proprement dit, et d’écriture des résultats. Le post-traitement des résultats est également séparé. L’idée est donc de disposer, pour chaque péril, d’une fonction de calcul des coûts qui associe un taux d’endommagement et une probabilité de sinistre à chaque risque. Ceux-ci sont définis par leur localisation, leur type, leur nature, leur usage et leurs valeurs assurées. Le travail de constitution d’un portefeuille dans lequel chaque risque est renseigné est réalisé en amont et n’est pas intégré au noyau de calcul. Par exemple, c’est en amont que l’on définit les coordonnées des risques dont on ne connait pas l’adresse exacte mais seulement la commune. De la même manière, c’est en amont que l’on associe à chaque risque une ou plusieurs valeurs représentant l’aléa. Ainsi, le noyau de calcul s’occupe uniquement du calcul du taux de destruction et de la probabilité de sinistre, indépendamment de la façon dont le portefeuille a été constitué.
Figure 1 – Principe de fonctionnement de la plateforme de dommages multipéril
Figure 2 – Possibilités de passage à l’échelle de la plateforme
Une industrialisation au service de la portabilité et de la mise à l’échelle
La portabilité du modèle s’inscrit dans un projet plus vaste d’industrialisation des activités de modélisation de CCR. La portabilité est essentielle pour faire tourner un modèle aussi bien en interne sur une machine puissante, sur un cluster sur site ou sur un cluster disponible dans le cloud. Cette dernière option offre des capacités de calcul infinies avec des fournisseurs de plateforme qui développent de façon standard une offre de calcul intensif HPC (High-performance computing) de très bonne facture. Cependant, avoir un modèle portable requiert un certain nombre de conditions préalables :
1) Avoir un code qui fonctionne sur des plateformes Linux car Linux est le standard de fait pour le calcul scientifique.
2) Rendre les modèles agnostiques de leur environnement technique par l’utilisation de paramétrage, qui permet par exemple de s’affranchir d’emplacements imposés pour les données. Il ne faut pas non plus être contraint par une technologie de stockage particulière.
3) Packager les données en entrée et sortie du modèle pour que ce dernier n’ait pas d’adhérence forte au système d’information de l’entreprise pendant le déroulement des calculs.
Les besoins en capacité de calcul pour la modélisation peuvent augmenter très ponctuellement et très fortement en réponse à un besoin urgent, comme la survenance d’un événement. Il est de plus en plus difficile pour les organisations de maintenir une capacité de calcul importante de façon permanente sans que cela représente des contraintes et des coûts conséquents. Il est vital pour les organisations de développer les modèles portables qui vont exploiter la capacité disponible dans le cloud de façon standard ou sous forme de débordement ponctuel. Une possibilité supplémentaire pour réduire les coûts est d’exploiter la capacité résiduelle d’un fournisseur, c’est-à-dire de faire tourner des calculs en fonction de la disponibilité des machines. Cela est très avantageux financièrement, mais nécessite de pouvoir arrêter et redémarrer un calcul de façon automatique. Avoir un modèle portable va permettre non seulement d’exploiter une capacité de calcul additionnelle importante mais également de réduire les coûts de façon inégalée.
# calcul des dommages
# industrialisation
# flexibilité
# robustesse
# portabilité
Lecture des données
La gestion des chemins par le modèle a fait l’objet d’une attention particulière. Dans la nouvelle version, le format des données est prescrit, mais pas leur emplacement. Il faut respecter un certain format pour le fichier définissant l’aléa, mais cet aléa peut être lu n’importe où. De même, si l’organisation des événements au sein d’un catalogue probabiliste est contrainte, l’emplacement du catalogue ne l’est pas. Néanmoins, pour des données telles que les courbes d’endommagement, il existe des fichiers lus par défaut, mais un utilisateur peut très facilement indiquer au code de lire un autre fichier pour procéder à un test. Ceci permet potentiellement de tester facilement n’importe quel aléa ainsi que de modifier certains réglages du modèle. Enfin, il est possible de lire des données de portefeuille à partir d’une base de données ou à partir de fichiers.
Traitement des résultats et traçabilité
Les résultats sont sauvegardés à l’échelle de la commune et par type de risque, nature, usage. Ceci permet ensuite de réaliser plusieurs post-traitements selon les choix de l’utilisateur : agrégation à l’échelle globale de l’événement, à l’échelle du département, affichage par type de risque, nature, usage à ces échelles, calcul de la distribution complète des coûts. Ces traitements peuvent être effectués immédiatement après le calcul des dommages, ou ultérieurement. Cette séparation du post-traitement des résultats du reste du code et la sauvegarde des résultats à une échelle fine répondent à une exigence de traçabilité des résultats. Pour une meilleure traçabilité, un système de fichiers de paramètres permet de conserver une description des paramètres utilisés pour réaliser une simulation. Pour des études très particulières et notamment dans le cas de cédantes assurant d’importants risques industriels, il reste possible de sauvegarder les résultats à l’échelle de la police.
Anticipation de périls futurs
Actuellement, pour les périls couverts par le régime Cat Nat, l’entité élémentaire est la police assurée et on a un modèle de dommages linéaire utilisant le taux d’endommagement et la fréquence de sinistres. Pour des périls différents, hors régime Cat Nat, on peut imaginer qu’il faudra calculer des dommages pour des entités différentes via des méthodes sans taux d’endommagement. C’est le cas par exemple des parcelles agricoles, dont il faut prendre en compte le caractère surfacique lorsqu’on calcule des pertes de récoltes. Le design de la nouvelle plateforme de dommages anticipe l’ajout futur de périls potentiellement très différents de ceux actuellement traités.
LES PARTENAIRES
FoxPlan est une société de conseil qui accompagne le pilotage des projets d’entreprise. FoxPlan accompagne CCR dans son projet d’industrialisation des activités de modélisation.
CONCLUSION
Le projet actuel de plateforme multipéril de calcul des dommages répond à plusieurs exigences formulées par CCR : pouvoir calculer les dommages assurantiels de plusieurs types de catastrophes, de façon robuste, traçable, en anticipant l’ajout futur d’autres périls. Aujourd’hui, l’estimation des dommages s’appuie sur des scripts essentiellement lancés en interne et les services de modélisation (pour un assureur par exemple) doivent être réalisés par le personnel de CCR. L’objectif est de développer d’une part, en 2023, une interface ergonomique exclusivement centrée sur la plateforme de dommages multipérils et d’autre part, à partir de 2024, permettre d’accéder à cette plateforme directement via une technologie de type API ou à l’aide de conteneurs. Ainsi, à terme cela permettrait de déployer des services de modélisation à des utilisateurs externes./
CITATION
Boittin et al., Développement d’une plateforme de dommages multipéril. In Rapport Scientifique CCR 2022 ; CCR, Paris, France, 2022, pp. 14-17