Des étudiants canadiens aident la NASA à trouver des glissements de terrain
Un groupe d’étudiants canadiens utilise un site de médias sociaux populaire pour aider à recueillir des informations pour une grande agence spatiale.
Badr Jaidi, étudiant diplômé de l’Université de Colombie-Britannique, et son équipe, le groupe Social Landslides, ont entraîné des ordinateurs à « lire » Reddit pour aider une base de données de la NASA.
Les ordinateurs améliorent les prévisions du moment et du lieu où se produisent les glissements de terrain en traitant les articles d’actualité sur les catastrophes naturelles et en alimentant la base de données publique, le Cooperative Open Online Repository (COOLR).
Jaidi et l’équipe terminent leur maîtrise en science des données à l’UBC.
« Lorsque nous savons où les glissements de terrain sont le plus susceptibles de se produire, il y a certaines mesures préventives qui peuvent être mises en œuvre pour éviter ce genre de dommages », a déclaré Jaidi dans une interview avec actualitescanada Vancouver. « Donc, plus nous comprenons les glissements de terrain, plus ces mesures peuvent être mises en œuvre ».
Avant l’invention, les gens devaient soumettre manuellement des informations sur les glissements de terrain en cherchant dans les articles de presse. Maintenant, l’outil automatise le processus, en effectuant la recherche et la soumission en quelques minutes.
L’outil recherche sur Reddit les articles d’actualité dans une période donnée et en extrait les informations pertinentes. Pour éliminer les informations inutiles, l’ordinateur peut dire si le mot « landslide » est utilisé dans un contexte différent, comme lorsque quelqu’un gagne « by a landslide ».
L’équipe a entraîné l’ordinateur à traiter le langage naturel des données relatives aux glissements de terrain afin qu’il puisse reconnaître les informations pertinentes.
« Nous lui donnions un article de presse et lui demandions où un glissement de terrain avait pu se produire », explique Jaidi dans un post. « Le modèle prédit la réponse en fonction du langage utilisé, par exemple, ‘Le glissement de terrain s’est probablement produit ici, selon cette phrase’, et nous lui faisons savoir si c’est correct ou non. »
L’ordinateur apprend les informations nécessaires, comme la date et le lieu du glissement de terrain, sa cause et le nombre de victimes.
Selon le groupe, le système peut retourner un mois d’articles en 15 minutes environ et peut être introduit dans COOLR.
L’Organisation mondiale de la santé affirme que les glissements de terrain sont plus répandus que tout autre événement géologique. Les terres au relief escarpé précédemment brûlées par des incendies de forêt et les canaux le long des cours d’eau sont les plus susceptibles de subir des glissements de terrain.
L’équipe a utilisé Reddit car le site est libre d’accès et présente moins de restrictions. Les étudiants sont convaincus que la technologie pourrait être étendue à des plateformes plus importantes et utilisée pour d’autres catastrophes naturelles.
Il a fallu deux mois aux étudiants pour mener à bien le projet.