L’intelligence artificielle développée pour modéliser le langage écrit peut être utilisée pour prédire des événements dans la vie des individus. Un projet de recherche de la DTU, de l’Université de Copenhague, de l’ITU et de l’Université Northeastern aux États-Unis montre que si vous utilisez de grandes quantités de données sur la vie des individus et que vous entraînez des modèles dits ‘transformers’, similaires à ceux utilisés pour traiter le langage (comme ChatGPT), ils peuvent systématiquement organiser les données et prédire ce qui se passera dans la vie d’une personne, voire estimer le moment de sa mort.
Dans un nouvel article scientifique intitulé ‘Utilisation de séquences d’événements de la vie pour prédire les vies humaines’, publié dans Nature Computational Science, les chercheurs ont analysé les données de santé et l’attachement au marché du travail de 6 millions de Danois dans un modèle appelé life2vec. Après que le modèle a été formé dans une phase initiale, c’est-à-dire qu’il a appris les motifs des données, il a été démontré qu’il surpassait d’autres réseaux neuronaux avancés et prédisait des résultats tels que la personnalité et le moment de la mort avec une grande précision.
“Nous avons utilisé le modèle pour aborder la question fondamentale : dans quelle mesure pouvons-nous prédire les événements de votre avenir en fonction des conditions et des événements de votre passé ? Scientifiquement, ce qui nous excite n’est pas tant la prédiction elle-même que les aspects des données qui permettent au modèle de fournir des réponses aussi précises”, déclare Sune Lehmann, professeur à la DTU et premier auteur de l’article.
Prédictions du moment de la mort
Les prédictions de Life2vec sont des réponses à des questions générales telles que : ‘décès dans les quatre prochaines années’ ? Lorsque les chercheurs analysent les réponses du modèle, les résultats sont cohérents avec les conclusions existantes dans les sciences sociales ; par exemple, toutes choses étant égales par ailleurs, les personnes occupant des postes de direction ou ayant de hauts revenus ont plus de chances de survivre, tandis que le fait d’être masculin, qualifié ou d’avoir un diagnostic mental est associé à un risque accru de décès. Life2vec code les données dans un grand système de vecteurs, une structure mathématique qui organise les différentes données. Le modèle décide où placer les données sur la date de naissance, la scolarité, l’éducation, le salaire, le logement et la santé.
“Ce qui est passionnant, c’est de considérer la vie humaine comme une longue séquence d’événements, similaire à la façon dont une phrase dans une langue est composée d’une série de mots. C’est généralement le type de tâche pour lequel les modèles transformers en intelligence artificielle sont utilisés, mais dans nos expériences, nous les utilisons pour analyser ce que nous appelons des séquences de vie, c’est-à-dire des événements qui se sont produits dans la vie humaine”, explique Sune Lehmann.
Suscitant des questions éthiques
Les chercheurs à l’origine de l’article soulignent que des questions éthiques entourent le modèle Life2vec, telles que la protection des données sensibles, la vie privée et le rôle des biais dans les données. Ces défis doivent être compris plus en profondeur avant que le modèle puisse être utilisé, par exemple, pour évaluer le risque de contracter une maladie ou d’autres événements de la vie évitables pour un individu.
“Le modèle ouvre des perspectives importantes, tant positives que négatives, pour discuter et l’aborder politiquement. Des technologies similaires pour prédire les événements de la vie et le comportement humain sont déjà utilisées aujourd’hui par des entreprises technologiques qui, par exemple, suivent notre comportement sur les réseaux sociaux, nous profilent de manière extrêmement précise et utilisent ces profils pour prédire notre comportement et nous influencer. Cette discussion doit faire partie du débat démocratique afin que nous réfléchissions à la direction que prend la technologie et si c’est un développement que nous souhaitons”, déclare Sune Lehmann.
Selon les chercheurs, la prochaine étape consisterait à incorporer d’autres types d’informations, telles que du texte et des images ou des informations sur nos connexions sociales. Cette utilisation des données ouvre une nouvelle interaction entre les sciences sociales et de la santé.
Traduit de cet article