LogoLogo

Znaidi, Eya. Contribution à l'analyse et l'évaluation des requêtes expertes : cas du domaine médical

Znaidi, Eya (2016). Contribution à l'analyse et l'évaluation des requêtes expertes : cas du domaine médical.

[img]
Preview
PDF - nécessite un logiciel de visualisation PDF comme GSview, Xpdf or Adobe Acrobat Reader
2389Kb

Résumé en francais

La recherche d'information nécessite la mise en place de stratégies qui consistent à (1) cerner le besoin d'information ; (2) formuler le besoin d'information ; (3) repérer les sources pertinentes ; (4) identifier les outils à exploiter en fonction de ces sources ; (5) interroger les outils ; et (6) évaluer la qualité des résultats. Ce domaine n'a cessé d'évoluer pour présenter des techniques et des approches permettant de sélectionner à partir d'un corpus de documents l'information pertinente capable de satisfaire le besoin exprimé par l'utilisateur. De plus, dans le contexte applicatif du domaine de la RI biomédicale, les sources d'information hétérogènes sont en constante évolution, aussi bien du point de vue de la structure que du contenu. De même, les besoins en information peuvent être exprimés par des utilisateurs qui se caractérisent par différents profils, à savoir : les experts médicaux comme les praticiens, les cliniciens et les professionnels de santé, les utilisateurs néophytes (sans aucune expertise ou connaissance du domaine) comme les patients et leurs familles, etc. Plusieurs défis sont liés à la tâche de la RI biomédicale, à savoir : (1) la variation et la diversité du besoin en information, (2) différents types de connaissances médicales, (3) différences de compé- tences linguistiques entre experts et néophytes, (4) la quantité importante de la littérature médicale ; et (5) la nature de la tâche de RI médicale. Cela implique une difficulté d'accéder à l'information pertinente spécifique au contexte de la recherche, spécialement pour les experts du domaine qui les aideraient dans leur prise de décision médicale. Nos travaux de thèse s'inscrivent dans le domaine de la RI biomédicale et traitent les défis de la formulation du besoin en information experte et l'identification des sources pertinentes pour mieux répondre aux besoins cliniques. Concernant le volet de la formulation et l'analyse de requêtes expertes, nous proposons des analyses exploratoires sur des attributs de requêtes, que nous avons définis, formalisés et calculés, à savoir : (1) deux attributs de longueur en nombre de termes et en nombre de concepts, (2) deux facettes de spécificité terme-document et hiérarchique, (3) clarté de la requête basée sur la pertinence et celle basée sur le sujet de la requête. Nous avons proposé des études et analyses statistiques sur des collections issues de différentes campagnes d'évaluation médicales CLEF et TREC, afin de prendre en compte les différentes tâches de RI. Après les analyses descriptives, nous avons étudié d'une part, les corrélations par paires d'attributs de requêtes et les analyses de corrélation multidimensionnelle. Nous avons étudié l'impact de ces corrélations sur les performances de recherche d'autre part. Nous avons pu ainsi comparer et caractériser les différentes requêtes selon la tâche médicale d'une manière plus généralisable. Concernant le volet lié à l'accès à l'information, nous proposons des techniques d'appariement et d'expansion sémantiques de requêtes dans le cadre de la RI basée sur les preuves cliniques. En effet, les médecins ont appris à formuler leur requêtes selon les facettes PICO (Population/Problem (P), Intervention (I), Comparaison (C) et Outcome (O)). Ces facettes sont rarement annotées ou identifiées dans le texte des documents et des requêtes. Dans le but de mieux répondre aux questions cliniques PICO, nous avons proposé différentes ap- proches pour évaluer les questions cliniques expertes : (i) une représentation sémantique sous forme de graphes conceptuels des questions PICO, (ii) une approche d'expansion de requêtes basée sur un algorithme de propagation de scores pour sélectionner les meilleurs concepts ; et (iii) un modèle d'ordonnancement requête-document, basé sur une méthode d'agrégation prioritaire de scores de pertinence. Ainsi, nous avons contextualisé les scores d'importance des facettes aux documents et aux requêtes dans l'objectif d'améliorer la performance de recherche et de retourner des réponses pertinentes. Nous avons mené des évaluation expérimentales pour évaluer nos contributions dans la cadre de la recherche PICO. Nous avons utilisé pour cela la collection de données CLIREC, construite dans le but d'évaluer la RI clinique (Boudin et al., 2010c). Les résultats ont montré la performance des différentes approches proposées.

Sous la direction du :
Directeur de thèse
Tamine, Lynda
Latiri, Chiraz
Ecole doctorale:Mathématiques, informatique, télécommunications de Toulouse (MITT)
laboratoire/Unité de recherche :Institut de Recherche en Informatique de Toulouse (IRIT), UMR 5505
Mots-clés libres :Medical IR - Clinical queries - Statistical analysis - Priority agregation operator - PICO queries - Clinical evidence - Semantic representation - Query expansion
Sujets :Informatique
Déposé le :13 Dec 2016 17:53