Soutenance de thèse : Kirsley CHENNEN
Équipe : CSTB
Titre : Maladies rares et 'Big Data' : solutions bioinformatiques vers une analyse guidée par les connaissances. Applications aux ciliopathies
Résumé : Au cours de la dernière décennie, la recherche biomédicale et la pratique médicale ont été révolutionné par l'ère post-génomique et l'émergence des « Big Data » en biologie, qui s’est maintenant transformée en une science de données de manière intensive avec diverses approches à haut débit (génomique, protéomique, métabolomique, lipidomique ...). En conséquence, les données biologiques sont en expansion et croissent plus rapidement que notre capacité et efficacité à les compiler, les organiser et à les manipuler, limitant ainsi nos efforts pour extraire les connaissances biologiques sous-jacents et à fournir des indications en santé humaine.
Les défis associés à l'ère des « Big Data » sont souvent représentés par le paradigme des quatre Vs défini par Laney 20011 qui englobe: i) le Volume, pour l'énorme quantité de données générées, ii) la Vélocité, pour la fréquence à laquelle les données sont générées et mis à jour, iii) la Variété, pour la diversité des sources et des structures de données et iv) la Véracité, pour l'incertitude due à de l'incohérence et des données manquantes. Il y a aussi un cinquième V émergent, qui correspond à la Valeur, pour l'extraction de connaissances significatif. Dans la biomédecine, ce paradigme émergent suppose non seulement, une meilleure intégration des données et des informations au sein et entre la recherche et la médecine, mais aussi, la considération des ressources de calculs et humaines nécessaires pour extraire une connaissance pertinente.
Dans ce contexte biomédical renouvelé, l'étude des maladies rares a pris de l'ampleur car il semble que des analyses axées sur les sous-ensembles mono-géniques fournissent un contexte simplifié pour éclairer les maladies communes telles que l'obésité ou diabète2. Il y a environ 7000 maladies mono-géniques rares et affecte sur l’ensemble ~30 millions d’européens. L'origine génétique des maladies rares est établie pour 80% d'entre elles, et les gènes responsables ont été identifiés pour seulement 50% d’entre elles 3. Paradoxalement, à notre ère des « Big Data », le facteur le plus limitant, pour l'étude des maladies rares est la rareté des données liées au nombre limité de patients atteints par une maladie rare donné. Cela se traduit en une disponibilité dispersée et parcellaire des données génétiques et phénotypiques ainsi que des matériaux biologiques. En outre, il y a aussi un manque de ressources dédiées à la communauté biomédicale pour la collecte et la maintenance des données et des matériaux biologiques.
Dans ce contexte, ma thèse a été consacrée à l'élaboration de solutions bioinformatiques pour améliorer l’étude des maladies génétiques rares. Les objectifs étaient donc à développer: des ressources (I) dédié pour rester à jour avec le flux constant de données entrants et fournir un outil robuste pour la veille de la littérature scientifique et la fouille de textes des articles pertinents, par exemple ceux qui associée à des maladies mendéliennes rares (PubAthena), (II) une architecture unifiée pour l'analyse des données d'exomes pour améliorer le diagnostic moléculaire et l'identification de nouveaux gènes (VarScrut) et (iii) le développement d'un prototype de base de connaissances (CilioCarta) intégrant les outils développés dans un projet plus global dédié à l'étude des ciliopathies et des rétinopathies
Cette thèse a été dirigée par le Dr. Olivier Poch (ICube) et co-encadrée par le Pr. Hélène Dollfus du laboratoire de Génétique Médicale (U1112 INSERM).
La présentation aura lieu le vendredi 14 octobre 2016 à 14h00 dans l'amphithéâtre 301 au Forum de la Faculté de Médecine de Strasbourg.
Le dépôt des candidatures pour les postes d’enseignants-chercheur est ouvert. Les offres sont...
Le salon Pollutec est l'événement international de référence des solutions pour l'environnement...
Le salon Pollutec est l'événement international de référence des solutions pour l'environnement...
Haitao Ge, doctorant à l'INSA Strasbourg au sein de l'équipe Génie civil - énergétique (GCE) a...
Dans le cadre du projet Interreg Offensive Science 2PhaseEx, cinq membres de l’équipe ICube/Mécaflu...
Le 13 novembre, le CNRS a réuni les 26 start-up issues de ses laboratoires sous tutelle,...
L'équipe de l'Université de Strasbourg et la délégation Alsace du CNRS se sont brillamment...
Le vendredi 20 septembre a eu lieu la réunion de lancement du projet INTERREG 2PhaseEx, au...
Le projet ENERGETIC a lancé sa première vidéo promotionnelle illustrant les principaux objectifs et...
Paris 27 aout 2024 – ARCHOS annonce que POLADERME, filiale du Startup studio Medtech du groupe...
Les topographes de l’INSA Strasbourg exerçant leurs activités de recherche au sein de l’équipe...