François PETITJEAN, chercheur à l'Université Monash, en collaboration avec les professeurs G. Webb et A. Nicholson, fera une présentation de ses travaux de recherche le jeudi 26 juin 2014 à 10h00 dans l'amphithéâtre A207 au Pôle API d’Illkirch.
Titre : Extraction de corrélations de variables dans des données à très haute dimension
Résumé : Nous sommes devenus extrêmement bons à construire des modèles de classification à partir des données. Cependant, nos modèles pour comprendre le pourquoi de nos prédictions ont été moins développés. Si nous voulons apporter des réponses informées à nos domaines d'applications dont les problèmes ne cessent de se complexifier, il est crucial de mieux traiter la question du "pourquoi".
L'analyse log-linéaire permet de construire automatiquement un modèle de données catégorielles. Cette méthode est inclue dans tous les logiciels majeurs d'analyse de données (SPSS, SAS, R), pour la bonne raison qu'elle est la méthode statistique permettant de répondre à des questions du type : "Est-ce qu'avoir une crise cardiaque est indépendant du niveau de cholestérol étant donné la prise de médicaments pour la régulation du cholestérol ?"
Le problème est que l'analyse log-linéaire ne fonctionne que si votre jeu de données a moins de 10 variables, et c'est là que la découverte que je présenterai entre en scène. Je montrerai comment l'analyse log-linéaire peut passer à l'échelle de jeux de données à centaines de variables, sans faire aucun sacrifice quant à sa validité statistique. En bref, la réponse combine graphes chordaux et structures de données empruntées à la découvertes de motifs fréquents.
Bio : Dr Francois Petitjean est un data miner dont les thématiques de recherche recoupent la construction de modèles utiles pour la compréhension du big data. Après avoir obtenu sa thèse (financement CNES) pour laquelle il a reçu le prix de thèse de l’Université de Strasbourg ainsi que le prix de thèse EGC, il a rejoint l'équipe du Professeur Geoff Webb au "Centre for Data Science" à Monash University, Melbourne.
Le dépôt des candidatures pour les postes d’enseignants-chercheur est ouvert. Les offres sont...
Le salon Pollutec est l'événement international de référence des solutions pour l'environnement...
Le salon Pollutec est l'événement international de référence des solutions pour l'environnement...
Haitao Ge, doctorant à l'INSA Strasbourg au sein de l'équipe Génie civil - énergétique (GCE) a...
Dans le cadre du projet Interreg Offensive Science 2PhaseEx, cinq membres de l’équipe ICube/Mécaflu...
Le 13 novembre, le CNRS a réuni les 26 start-up issues de ses laboratoires sous tutelle,...
L'équipe de l'Université de Strasbourg et la délégation Alsace du CNRS se sont brillamment...
Le vendredi 20 septembre a eu lieu la réunion de lancement du projet INTERREG 2PhaseEx, au...
Le projet ENERGETIC a lancé sa première vidéo promotionnelle illustrant les principaux objectifs et...
Paris 27 aout 2024 – ARCHOS annonce que POLADERME, filiale du Startup studio Medtech du groupe...
Les topographes de l’INSA Strasbourg exerçant leurs activités de recherche au sein de l’équipe...