Search & Find
DiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporamaDiaporama
Accueil
ICube   >   Agenda : Séminaire : Extraction de corrélations de variables dans des données à très haute dimension

Séminaire : Extraction de corrélations de variables dans des données à très haute dimension

Le 26 juin 2014
À 14h00
Illkirch - Pôle API - A207

François PETITJEAN, chercheur à l'Université Monash, en collaboration avec les professeurs G. Webb et A. Nicholson,  fera une présentation de ses travaux de recherche le jeudi 26 juin 2014 à 10h00 dans l'amphithéâtre A207 au Pôle API d’Illkirch.

Titre : Extraction de corrélations de variables dans des données à très haute dimension

Résumé : Nous sommes devenus extrêmement bons à construire des modèles de classification à partir des données. Cependant, nos modèles pour comprendre le pourquoi de nos prédictions ont été moins développés. Si nous voulons apporter des réponses informées à nos domaines d'applications dont les problèmes ne cessent de se  complexifier, il est crucial de mieux traiter la question du "pourquoi".
L'analyse log-linéaire permet de construire automatiquement un modèle de données catégorielles. Cette méthode est inclue dans tous les logiciels majeurs d'analyse de données (SPSS, SAS, R), pour la bonne raison qu'elle est la méthode statistique permettant de répondre à des questions du type : "Est-ce qu'avoir une crise cardiaque est indépendant du niveau de cholestérol étant donné la prise de médicaments pour la régulation du cholestérol ?"
Le problème est que l'analyse log-linéaire ne fonctionne que si votre jeu de données a moins de 10 variables, et c'est là que la découverte que je présenterai entre en scène. Je montrerai comment l'analyse log-linéaire peut passer à l'échelle de jeux de données à centaines de variables, sans faire aucun sacrifice quant à sa validité statistique. En bref, la réponse combine graphes chordaux et structures de données empruntées à la découvertes de motifs fréquents.

Bio : Dr Francois Petitjean est un data miner dont les thématiques de recherche recoupent la construction de modèles utiles pour la compréhension du big data. Après avoir  obtenu sa thèse (financement CNES) pour laquelle il a reçu le prix de thèse de l’Université de Strasbourg ainsi que le prix de thèse EGC, il a rejoint l'équipe du Professeur Geoff Webb au "Centre for Data Science" à Monash University, Melbourne.

À la une

Le dépôt des candidatures pour les postes d’enseignants-chercheur est ouvert. Les offres sont...

Flux RSS

Flux RSS