sfds.jpg sfc.jpg egc.jpg lc-upd.jpg

WORKSHOP DATA SCIENCE’2020

University Paris-Dauphine, January 23-24, 2020

Les données massives et complexes prennent une part grandissante dans le fonctionnement de l’activité humaine. Les organiser et leur donner un sens pour en extraire des connaissances est l’objectif du DATA SCIENCE. Dans ce séminaire on s’intéresse à des objets décrits par des classes d’unités statistiques différentes par exemple en Statistique Officielle, des régions décrites par des variables caractéristiques des hôpitaux, des écoles, des habitants ou dans l’industrie, des tours de centrales nucléaires décrites par des variables de fissures, de corrosions, de positionnement etc. Dans ces cas, le fameux x ∈ ℝn ne s’applique pas car les variables ne sont pas définies sur les mêmes unités statistiques. Pour décrire la variabilité interne de telles classes on utilise des données agrégées sous formes de « symboles » explicatifs (intervalles, distributions, listes, etc.) car la description par des variables classiques (uniquement à valeur numérique ou qualitative) ne permet pas d’incorporer cette variabilité. L’Analyse des Données Symbolique (ADS) a pour objectif d’étendre les outils de la Statistique et de l’IA considérée au sens large (Rapport Villani) à ce nouveau type de données et connait un succès croissant dans le monde.

Des conférenciers invités présenteront les méthodes « Piecewise » qui transfoment en classes les modèles habituels en les rendant ainsi plus efficaces (S. Bougeard), le calcul de la vraisemblance de symboles et l’application à l’estimation standard dans le cas de données massives et complexes (S. Sisson), le co-clustering étendu aux données symboliques (R. Verde), la modélisation des objets complexes par Dirichlet avec contraintes (R. Emilion), l’ordonnancement (ranking) d’objets complexes et de variables symboliques appliqué à l’étude des causes de mortalité dans les pays européens (S. Korenjak Černe), l’application en géostatistique (krigeage) (A. Menafoglio), aux données économiques (impactes de la retraite sur la santé) (A. Srakar) , l’extension du tf idf, du LDA (Latente Dirichlet Allocation) aux données symboliques (E. Diday), etc.

Appel à communications: Des avancées dans ce contexte ou des problèmes ouverts posés par des laboratoires ou des industriels sont les bienvenus. Résumé avec références en une page Word à faire parvenir avant le 30/12/2019 à diday8@gmail.com avec pour objet DATA SCIENCE 2020.

Inscription: diday8@gmail.com avec pour objet : INSCRIPTION DATA SCIENCE 2020 en précisant le nom du participant, institution, département, et fonction. Participation gratuite à condition d’être inscrit car le nombre de places est limité.

Lieu du workshop: Université Paris-Dauphine. Place du Maréchal de Lattre de Tassigny 75016 PARIS.
Site web: http://vladowiki.fmf.uni-lj.si/doku.php?id=sda:meet:pa20



Back to SDA

sda/meet/pa20fr.txt · Last modified: 2019/11/30 01:04 by vlado
 
Except where otherwise noted, content on this wiki is licensed under the following license: CC Attribution-Noncommercial-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki