sfds.jpg sfc.jpg egc.jpg lc-upd.jpg

... more in French

La numérisation croissante de notre société alimente entre autres des bases de données ouvertes (« Open Data »), de taille grandissante (Big Data). Ces données sont souvent complexes (hétérogènes et multi-tables, munies de variables non appariées) mais peuvent être la source de création de valeur considérable pour la société à condition qu’elles soient exploitées avec des méthodes d’analyse adéquates. Ces journées ont justement pour objectif de centrer cette fois le débat vers l’analyse de ces données. Les classes réduisent la taille des données et constituent souvent un pivot central incontournable de l’analyse. Ces classes obtenues par apprentissage non-supervisé permettent d’obtenir une vue concise et structurée modélisant les données, en apprentissage supervisé elles permettent de fournir des règles de décision efficaces. Une troisième voie consiste à les considérer comme de nouvelles unités statistiques et à les décrire par des données symboliques (i.e. toute forme d’expression permettant de prendre en compte la variabilité interne des classes). On décrira ainsi les classes par des lois jointes ou marginales, des intervalles, des histogrammes, des diagrammes de fréquence (ce qui est couramment le cas dans les Instituts Nationaux de Statistique pour décrire des régions), des distributions, etc.. Cela permet de fusionner les données complexes et massives (en résolvant entre autres le problème des variables non appariées), pour pouvoir les étudier et les comprendre dans un cadre explicatif adéquat. L’analyse des données symboliques qui décrivent des classes peut aussi considérablement enrichir les interprétations classiques actuelles de ces classes.

Le programme scientifique sera orienté vers les différentes méthodes pour obtenir les classes à partir de données complexes et de grande taille, puis de les décrire et les modéliser de façon à prendre en compte leur variabilité interne dans un cadre explicatif sélectionné et enfin de les analyser pour les expliquer et les comprendre.

L’objectif de ces journées est de laisser la parole à des spécialistes de l’extraction de connaissances à partir de données de toutes sortes et de réfléchir ensemble aux orientations et tendances de la théorie et de la pratique de l’analyse de ces nouvelles données dans le contexte de la révolution numérique. Des tables rondes sur des thèmes précis pourront être organisées.



Back to Paris'18

sda/meet/pa18/intro.txt · Last modified: 2017/12/10 22:03 by vlado
 
Except where otherwise noted, content on this wiki is licensed under the following license: CC Attribution-Noncommercial-Share Alike 3.0 Unported
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki