Conférenciers invités

Timothee Giraud : Paris géographe, UMS RIATE

Représentation et traitement de l'information géographique avec R : R permet de simplifier les chaînes de traitements d'analyse spatiale et de cartographie qui nécessitait auparavant l'utilisation de nombreux logiciels (souvent propriétaires). A partir d'exemples nous illustrerons les différentes étapes du traitement de l'information géographique (acquisition et mise en forme, traitements, représentations). Nous aborderons notamment l'utilisation d'API de cartographie, la manipulation et la représentation de données géographiques (flux, stocks...), les opérations classiques de géotraitement ainsi que des traitements plus poussés faisant notamment appel aux méthodes de lissage spatial.

Thibault Laurent : Toulouse School of Economics, GREMAQ/CNRS

L'analyse statistique de données spatiales fait appel à des méthodes d’exploration et de modélisation qui sont propres à la nature «spatiale » des données. A partir d’études de cas, on essaiera de montrer un aperçu des méthodes et librairies R qui traitent des trois principaux courants de la statistique spatiale : l’économétrie spatiale (spdep, [Bivand et al., 2013]), les processus ponctuels spatiaux (spatstat, [Baddeley et Turner, 2005]) et la géostatistique (geoR, [Diggle et Ribeiro, 2007]) 

Références :

Baddeley, A. et Turner, R (2005). An R package for analyzing spatial point patterns. Journal of Statistical Software, 12(6), pp. 1-42.

Bivand, R. S., Pebesma, E. et Gomez-Rubio, V. (2013). Applied spatial data analysis with R. Springer-Verlag, 2ème edition.

Diggle, P. J. et Ribeiro P. J. (2007). Model based geostatistics. Springer-Verlag

Erwan Le Pennec : Ecole Polytechnique, responsable du DSSP 

"R, Data Science... et Formation".

L'objectif de cet exposé est de montrer comment R peut être utilisé pour présenter (quasi) tous les aspects de la science des données : récupération des données, nettoyage, traitement statistique etvisualisation. Je m'appuierai pour cela sur deux programmes deformations récemment créés : le parcours Data Science du M2 Mathématique et applications Paris Saclay et  le Data Science Starter Program, une formation continue proposée par l'École polytechnique.

Floreal Morandat  LaBRI  (Laboratoire Bordelais de Recherche en Informatique) / Bordeaux INP (Institut Polytechnique de Bordeaux)

De la concision à l’efficacité, le cauchemar d’un informaticien.

R est devenu la lingua-franca de nombreux domaines grâce à sa concision, ses NAs, ses objets et la possibilité d'exprimer symboliquement des formules. Les informaticiens n’y ont vu jusqu’à récemment qu’un outil pour tracer des graphes et non un langage.
A l’origine (et encore aujourd’hui), les programmes sont développés en R, puis optimisés en C. Ceci requiert des doubles compétences de la part des programmeurs, augmente le risque d'erreur dans le code tout en le rendant difficilement maintenable.

En tant qu'informaticien notre rôle n'est pas de juger le langage mais d'offrir des performances acceptables pour l'utilisateur final tout en préservant sa sémantique qui est malheureusement non spécifiée. Pour extraire cette sémantique, il nous a fallu regarder sous le capot, et c'est ainsi que le cauchemar a commencé …


Jeroen Ooms : University of California Los Angeles (OpenCPURAppArmor, ...)

jsonlite and mongolite

The jsonlite package provides a powerful JSON parser and generator that has become one of standard methods for getting data in and out of R. We discuss some recent additions to the package, in particular support streaming (large) data over http(s) connections. We then introduce the new mongolite package: a high-performance MongoDB client based on jsonlite. MongoDB (from "humongous") is a popular open-source document database for storing and manipulating very big JSON structures. It includes a JSON query language and an embedded V8 engine for in-database aggregation and map-reduce. We show how mongolite makes inserting and retrieving R data to/from a database as easy as converting it to/from JSON, without the bureaucracy that comes with traditional databases. Users that are already familiar with the JSON format might find MongoDB a great companion to the R language and will enjoy the benefits of using a single format for both serialization and persistency of data.

 

 

 

 

Personnes connectées : 3 Flux RSS