



{"id":4769,"date":"2016-11-01T18:58:34","date_gmt":"2016-11-01T16:58:34","guid":{"rendered":"http:\/\/www.largeur.com\/?p=4769"},"modified":"2016-11-02T10:06:57","modified_gmt":"2016-11-02T08:06:57","slug":"data","status":"publish","type":"post","link":"https:\/\/largeur.com\/?p=4769","title":{"rendered":"La science \u00e0 l&rsquo;\u00e2ge des donn\u00e9es"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/201408\/02112016.jpg\" alt=\"02112016.jpg\" title=\"02112016.jpg\" width=\"471\" height=\"311\" border=\"0\" \/><\/p>\n<p>Depuis un peu plus de dix ans, un tsunami de donn\u00e9es s\u2019amplifie en d\u00e9ferlant sur tous les champs de la science. Les disciplines les plus gourmandes en puissance de calcul ont longtemps \u00e9t\u00e9 l\u2019astronomie, la physique et les sciences de la vie. \u00abMais d\u2019autres secteurs les rattrapent rapidement, comme les sciences sociales,\u2009o\u00f9 les chercheurs utilisent maintenant les smart technologies pour observer le comportement des individus plut\u00f4t que de leur faire remplir des questionnaires\u00bb, rel\u00e8ve le professeur Wil van der Aalst, qui dirige le Data Science Center \u00e0 l\u2019Universit\u00e9 technique d\u2019Eindhoven (TU\/e). Dans la plupart des domaines, les chercheurs se tournent vers le Big Data pour faire avancer la connaissance. \u00abL\u2019approche bas\u00e9e sur des th\u00e9ories a \u00e9t\u00e9 remplac\u00e9e par une autre s\u2019appuyant sur les donn\u00e9es\u00bb, observe Wil van der Aalst.<\/p>\n<p>L\u2019usage du Big Data implique donc, pour un scientifique, la capacit\u00e9 de r\u00e9unir et d\u2019analyser de gigantesques volumes de donn\u00e9es. Les co\u00fbts peuvent vite devenir \u00e9lev\u00e9s, d\u2019o\u00f9 l\u2019int\u00e9r\u00eat pour les chercheurs de collaborer, y compris de mani\u00e8re transdisciplinaire. Les institutions partagent d\u00e9sormais leurs infrastructures et des centres de recherche multidisciplinaires \u00e9mergent.<\/p>\n<p>\u00abAujourd\u2019hui, un laboratoire ne peut plus \u00eatre le seul d\u00e9positaire de tous les savoirs n\u00e9cessaires \u00e0 ses investigations\u00bb, dit le professeur Sune Lehmann, de la Danmarks Tekniske Universitet (DTU). Pendant plus de deux ans, il a \u00e9tudi\u00e9 les interactions sociales de ses \u00e9tudiants en analysant des Gigabytes de donn\u00e9es provenant de smartphones (lire l&rsquo;encadr\u00e9 ci-dessous).<br \/>\n_______<\/p>\n<p>ENCADRES<\/p>\n<p><strong>1. L\u2019humain sous la loupe<\/strong><\/p>\n<p><em>Le projet SensibleDTU \u00e9tudie les \u00e9changes et les comportements sociaux des \u00e9tudiants.<\/em><\/p>\n<p>L\u2019homme moderne communique \u00e0 travers de multiples canaux, que ce soit par la parole directe, par t\u00e9l\u00e9phone, ou encore par les r\u00e9seaux sociaux. C\u2019est de ce constat qu\u2019est parti Sune Lehmann pour lancer son projet SensibleDTU, dont l\u2019objectif est d\u2019\u00e9tudier les interactions sociales \u00ab\u00e0 travers la totalit\u00e9 des canaux de communication existants\u00bb.<\/p>\n<p>Un millier de smartphones \u00e9quip\u00e9s d\u2019une application destin\u00e9e \u00e0 r\u00e9colter des informations portant sur les interactions sociales ont \u00e9t\u00e9 distribu\u00e9s aux \u00e9tudiants. Sur une p\u00e9riode de deux ans et demi achev\u00e9e en f\u00e9vrier 2016, ils ont enregistr\u00e9 les donn\u00e9es fournies par le Bluetooth, les SMS, les conversations, les e-mails ou encore les r\u00e9seaux sociaux. \u00abNous avons collect\u00e9 100 Gigabytes de donn\u00e9es par jour, pendant mille jours\u00bb, s\u2019exclame Sune Lehmann.<\/p>\n<p>Plusieurs ann\u00e9es ont \u00e9t\u00e9 n\u00e9cessaires pour apprendre \u00e0 interpr\u00e9ter ces donn\u00e9es, \u00abcar les smartphones ne mesurent pas directement les interactions sociales\u00bb. Comment les chercheurs y sont-ils parvenus? La force du signal Bluetooth, par exemple, varie en fonction de la distance entre deux t\u00e9l\u00e9phones, permettant de d\u00e9terminer quand les interactions sociales ont lieu. Le GPS, quant \u00e0 lui, est pr\u00e9cieux pour l\u2019\u00e9tude du contexte social: \u00abUn rendez-vous dans un caf\u00e9 ou dans une chambre \u00e0 coucher est passablement diff\u00e9rent\u2026\u00bb<\/p>\n<p>L\u2019analyse des donn\u00e9es a d\u00e9but\u00e9 et fait d\u00e9j\u00e0 ressortir des r\u00e9sultats d\u2019une r\u00e9solution et d\u2019une densit\u00e9 jamais obtenues. De nombreux aspects fondamentaux des sciences sociales sont abord\u00e9s, tels que la confidentialit\u00e9, la r\u00e9ussite scolaire, les diff\u00e9rences de genre, la dynamique sociale ou la mobilit\u00e9. L\u2019application la plus surprenante est \u00e9pid\u00e9miologique: \u00abLes r\u00e9seaux de contacts entre les individus peuvent \u00eatre extrapol\u00e9s avec ceux utilis\u00e9s par les maladies\u2009infectieuses.\u00bb Sune Lehmann aimerait pouvoir utiliser le r\u00e9seau social Facebook pour stopper un virus en conseillant aux groupes de personnes identifi\u00e9es \u00e0 risque de se faire vacciner.<br \/>\n_______<\/p>\n<p><strong>2. Les voitures \u00abcoop\u00e9ratives\u00bb<\/strong><\/p>\n<p><em>Des v\u00e9hicules truff\u00e9s d\u2019\u00e9lectronique r\u00e9coltent de pr\u00e9cieuses informations pour la conduite autonome.<\/em><\/p>\n<p>Permettre \u00e0 des v\u00e9hicules de communiquer entre eux et avec leur environnement afin d\u2019am\u00e9liorer le trafic routier: c\u2019est la conduite dite coop\u00e9rative, destin\u00e9e aux voitures autonomes. Pour y parvenir, les chercheurs de la Smart Mobility Strategic Area (SMSA) de TU\/e truffent d\u2019\u00e9lectronique des voitures de particuliers.<\/p>\n<p>Pas moins de 100 T\u00e9rabytes de donn\u00e9es sont collect\u00e9es &#8212; l\u2019\u00e9quivalent de l\u2019espace de stockage de 400 iPad &#8212; provenant du GPS, des capteurs de rotation des roues, de cam\u00e9ras ou du wifi. Les b\u00e9n\u00e9fices sont multiples: les voitures optimisent les distances, r\u00e9duisent leur consommation et communiquent pour accro\u00eetre la s\u00e9curit\u00e9 et augmenter la fluidit\u00e9 du trafic.<br \/>\nLa technologie n\u2019est toutefois pas encore au point, explique Carlo van de Weijer: \u00abM\u00eame si la s\u00e9curit\u00e9 est proche de 100%, le tout petit pourcentage restant impliquerait plusieurs accidents par jour\u2009si tous les v\u00e9hicules \u00e9taient autonomes.\u00bb<br \/>\n_______<\/p>\n<p><strong>3. Les explorateurs du pass\u00e9<\/strong><\/p>\n<p><em>Le projet Venice Time Machine scanne mille ans d\u2019histoire de la cit\u00e9 des Doges.<\/em><\/p>\n<p>Les algorithmes cl\u00e9s qui ont rendu imaginable la collecte et le traitement massif de donn\u00e9es remontent \u00e0 l\u2019ann\u00e9e 2004, soit la naissance du mouvement Big Data. Peu d\u2019informations ant\u00e9rieures \u00e0 cette date sont utilisables par ces nouveaux outils de recherche. Or \u00abil est urgent que le pass\u00e9 devienne aussi accessible que le pr\u00e9sent\u00bb, lance Fr\u00e9d\u00e9ric Kaplan, qui dirige le projet Venice Time Machine \u00e0 l\u2019Ecole polytechnique de Lausanne (EPFL). Son ambition: d\u00e9couvrir des aspects m\u00e9connus de la cit\u00e9 des Doges gr\u00e2ce \u00e0 la num\u00e9risation de ses archives et de ses \u0153uvres culturelles.<\/p>\n<p>La t\u00e2che est titanesque: il faudra dix ans pour scanner mille ans d\u2019histoire scrupuleusement gard\u00e9s dans 327 salles d\u2019archives. Elles contiennent les relev\u00e9s commerciaux, feuilles d\u2019imp\u00f4ts, testaments, actes de d\u00e9c\u00e8s, de mariage, de naissance et adresses des habitants v\u00e9nitiens. Mais pas seulement: les archives contiennent \u00e9galement des documents diplomatiques. \u00abCes c\u00e2bles sont si riches que l\u2019on pourrait retracer gr\u00e2ce \u00e0 eux une bonne partie de l\u2019histoire europ\u00e9enne\u00bb, dit Fr\u00e9d\u00e9ric Kaplan, qui collabore avec l\u2019Universit\u00e9 de Venise et les archives d\u2019Etat v\u00e9nitiennes.<\/p>\n<p>Ce n\u2019est pas tant le volume de donn\u00e9es que la mani\u00e8re de num\u00e9riser ces milliards de pages sans les ab\u00eemer qui constitue un d\u00e9fi: \u00abNous avons d\u00e9velopp\u00e9 un scanner semi-automatique capable de num\u00e9riser mille feuilles par heure, que nous avons reproduit plusieurs fois.\u00bb L\u2019utilisation de techniques d\u2019imagerie m\u00e9dicale pour digitaliser les ouvrages sans les ouvrir est m\u00eame envisag\u00e9e. \u00abEt \u00e7a fonctionne! Mais ces proc\u00e9d\u00e9s sont encore en phase d\u2019\u00e9laboration.\u00bb<\/p>\n<p>Autre challenge: la reconnaissance des caract\u00e8res dans les \u00e9crits manuscrits. \u00abNous collaborons avec pas moins de quinze universit\u00e9s pour trouver des solutions.\u00bb L\u2019EPFL travaille en particulier sur des algorithmes capables de transformer les images num\u00e9riques en mots puis en phrases. L\u2019objectif est de mettre en place un outil de recherche \u00e0 la Google pour exploiter la base de donn\u00e9es. \u00c0 cette fin, les scientifiques raccordent des mots cl\u00e9s et organisent les informations en immenses graphiques interconnect\u00e9s. La logique des archivistes v\u00e9nitiens aide les chercheurs dans cette t\u00e2che, car ils \u00e9taient les pr\u00e9curseurs des index. \u00abNous trouvons des listes de noms, de lieux et de documents. C\u2019est l\u2019\u00e9quivalent d\u2019un Facebook de l\u2019ancien temps.\u00bb Depuis mars 2016, l\u2019EPFL collabore \u00e9galement avec la Fondazione Giorgio Cini afin de scanner et de num\u00e9riser des peintures. Parmi les archives de la fondation se trouvent des \u0153uvres de Pierro della Francesca, Fra Angelico ou encore Sandro Botticelli.<br \/>\n_______<\/p>\n<p>Une version de cet article est parue dans le magazine Technologist (no 10).<\/p>\n<p>Pour souscrire un abonnement \u00e0 Technologist au prix de CHF 45.- (42 euros) pour 8 num\u00e9ros, rendez-vous sur <a href=\"http:\/\/www.technologist.eu\/print-magazine\/subscribe\/\" target=\"_blank\">technologist.eu<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La r\u00e9volution num\u00e9rique et la capacit\u00e9 \u00e0 traiter d\u2019\u00e9normes volumes de donn\u00e9es ont chang\u00e9 la fa\u00e7on d\u2019aborder la recherche. Exemples.<\/p>\n","protected":false},"author":20200,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[],"class_list":["post-4769","post","type-post","status-publish","format-standard","hentry","category-technophile","technophile"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts\/4769","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/users\/20200"}],"replies":[{"embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=4769"}],"version-history":[{"count":0,"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts\/4769\/revisions"}],"wp:attachment":[{"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=4769"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=4769"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=4769"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}