



{"id":4738,"date":"2016-09-12T15:30:22","date_gmt":"2016-09-12T13:30:22","guid":{"rendered":"http:\/\/www.largeur.com\/?p=4738"},"modified":"2016-09-12T15:32:49","modified_gmt":"2016-09-12T13:32:49","slug":"sante","status":"publish","type":"post","link":"https:\/\/largeur.com\/?p=4738","title":{"rendered":"Big data: comment partager les donn\u00e9es en toute confiance"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/201408\/bigdata_1.jpg\" border=\"0\" height=\"311\" width=\"468\" title=\"bigdata_1.jpg\" alt=\"bigdata_1.jpg\" \/><\/p>\n<p>\u00abLe \u00ab\u00a0Big data\u00a0\u00bb a le potentiel de faire de la m\u00e9decine une science plus exacte\u00bb, pouvait-on lire en 2015 dans le bulletin de l\u2019Acad\u00e9mie suisse des sciences m\u00e9dicales (ASSM). <a href=\"http:\/\/www.largeur.com\/?p=4732\" target=\"_blank\">La question des donn\u00e9es massives est au c\u0153ur de la m\u00e9decine personnalis\u00e9e<\/a>. Un jour, ces informations num\u00e9riques permettront certainement de proposer des th\u00e9rapies extr\u00eamement cibl\u00e9es.<\/p>\n<p>\u00abEn tant que tel, ces donn\u00e9es n\u2019ont qu\u2019une valeur tr\u00e8s limit\u00e9e, avertit pourtant Vincent Mooser, chef du Service de biom\u00e9decine et du D\u00e9partement des laboratoires du CHUV et responsable de la Biobanque institutionnelle de Lausanne (BIL). Ce n\u2019est qu\u2019\u00e0 partir du moment o\u00f9 nous avons la capacit\u00e9 de convertir les donn\u00e9es brutes en informations, puis en connaissances, qu\u2019elles deviennent utiles. Pour cela, il faut notamment des outils de \u00abtext mining\u00bb (extraction de connaissances) pour analyser les dossiers m\u00e9dicaux, mais aussi des outils bio-informatiques pour d\u00e9terminer quelles variations du g\u00e9nome font cliniquement sens&#8230; Complexit\u00e9 suppl\u00e9mentaire, ces outils doivent \u00eatre en mesure de travailler sur des cohortes de millions d\u2019individus afin d\u2019isoler un profil biologique particulier.\u00bb<\/p>\n<p>D\u2019o\u00f9 provient cette masse de donn\u00e9es qui composent le Big data? Elles sont issues de la clinique, des analyses (g\u00e9n\u00e9tiques par exemple) et de la recherche, d\u2019o\u00f9 leur tr\u00e8s grande h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9. Un des d\u00e9fis majeurs est donc leur interop\u00e9rabilit\u00e9: il s\u2019agit par exemple de faire en sorte que les h\u00f4pitaux de Gen\u00e8ve (HUG) et de Lausanne (CHUV) puissent mettre leurs donn\u00e9es en commun. Or en la mati\u00e8re, tout reste \u00e0 faire, constate Christian Lovis, chef du Service des sciences de l\u2019information m\u00e9dicale des HUG. \u00abPrenez une donn\u00e9e tr\u00e8s simple comme le poids d\u2019un patient. Il en existe de toutes sortes: poids \u00e0 la naissance, avant traitement, apr\u00e8s dialyse, \u00e0 sec, etc. Aujourd\u2019hui, on n\u2019est pas capables d\u2019unifier de mani\u00e8re automatique les poids des patients dans les h\u00f4pitaux en Suisse, faute de formats de donn\u00e9es similaires.\u00bb Sur le plan national, un pas sera franchi en 2017 dans le traitement des informations m\u00e9dicales, avec la Loi f\u00e9d\u00e9rale sur le dossier \u00e9lectronique du patient. Mais le d\u00e9fi est plan\u00e9taire car les \u00e9quipes devront pouvoir acc\u00e9der aux donn\u00e9es du monde entier, par exemple pour trouver un cas de mutation g\u00e9n\u00e9tique rare qui a d\u00e9j\u00e0 \u00e9t\u00e9 trait\u00e9 ailleurs.<\/p>\n<p>Une autre partie des donn\u00e9es est fournie par les citoyens. \u00abLe mouvement du quantified self (\u00abmesure de soi\u00bb) est une lame de fond qui ne va pas s\u2019arr\u00eater, estime Jean-Pierre Hubaux, du Laboratoire pour les communications informatiques et leurs applications de l\u2019EPFL. Aujourd\u2019hui, des bracelets mesurent votre activit\u00e9 physique, vos d\u00e9penses caloriques, votre sommeil, puis envoient les donn\u00e9es sur votre smartphone. Demain, la tentation sera grande de connecter nos smartphones aux capteurs que l\u2019on portera sur ou dans le corps (pacemaker, pompe \u00e0 insuline, appareils auditifs, etc.). A terme, les chercheurs utiliseront le smartphone pour recueillir les donn\u00e9es des cohortes \u00e9pid\u00e9miologiques, par exemple pour mesurer l\u2019impact de l\u2019exposition \u00e0 certains polluants.\u00bb<\/p>\n<p><strong>Prot\u00e9ger les donn\u00e9es<\/strong><\/p>\n<p>Le secret m\u00e9dical est \u00e0 la base de la relation de confiance avec le m\u00e9decin. Or les donn\u00e9es du Big data n\u2019ont de sens que si elles peuvent \u00eatre partag\u00e9es avec les chercheurs du monde entier&#8230; Comment faire pour prot\u00e9ger l\u2019anonymat du patient? Jusqu\u2019\u00e0 pr\u00e9sent, on utilise avant tout le codage des \u00e9chantillons m\u00e9dicaux.<\/p>\n<p>Jean-Pierre Hubaux a \u00e9t\u00e9 mandat\u00e9 pour concevoir avec ses \u00e9quipes les syst\u00e8mes de protection de la BIL, la biobanque du CHUV. Le chercheur souligne que \u00abprot\u00e9ger les donn\u00e9es m\u00e9dicales est une question tr\u00e8s complexe. Le cryptage des donn\u00e9es (en transit ou stock\u00e9es), notamment utilis\u00e9 dans la finance, est efficace mais il n\u2019existe pas de syst\u00e8me s\u00fbr \u00e0 long terme, car les ordinateurs seront toujours plus puissants. Si des donn\u00e9es, encrypt\u00e9es en 2016, sont vol\u00e9es ou copi\u00e9es, il sera plus facile d\u2019en casser le chiffrement en 2036. Face \u00e0 cette incertitude, plusieurs groupes de recherche, y compris le n\u00f4tre, se sont attaqu\u00e9s \u00e0 ce probl\u00e8me \u00e9pineux. Une autre technique, le traitement statistique, consiste \u00e0 bruiter les donn\u00e9es pour emp\u00eacher leur r\u00e9-identification, mais il y a de fortes r\u00e9ticences car on perd en pr\u00e9cision.\u00bb<\/p>\n<p>Nicolas Rosat, responsable du domaine Recherche &amp; IT au sein de la Direction des syst\u00e8mes d\u2019information (DSI) du CHUV, travaille \u00e9galement sur la partie informatique de la BIL. En termes de s\u00e9curit\u00e9 des donn\u00e9es, il \u00e9value les solutions que proposent Jean-Pierre Hubaux et son \u00e9quipe. Il souligne qu\u2019au sein de la DSI, la protection des donn\u00e9es est appr\u00e9hend\u00e9e de mani\u00e8re globale, selon une m\u00e9thodologie de gestion de risques et d\u2019analyse des menaces. \u00abLe cryptage n\u2019est qu\u2019un moyen parmi d\u2019autres pour prot\u00e9ger nos donn\u00e9es, qu\u2019elles soient biologiques ou non. En fonction de la menace, nous utilisons toutes les techniques disponibles: le masquage, le codage de l\u2019identit\u00e9, le contr\u00f4le de la divulgation statistique (indiquer par exemple une tranche d\u2019\u00e2ge plut\u00f4t que l\u2019\u00e2ge exact), etc. Les interconnexions de plus en plus grandes entre les r\u00e9seaux cr\u00e9ent de nouvelles menaces ext\u00e9rieures. Nous nous y pr\u00e9parons en accompagnant le CHUV vers l\u2019informatique de demain.\u00bb<br \/>\n_______<\/p>\n<p>ENCADRE<\/p>\n<p><strong>Scala, un langage Big data \u00abmade in Switzerland\u00bb<\/strong><\/p>\n<p>Un centre consacr\u00e9 au d\u00e9veloppement du langage de programmation Scala vient d\u2019\u00eatre fond\u00e9 au sein de l\u2019EPFL. Cr\u00e9\u00e9 en 2004 par Martin Odersky, professeur au sein de l\u2019\u00e9cole, cet outil a d\u00e9j\u00e0 convaincu plus de 500\u2019000 utilisateurs dans le monde, notamment Twitter, IBM, The Swiss Stock Exchange, le New York Times&#8230; Langage libre et open source, Scala est facilement maniable et peut se greffer sur des syst\u00e8mes existants. Il a aussi la particularit\u00e9 de pouvoir s\u2019adapter \u00e0 des projets de grande ampleur, ce qui le rend particuli\u00e8rement int\u00e9ressant pour le domaine du Big data.<br \/>\n_______<\/p>\n<p>INTERVIEW<\/p>\n<p><strong>\u00abIl nous faut des donn\u00e9es interpr\u00e9tables\u00bb<\/strong><\/p>\n<p>Christian Lovis est m\u00e9decin-chef du Service des sciences de l&rsquo;information m\u00e9dicale des HUG et pr\u00e9sident de la F\u00e9d\u00e9ration europ\u00e9enne d&rsquo;informatique m\u00e9dicale. Selon lui, l\u2019enjeu r\u00e9side dans la capacit\u00e9 \u00e0 extraire du sens de ce d\u00e9luge d\u2019informations num\u00e9riques.<\/p>\n<p><strong>En mati\u00e8re de Big data, le secteur public est souvent accus\u00e9 d\u2019\u00eatre en retard sur le priv\u00e9\u2026<\/strong><br \/>\nC\u2019est largement erron\u00e9! Pour ce qui est des donn\u00e9es en tant que telles, et du codage de la s\u00e9mantique de ces donn\u00e9es (c\u2019est-\u00e0-dire leur interpr\u00e9tabilit\u00e9), le secteur public a m\u00eame une avance certaine sur le priv\u00e9. En Suisse, les h\u00f4pitaux publics sont largement informatis\u00e9s. Or si vous n\u2019avez pas les donn\u00e9es, vous ne pouvez pas faire avancer la recherche. Certaines soci\u00e9t\u00e9s priv\u00e9es vendent des programmes pr\u00e9sent\u00e9s comme des outils de Big data, mais en r\u00e9alit\u00e9 ce sont surtout des outils de traitement de donn\u00e9es traditionnels adapt\u00e9s aux grands volumes.<\/p>\n<p><strong>Le volume des donn\u00e9es d\u00e9finit-il le Big data?<\/strong><br \/>\nC\u2019est ce que certains veulent nous faire croire. Mais lorsque j\u2019\u00e9tais en poste aux Etats-Unis, il y a pr\u00e8s de 20 ans, la base de donn\u00e9es des v\u00e9t\u00e9rans de l\u2019US Army sur laquelle je travaillais comptait d\u00e9j\u00e0 40 millions de dossiers patients et personne ne parlait de Big data. On sait depuis longtemps stocker des masses de donn\u00e9es, il suffit de mettre les financements n\u00e9cessaires. Le vrai d\u00e9fi n\u2019est pas tant le stockage que l\u2019interpr\u00e9tabilit\u00e9 des donn\u00e9es, et donc la s\u00e9mantique et l\u2019interop\u00e9rabilit\u00e9. Quel sens est-on capable d\u2019extraire de ces donn\u00e9es pour r\u00e9pondre \u00e0 des questions? Par exemple, proposer au citoyen des moyens pr\u00e9ventifs et th\u00e9rapeutiques adapt\u00e9s \u00e0 son cas.<\/p>\n<p><strong>Que manque-t-il aux chercheurs pour pouvoir interpr\u00e9ter les donn\u00e9es du Big data?<\/strong><br \/>\nBeaucoup de choses! Outre les probl\u00e8mes d\u2019interop\u00e9rabilit\u00e9 et de s\u00e9mantiques dans des sources h\u00e9t\u00e9rog\u00e8nes, il faut d\u00e9velopper la capacit\u00e9 des syst\u00e8mes \u00e0 repr\u00e9senter les contextes et supporter, \u00e0 l\u2019avenir, des questions que l\u2019on ne se pose pas encore aujourd\u2019hui. Et \u00e9galement trouver le moyen d\u2019ajouter une donn\u00e9e \u00e0 d\u2019immenses bases sans avoir \u00e0 tout recalculer: c\u2019est l\u2019analyse incr\u00e9mentale; ou encore traiter des donn\u00e9es dans des bases s\u00e9par\u00e9es: l\u2019analyse distribu\u00e9e; ce sont deux types d\u2019analyse pour lesquels nous sommes assez d\u00e9munis. La r\u00e9solution de ces questions repr\u00e9sente une opportunit\u00e9 immense pour la recherche.<br \/>\n_______<\/p>\n<p>Une version de cet article est parue dans In Vivo magazine (no 9).<\/p>\n<p>Pour vous abonner \u00e0 In Vivo au prix de seulement CHF 20.- (d\u00e8s 20 euros) pour 6 num\u00e9ros, rendez-vous sur <a href=\"http:\/\/www.invivomagazine.com\/\" target=\"_blank\">invivomagazine.com<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Une quantit\u00e9 massive de donn\u00e9es relatives \u00e0 la sant\u00e9 des patients est stock\u00e9e dans les h\u00f4pitaux. Avec l\u2019aide de l\u2019EPFL, le CHUV apprend \u00e0 en tirer profit tout en les prot\u00e9geant.<\/p>\n","protected":false},"author":20209,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[],"class_list":["post-4738","post","type-post","status-publish","format-standard","hentry","category-technophile","technophile"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts\/4738","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/users\/20209"}],"replies":[{"embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=4738"}],"version-history":[{"count":0,"href":"https:\/\/largeur.com\/index.php?rest_route=\/wp\/v2\/posts\/4738\/revisions"}],"wp:attachment":[{"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=4738"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=4738"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/largeur.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=4738"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}