[Du 1er au 08 aout 2013] Open Science à Seattle : Big Data, systèmes complexes et Open Data

Après la Californie, la dernière étape sur la côte ouest m’amenait à Seattle. Lors de cette semaine, j’ai eu la chance d’avoir un guide hors-pair : Brian Glanz, co-fondateur de l’Open Science Federation. A Seattle, j’ai pu explorer une facette de l’Open Science différente de celle de San Francisco. En effet, les directions prises par de grandes compagnies de logiciels et de services, comme Microsoft ou Amazon, orientent fortement les thématiques traitées en Open Science. Open Data, gestion et management des Big Data, notamment en Sciences de la vie, ont été les sujets récurrents des différentes rencontres et interviews.

Si San Francisco a été une immersion dans le monde des startups et des hackerspaces, Seattle quant à elle a été une plongée dans un monde académique innovant. 9 rencontres, 13 interviews, 1 évènement. La semaine a été bien remplie grâce à Brian Glanz qui avait planifié l’ensemble du programme et a pris le temps de m’accompagner à chaque rencontre. Brian Glanz est une des personnes les plus actives que je connaisse dans le monde de l’Open Science. Il est co-fondateur de l’Open Science Federation (@openscience sur Twitter), organisateur des ScienceOnline à Seattle, fondateur du chapitre OKFN aux Etats-Unis.  Il est aussi très présent dans des actions citoyennes (open government, open food…) et souhaite voir la recherche s’implanter un peu plus dans chacune de ses actions.

L’Université de Washington : une mine d’acteurs et de projets pour l’Open Science

Premier jour à Seattle, je découvre l’institut de pêche et d’aquaculture faisant partie du College pour l’environnement. C’est un laboratoire classique en apparence, mais avec des pratiques de recherche innovantes. Nous y rencontrons Steven Roberts, qui dirige un des laboratoires de recherche. Derrière son ordinateur, il commence par nous expliquer la façon dont il gère son cahier de recherche : il partage toutes ses données ainsi que l’avancée de son travail sur Ipy. L’implication des étudiants participe beaucoup à l’image dynamique du laboratoire: ils communiquent sur l’avancée de leurs travaux notamment sur les réseaux sociaux mais aussi avec un wiki. Steven Roberts est un « openscientist » dans l’âme; pour lui, c’est tout à fait normal de mettre en place ces pratiques et essayer et tester de nouveaux outils tels que Github (une plateforme collaborative d’écriture de code de plus en plus utilisée en recherche).

Steven Robert

Steven Robert : Open Scientist en action..

Quelques mètres plus loin, nous avions rendez vous au Research Commons. Cette ancienne bibliothèque a été complètement remaniée pour favoriser la créativité et la collaboration entre chercheurs et étudiants. Espaces modulables, tables et murs en tableaux blancs, ouverture 7j/7… Tout est fait pour faciliter l’émergence de nouvelles idées. Les responsables de ce centre s’intéressent aussi à la formation des chercheurs en gestion des données. Comment les organiser et les étiqueter? Comment les standardiser ? Récemment, ils ont organisé un atelier sur la reproductibilité des données en recherche. L’université de Washington évolue dans une culture des Data. Cela s’explique notamment par le tissu particulier d’entreprises et d’instituts de recherche de la région de Seattle.

research commons osf

Research commons by OpenScienceFederation

Une forte culture OpenData à Seattle

En effet, à Seattle, j’ai été marquée par une très forte orientation des problématiques OpenScience autour de l’Open Data. La toile de fond constituée par de grandes compagnies de logiciels et de services comme Microsoft ou Amazon y joue un grand rôle.

J’en ai notamment discuté avec Sally James, journaliste scientifique à Seattle. Elle donne quelques explications dans cette interview :

« Il y a un mélange intéressant à Seattle. Beaucoup de personnes regardent le rapport signal/bruit. Certains créent des applications pour des téléphones, d’autres observent comment des protéines s’expriment dans une cellule. Cette ville est le lieu ou ces différents domaines se chevauchent. »

Ces idées sont reprises dans un livre publié par Microsoft The Fourth Paradigm: Data-Intensive Scientific Discovery. Ce livre postule que nous rentrons dans une nouvelle ère de la recherche: aux études expérimentales, théoriques et informatiques se rajoutent la quatrième notion-clef de l’exploration des données.

Eugene Kolker cofondateur de DELSA s’en inspire fortement. Le projet DELSAData Enabled Life Science –cherche à placer la question des données, leur analyse, leur partage et leur reproductibilité au cœur de la recherche en Sciences de la Vie.

La quantité phénoménale de données générées – ce qu’on appelle le BigData – par l’étude de systèmes de plus en plus complexes en Sciences amène certes à cette nouvelle ère pour la recherche, mais accélère par là même le développement de nouvelles pratiques.

Big Data et Open Data : une nécessité pour une approche de la complexité en Science 

Beaucoup de groupes de recherche à Seattle, notamment ceux liés aux Sciences de la Vie ou à l’Environnement, adoptent une approche multidisciplinaire et multi-échelle. L’ISB « l’Institute for Systems Biology » est l’un de ces organismes. Créé il y’a de plus de 13 ans, c’est l’un des premiers à étudier les Sciences de la Vie en tant que système complexe. On y essaye ainsi de comprendre comment différentes parties d’un organisme, d’une cellule, d’un gène interagissent les uns les autres. Selon le contexte, les chercheurs y étudient l’émergence de propriétés nouvelles dans ces systèmes. L’ISB mène depuis longtemps une politique Open Science, il publie l’ensemble des articles en Open Access, partage les données mais aussi les codes des logiciels.

Laboratoire de l'ISB

Laboratoire de l’ISB

L’Open Science semble fondamentale pour analyser ces BigData en particulier dans le cadre d’une approche complexe du vivant. En effet, de tels objectifs de recherche nécessite la collaboration d’un grand nombre de chercheurs issus de différents domaines. Une telle collaboration étant justement permise par des modèles de publications ouvertes et des approches du type OpenScience… Trente ans auparavant, l’ISB était un des seuls instituts de ce genre. Aujourd’hui des centaines d’organismes se créent sur le même principe. Leur utilisation de l’OpenScience est certainement en avance sur notre temps mais constitue néanmoins  une des réponses les plus adaptées aux enjeux des sciences de la vie et de la santé.

Départ pour la côte Ouest : Bidouille ton Doc à Montréal

Après une semaine bien remplie à Seattle,  le « redeye flight » m’amenait à Montréal pour quelques jours. L’expression décrit bien les passagers de ces vols, arrivant avec 3 heures de sommeil confisquées par le décalage horaire. HackYourPhD devenait alors Bidouille ton Doc pour quelques jours.

Pour plus d’images et d’interviews, voici le storify de la semaine à Seattle

Merci à Guillaume Dumas et Matthieu LeChanjour pour leur précieuse relecture.

 

Pour en savoir plus sur l’Institute for Systems Biology, retrouvez ici le billet écrit pour EducPros lors du voyage « HackYourPhD aux States ».

Ce message est également disponible en : Anglais

One thought on “[Du 1er au 08 aout 2013] Open Science à Seattle : Big Data, systèmes complexes et Open Data

  1. Pingback: Open source : revue de web de la semaine du 19-25 août 2013. | Contrepoints

Laisser un commentaire