background preloader

7 – Les enjeux stratégiques du big data

Facebook Twitter

1 – Les données peuvent-elles profiter à tous ? 2 – Les métiers de l'informatique en mutation. 3 – Quelles orientations pour la recherche en data mining. Le data mining a évolué du point de vue des thématiques de recherche.

3 – Quelles orientations pour la recherche en data mining

Les sujets d’aujourd’hui sont pilotés par deux problématiques. La première s’emploie à intégrer de nouvelles possibilités techniques de calcul distribué qu’il s’agisse du Cloud ou des architectures multiprocesseurs. La seconde s’emploie à analyser de nouveaux sujets d’étude comme les réseaux sociaux. Les premiers demandent de repenser les outils actuels pour pouvoir profiter des nouvelles opportunités technologiques en matière de puissance de calcul.

Les seconds sont de nouveaux sujets d’études partiellement traités par les thématiques actuelles. Paul Erdös à la fois sujet d’étude et personnage important de l’étude des graphes sociaux. Il convient alors de penser les algorithmes de manières parallélisables ou d’en penser de nouveaux. 4 – Travailler sur la durée. Our species can’t seem to escape big data.

4 – Travailler sur la durée

We have more data inputs, storage, and computing resources than ever, so Homo sapiens naturally does what it has always done when given new tools: It goes even bigger, higher, and bolder. We did it in buildings and now we’re doing it in data. Sure, big data is a powerful lens — some would even argue a liberating one — for looking at our world. Despite its limitations and requirements, crunching big numbers can help us learn a lot about ourselves. But no matter how big that data is or what insights we glean from it, it is still just a snapshot: a moment in time. Samuel Arbesman is an applied mathematician and network scientist. By “long” data, I mean datasets that have massive historical sweep — taking you from the dawn of civilization to the present day.

Because as beautiful as a snapshot is, how much richer is a moving picture, one that allows us to see how processes and interactions unfold over time? We also need to build better tools. 5 – Sortir de la tyrannie du présent. La quantité massive de données dont nous disposons sur tous les sujets, des sciences sociales aux systèmes environnementaux, nous laisse espérer la possibilité de mieux comprendre le monde dans lequel nous vivons.

5 – Sortir de la tyrannie du présent

Mais les arbres ne cachent-ils pas la forêt ? Le mathématicien Samuel Arbesman (@arbesman) affirme dans Wired qu'il nous faut désormais compléter ces big data par les "long data" : des informations sur les phénomènes lents, se développant sur le très long terme. Pour cela, nous devons collecter et surtout interpréter des données s'étendant sur plusieurs siècles, voire des millénaires.

Un exemple de ce genre de travail, cité par Arbesman, est l'oeuvre Jared Diamond, auteur de Guns, Germs and Steel (traduit en français sous le titre De l’inégalité parmi les sociétés - Wikipédia). 6 – Favoriser des recherches sur des périodes longues. Inside the U.S.

6 – Favoriser des recherches sur des périodes longues

Geological Survey National Ice Core Lab. Image: USGSName frequencies in English-language Google Books texts over the 20th century. Image: Michel et al. /ScienceTop left, a wolf-killed moose carcass; top right, the same carcass three days later. 7 – Comment protéger, traiter, valoriser les données ? Protéger les donnéesL’utilité des données pouvant se révéler à l’avenir, il paraît essentiel de conserver et protéger les données en vue d’usages futurs.

7 – Comment protéger, traiter, valoriser les données ?

Les chercheurs du LIRIS, Laboratoire d’InfoRmatique en image et Systèmes d’information, comme Jean-François Boulicaut, insistent beaucoup sur ce point, s’étonnant de « voir à quel point les propriétaires de données, ceux qui collectent les données, mésestiment les possibilités d’exploitation qui pourront en être faites ». Pour les chercheurs qui travaillent à la valorisation des données, le développement de nouveaux services et la découverte de connaissances, la donnée est une matière première essentielle qui doit rester dans le domaine publique. « Nous ne savons pas encore exactement ce que nous allons pouvoir faire avec les données. Mais il faut préserver cette matière première car ensuite, ce ne sera la peine d’exécuter de nouveaux services sur des données qui n’existeront plus ou pour lesquelles il faudra payer cher.

8 – Développer une philanthropie des données. The conversation around Data Philanthropy - a term which describes a new form of partnership in which private sector companies share data for public benefit - has advanced on four distinct but related levels since its emergence at the World Economic Forum in Davos in 2011: 1.

8 – Développer une philanthropie des données

Conceptual development: discourse and debate Discussions about the concept of Data Philanthropy, or private sector data sharing, have gained momentum and moved forward, reaching a broader audience. In an article about the issue, Fast Company’s Co.Exist summarized: 'The next movement in charitable giving and corporate citizenship may be for corporations and governments to donate data, which could be used to help track diseases, avert economic crises, relieve traffic congestion, and aid development.The public sector isn’t, however, the only one to gain from Data Philanthropy: companies donating data can get advantage from it too.' 2. 3. 9 – La philanthropie des données est bonne pour les affaires. 10 – Partager les données pour améliorer leur utilisation. The digital revolution of the first decade of this new century has brought many wonders, yet it has also has ushered in a bewildering array of unanticipated consequences.

10 – Partager les données pour améliorer leur utilisation

We now find ourselves in a volatile and hyperconnected world where risk has been globalized. Our tightly-coupled systems have become interdependent, creating feedback loops so complex that predictive analysis is of little use. There is a kind of butterfly effect at work in the world. Crises emerge suddenly without warning, interact to amplify one another's effects, and reverberate across the globe, increasing the burden of poverty, disease, and hunger among the world's most vulnerable communities.