background preloader

Recherche & Big data

Facebook Twitter

A propos. Rap1 : quels enjeux ? Quels bénéfices ? Célya Gruson-Daniel | Publié le , mis à jour le La recherche est aujourd’hui confrontée à un nombre croissant de données à traiter, analyser et stocker. Celles-ci ne proviennent pas seulement des chercheurs mais aussi d'un nombre important d'autres contributeurs non scientifiques qui ont la possibilité de participer à leur exploitation, si ces données leurs sont ouvertes (open data).

Coorganisateur de la journée, Marc Lipinski, conseiller régional d'Ile-de-France et directeur de recherche au CNRS, analyse les enjeux de cette démarche de recherche coopérative qui questionne les pratiques actuelles et doit selon lui être prise en considération par les institutions. Vous organisez cette rencontre sur l'ouverture des données massives scientifiques avec Mélanie Dulong de Rosnay dans le cadre de la mission "sciences citoyennes" que vous a confiée le CNRS en 2013. Quel était votre cahier des charges ? Comment montrer aux scientifiques l'avantage de telles pratiques mais aussi leur fiabilité ? Rap1A : Ouverture des données massives scientifiques.Quels risques, quels bénéfices ? Vendredi 6 décembre 2013, 10h à 18h, ISCC. Ouverture des données massives scientifiques.

Quels risques, quels bénéfices ? Vendredi 6 décembre 2013, 10h à 18h, ISCC Contexte Début 2013, le CNRS a confié à Marc Lipinski une mission sur la thématique Sciences et Citoyens qui s’inscrit dans une tradition ancienne de l’organisme. De plus longue date encore, les amateurs ont participé à la collecte et à l’analyse de spécimens et de données à caractère scientifique. Programme 9h – Accueil 9h30 – Introduction Mélanie Dulong de Rosnay, chargée de recherche CNRS, Institut des sciences de la communication du CNRS (ISCC), chercheuse invitée à la London School of Economics, Department of Media and Communications 2013-2015 Marc Lipinski, directeur de recherche CNRS 10h – Table ronde : Big data scientifiques, quid novi ? Compte-rendu de la table ronde (rtf) 12h30 – Déjeuner libre 13h45 – Table ronde : Pour ou contre ? 15h45 – Pause 16h15 – Table ronde : Dataviz, pour quel buzz ? 18h15 – Fin de la journée Informations pratiques Contact Anne Demonceaux.

Rap2 : Big data, l’illusoire exhaustivité pp. 10-11. Rap3 : Du Big Data au service de la recherche scientifique. La Maison Blanche a annoncé qu’elle allait consacrer 200 millions de dollars pour créer des outils capables d’analyses de très gros volumes de données afin ainsi d’améliorer la recherche scientifique aux Etats-Unis. Les technologies de stockage et d’analyse de grands volumes de données sont désormais désignées par le terme de « Big Data ». L’administration américaine souhaite donc exploiter ces solutions et en concevoir de nouvelles au service de la science. Objectifs : exploiter les données et former les chercheurs « L’initiative que nous lançons aujourd’hui promet de transformer notre capacité à utiliser le Big Data pour la découverte scientifique, la recherche environnementale et biomédicale, l’éducation et la sécurité nationale » commente John Holdren, directeur du bureau des sciences et technologies à la Maison Blanche.

Dans le cadre des investissements d’avenir, un appel à projets dans le Big Data a été lancé en France. Rap4 : Federation Of American Scientists. While others speak of curbing intelligence surveillance activities, the Defense Science Board argues in a new report that the U.S. government should expand and accelerate global monitoring for purposes of detecting nuclear proliferation as “a top national security objective.” Intelligence techniques and technologies that are used to combat terrorism should also be harnessed to address the threat of proliferation, said the new DSB report, entitled “Assessment of Nuclear Monitoring and Verification Technologies,” January 2014.

“The advances in persistent surveillance, automated tracking, rapid analyses of large and multi-source data sets, and open source analyses to support conventional warfighting and counterterrorism have not yet been exploited by the nuclear monitoring community…. New intelligence, surveillance, and reconnaissance (ISR) technologies, demonstrated in recent conflicts, offer significant promise for monitoring undesirable nuclear activity throughout the free world.”

Related. Rap5 : Technologies de l'information et de la communication - T.I.C. Activités Le programme Technologies de l'information et de la communication comprend six activités : nouvelle génération de composants et systèmes : ingénierie des systèmes embarqués et de composants et systèmes à faible consommation d'énergie ;calcul de nouvelle génération : systèmes et technologies de calcul avancés, inclus l'informatique en nuage ;internet du futur : infrastructures, technologies et services ;technologies pour le contenu et gestion de l'information : TIC pour le contenu digital et la créativité,interfaces avancées et robotique ;technologies clés génériques (KET) liées à la micro et nanoélectronique et la photonique. Toujours géré par la D.G. CONNECT de la Commission européenne, ce programme connaît, avec Horizon 2020, deux évolutions majeures par rapport au 7ème P.C.R.D.T le programme T.I.C. est recentré autour de son cœur technologique.

Evolutions Remplacement d'ENIAC et Artemis Autres P.P.P. Rap6 : Linear Probability Models (LPM) and Big Data: The Good, the Bad, and the Ugly by Suneel Chatla, Galit Shmueli. Suneel Chatla Indian School of Business (ISB), Hyderabad Galit Shmueli Indian School of BusinessNovember 13, 2013 Indian School of Business Research Paper Series Abstract: Sizes of datasets used in academic research are growing quickly, with many studies using tens and hundreds of thousands or even millions of records. Number of Pages in PDF File: 40 Keywords: linear regression, binary outcome, estimation, prediction, weighted least squares, large sample, online auctions, eBay working papers series. Économie. Rec1 : Big Data - Partie 2 : Le quatrième paradigme de la science.

Sciences et technologies de l'information et de la communication Big Data - Partie 2 : Le quatrième paradigme de la science La Science est probablement le domaine dans lequel le Big Data aura entraîné le plus de bouleversements. Les projets de recherche scientifique mettent aujourd'hui en jeu des quantités gigantesques de données. L'accélérateur européen de particules LHC (Large Hadron Collider) produit chaque jour 40.000 Go de données. La bibliothèque médicale PubMed [1] contient plus de 22 millions de publications accessibles gratuitement en ligne, et 40.000 à 50.000 de plus viennent s'y ajouter chaque mois.

Un nouveau paradigme : Le livre de Tony Hey " The fourth paradigm : Data-intensive scientific discovery " [2] raconte comment le Big Data a fait entrer la science dans une nouvelle ère. => 1. => 2. => 3. => 4. Quelques exemples : => Dans la génomique : => En astrophysique : A lire également : Rec2 : L'Allemagne intensifie la recherche dans le Big Data. TIC - spécial CeBITL'Allemagne intensifie la recherche dans le Big Data A l'occasion du lancement de l'édition 2014 du CeBIT [1], le Ministère fédéral allemand de l'enseignement et de la recherche (BMBF) a annoncé sa volonté de soutenir la recherche dans le domaine du Big Data. La Ministre, Johanna Wanka, a en effet annoncé la création prochaine de deux centres de recherche consacrés à l'exploitation des données massives.

Le Berlin Big Data Center (BBDC), rattaché à l'Université technique de Berlin (TUB), ainsi que le Competence Center for Scalable Data Services and Solutions (ScaDS) de l'Université technique de Dresde (TUD, Saxe) devraient ainsi voir le jour cette année. Une enveloppe globale de 10 millions d'euros est prévue pour financer ces deux centres. Pour expliquer ce choix, Johanna Wanka avance que "dans nos sociétés numériques, les quantités de données disponibles augmentent rapidement.

Contre. Rc1 : “big data hubris” Over the past few decades, researchers in a variety of fields have had to come to grips with analyzing massive data sets. These can be generated intentionally, through things like astronomy surveys and genome sequencing, or they can be generated incidentally—through things like cell phone records or game logs. The developments of algorithms that successfully pull information from these masses of data has led some of the more enthusiastic proponents of big data to argue that it will completely change the way science is done (one even argued that big data made the scientific method obsolete).

In today's issue of Science, however, a group of scientists throw a bit of cold water on the big-data hype, in part by noting that one of the publicly prominent examples of massive data analysis, Google Flu Trends, isn't actually very good. Not so trendy Their analysis builds on an earlier report from Nature News that highlights a few clear failures of Google Flu Trends. Thinking big. Rc2 : Six Provocations for Big Data. Danah boyd Microsoft Research; New York University (NYU) - Department of Media, Culture, and Communication; University of New South Wales (UNSW); Harvard University - Berkman Center for Internet & Society Kate Crawford Microsoft Research; MIT Center for Civic Media; University of New South Wales (UNSW)September 21, 2011 A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, September 2011 Abstract: The era of Big Data has begun.

This essay offers six provocations that we hope can spark conversations about the issues of Big Data. (This paper was presented at Oxford Internet Institute’s “A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society” on September 21, 2011.) Number of Pages in PDF File: 17 Keywords: Big Data, methodology, sociology, computer science, analysis working papers series Suggested Citation boyd, danah and Crawford, Kate, Six Provocations for Big Data (September 21, 2011). Rc3 : Data Mining Difference in the Age of Big Data. Data Mining Difference in the Age of Big Data: Communication and the Social Shaping of Genome Technologies from 1998 to 2007 Peter A. Chow-White, Sandy Green, Jr. Abstract If the 1990s was all about the information superhighway and the network society, then the first 10 years of the 21st century is perhaps best described as the decade of data.

Actors in different enterprises worked feverishly to develop innovative database and data mining technologies for institutional goals such as marketing, social networking, and scientific discovery. Programmes. Big data. Rbd1 : Conducting Research on the Internet and its Governance. Rbd2 : Disques optiques numériques, recherche sur la conservation des données. L'origine du GIS : un constat mitigé sur la qualité d'archivage des DON Toutes les activités humaines engendrent au quotidien un nombre croissant de documents de toute sorte : textes, documents sonores ou visuels, données. A cette abondante production s'ajoutent les produits de tous les efforts de rétronumérisation qui sont faits dans le monde entier, afin de rendre les documents anciens plus facilement consultables et indexables.

Il y a là un patrimoine qui est le résultat d'un investissement considérable et qu'il est important de conserver pour les générations futures. Or nous nous trouvons devant un constat très alarmant : si l'utilisation du numérique est extrêmement commode pour stocker de très grandes quantités de données, ce stockage est fait sur des supports physiques et chimiques dont la durée de vie est relativement courte, car ils n'ont pas été conçus pour durer longtemps. La constitution du Pôle Les 6 partenaires du GIS : Un pilotage assuré par un conseil scientifique. Big data. Rbd3 : Economie de la ville. Smart Data >> L’Institute for Data Science and Engineering se concentrera sur les villes intelligentes, les nouveaux médias, le traitement analytique médical, le traitement analytique financier et la cybersécurité. par Reena Jana Soutenue par une subvention de 15 millions de dollars récemment accordée par la ville de New York, l’université Columbia développe l’Institute for Data Science and Engineering (IDSE) afin d’approfondir le domaine de l’analyse des Big Data, les grandes quantités de données.

Annoncé cet été, ce nouvel institut est supervisé par l’école d’ingénieurs de Columbia. Ce dernier se concentrera sur cinq domaines : les villes intelligentes, les nouveaux médias, le traitement analytique médical, le traitement analytique financier et la cybersécurité, indique la revue Columbia. L’université s’est engagée à lever au moins 80 millions de dollars dans le secteur privé et à recruter 75 nouveaux professeurs et assistants pour l’institut d’ici 2030. À lire aussi.

Rbd4 : SAP Announces Plans for First Big Data Innovation Center and Innovation Lab With Universities. WALLDORF — SAP AG today announced the planned launch of its first Big Data innovation center in a cooperation between the SAP University Alliances program and the University Competence Center (UCC) location at Otto-von-Guericke University in Magdeburg, Germany. As part of this relationship, the company also announced the anticipated opening of the first SAP University Alliances Innovation Lab with the Institute of Enterprise Systems (InES) at the University of Mannheim.

Additional Big Data innovation centers at UCC locations and innovation labs at universities worldwide are planned. “SAP already offers the SAP HANA platform for teaching purposes at universities,” said Dr. Bernd Welz, executive vice president, global head of Solution and Knowledge Packaging SAP. “With Big Data innovation centers at UCC locations, the company is planning to enable academics worldwide to leverage SAP HANA to re-invent business processes based on new Big Data applications.

Rbd5 : Big data et recherche : un partenariat indispensable avec les entreprises. Céline Authemayou | Publié le , mis à jour le Qui dit sujet naissant dit perspectives de recherche foisonnantes. Les établissements l’ont bien compris et les laboratoires dédiés aux mathématiques appliquées et à la statistique se sont emparés du big data depuis plusieurs années.

À Télécom ParisTech, le LTCI (Laboratoire traitement et communication de l'information) travaille notamment sur le sujet, ce qui permet aux enseignants-chercheurs de nourrir et de faire évoluer constamment leurs cours. “Le big data est un sujet nouveau, note Stéphan Clémençon, enseignant-chercheur au sein du LTCI. Il est donc indispensable que la recherche soit très active. Entre recherche fondamentale et recherche appliquée, les établissements semblent avoir trouvé un équilibre. Nous sommes convaincus qu'il n'y a pas de création de valeur sans les universitaires (J. Les chaires, un lien privilégié En matière de recherche partenariale, la chaire d'entreprise constitue une option prisée par les écoles. Rbd6 : Simplexité des Big Data : la simplicité au service de la complexité.

Rbd7 : Portail TeraLab DataScience - Accueil d la plateforme TeraLab. Rbd8 : Data Viz Collaborative. Rbd9 : Smarter Than Us. Rbd10 : Les activités de recherche au coeur du Big Data en école d'ingénieurs. Programmes. Humanités. Rh1 : Digital Humanities. Rh2 : Humanités numériques : une exploration des pratiques. Rh3 : Laboratoire de cultures et humanités digitales - LADHUL UNIL. Rh4 : Social Science in the Era of Big Data. Rh5 : Our Mission | ADHO. Rh6 : Pour une sociologie des situations révolutionnaires. Rh7 : Taming Big Data: Using App Technology to Survey Social Media Users. Rh8 : Patrick Manning, Big Data in History. Rh9 : Communiquer à l'ère numérique. Regards croisés sur la sociologie des usages. Sciences du vivant. Rsv1 : Big data ? Rsv1A : L'axe Bio-imagerie | Biogenouest. Rsv1B : L'axe Analyse structurale et métabolomique | Biogenouest.

Rsv1C : L'axe Bio-informatique | Biogenouest. Rsv1D : L'axe Exploration fonctionnelle | Biogenouest. Rsv1E : L'axe Protéomique | Biogenouest. Rsv1F : L'axe Génomique | Biogenouest. Rsv1G : Autres réseaux | Biogenouest. Rsv2 : Parler aux animaux grâce aux Big Data. Rsv3 : Hacking génétique & Souris mangeuses de scorpions. Rsv4 : GenBank Home.

Rsv4A : Home - Nucleotide - NCBI. Rsv4B : Home - GSS - NCBI. Rsv4C : Home - EST - NCBI. Santé médecine. Rs1 : Recherche & innovation. Rs2 : niche VS Big data. Rs3 : Crowdsourcing & Big data. Rs3A : Immunity Project. Rs4 : brainSCANr. Astrophysique. Ras2 : Sloan Digital Sky Survey. Ras1 : SKA The Square Kilometre Array. Ras1A : IBM va traiter les big data d'un radiotélescope dédié au Big Bang.

Ras3 : LSST The New Sky. Environnement. Ren1 : Bâtiments UB. Ren2 : Disaster Management. Ren3 : The Real-Time City? Big Data and Smart Urbanism by Rob Kitchin. Ren4 : services publics. Ren5 : Réseaux véhiculaires intelligents INRIA, prix Lamb 2012. Autres. Rau1 : Design science approach. Rau2 : Taxation. Rau3 : Big Thinking.

Rau4 : Géographie.