background preloader

Généralités big data

Facebook Twitter

G1 : Big data. Un article de Wikipédia, l'encyclopédie libre.

G1 : Big data

Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15].

Volume[modifier | modifier le code] Variété[modifier | modifier le code] G2 : Réseau de neurones artificiels. Un article de Wikipédia, l'encyclopédie libre.

G2 : Réseau de neurones artificiels

Un réseau de neurones artificiels est un modèle de calcul dont la conception est très schématiquement inspirée du fonctionnement des neurones biologiques. Les réseaux de neurones sont généralement optimisés par des méthodes d’apprentissage de type probabiliste, en particulier bayésien. Ils sont placés d’une part dans la famille des applications statistiques, qu’ils enrichissent avec un ensemble de paradigmes [1] permettant de créer des classifications rapides (réseaux de Kohonen en particulier), et d’autre part dans la famille des méthodes de l’intelligence artificielle auxquelles ils fournissent un mécanisme perceptif indépendant des idées propres de l'implémenteur, et fournissant des informations d'entrée au raisonnement logique formel.

En modélisation des circuits biologiques, ils permettent de tester quelques hypothèses fonctionnelles issues de la neurophysiologie, ou encore les conséquences de ces hypothèses pour les comparer au réel. Économie. Officiel. Gec1 : Concours Innovation 2030 : premiers résultats. Gec2 : Challenges « big data » (appel à manifestations d’intérêt)

L’augmentation considérable du volume et de la diversité des données numériques générées, couplée aux technologies d’analyse du big data, offre d’importantes opportunités de création de valeur pour les sociétés de nombreux secteurs économiques.

Gec2 : Challenges « big data » (appel à manifestations d’intérêt)

Pour dynamiser l’écosystème big data, il apparaît comme important de rassembler les entreprises, ou entités publiques, détenant des données exploitables, d’une part, et les startups ou PME ayant une grande expertise sur le big data, d’autre part. Privé. Gec3 : Marché big data. Gec4 : modèle de croissance ? Le29 avril 2013, EcoFutur consacrait sa une à l’«open data».

Gec4 : modèle de croissance ?

Autrement dit, à l’existence de «la masse infinie d’informations brutes désormais accessibles au public via Internet et que les start-up s’empressent d’exploiter». Presqu’un an plus tard, le monde numérique ne parle - presque - plus que de son rejeton : le «big data». Et de sa montée en puissance dans le business des mastodontes mondiaux du Web. Les Google, Facebook et Amazon qui collectent chaque jour des millions de données se sont rendu compte qu’ils étaient assis sur de d’or. A condition de savoir collecter, stocker et traiter massivement ces fameuses datas produites par les consommateurs et les entreprises sur la Toile. Jeudi, l’Atelier BNP-Paribas, un think tank qui se consacre aux stratégies numériques logé au Numa dans le Silicon Sentier parisien, a anticipé l’événement en organisant une session d’information et de réflexion intitulée: «Big data, big economy ?»

Philippe BROCHEN. Gec5 : Les progrès de l’analyse des données. La démultiplication des outils de collecte de données (comme le web ou nos téléphones mobiles qui enregistrent très facilement nos déplacements, mais également nos actions, nos relations…) et l’amélioration des outils d’analyses de données offrent aux entreprises des moyens marketing de plus en plus inédits, estime Lee Gomes pour la Technology Review.

Gec5 : Les progrès de l’analyse des données

Et de donner un exemple simple et frappant : celui des Giants de San Francisco, l’équipe de baseball américain championne du monde et championne de la ligue nationale, qui a mis en place une tarification dynamique mise au point par Qcue, permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir). Une tarification dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010. Vers le commerce algorithmique. Gec6 : Nouveau graal de l'informatique. Tous les acteurs du secteur investissent ce créneau, qui affiche un taux de croissance insolent de 40 %. 2014 sera l'année des systèmes d'analyse des données informatiques, dits de «big data».

Gec6 : Nouveau graal de l'informatique

Dans les allées du salon Big Data Paris, qui se tient mardi et mercredi, tous les participants en sont intimement convaincus. Ce n'est pas un hasard si ce secteur figure parmi les 34 plans de reconquête pour la «Nouvelle France industrielle» lancés en septembre dernier par Arnaud Montebourg. Divers. Gd1 : Un très gros business. Vous êtes agacé par ces pubs et ces promos qui vous poursuivent sur le web dès que vous avez consulté un site marchand ?

Gd1 : Un très gros business

Les commerçants en ligne qui vous souhaitent votre anniversaire par e-mail ou SMS vous irritent ? Vous n'avez encore rien vu ! Car voici que nous arrive des Etats-Unis la révolution du "big data". Grâce au traitement de "données massives" rendu possible par des logiciels et des ordinateurs surpuissants, vous serez bientôt repéré, observé, ciblé, "profilé" dans tous les compartiments de votre existence. Une masse insoupçonnée d'informations qui vous concernent pourront être extraites, recoupées et analysées par votre banquier, votre assureur, vos fournisseurs de gaz et d'électricité, vos magasins et marques habituels... mais aussi par votre municipalité, votre caisse de Sécurité sociale ou votre direction des impôts.

Pour le meilleur ou pour le pire, vous deviendrez un "nuage" de données, sans cesse passé à la moulinette des algorithmes d'extraction (data mining). Gd2 : Informatisation du monde. Viktor Mayer-Schönberger, professeur à l'Oxford internet Institute, et Kenneth Cukier, responsable des données pour The Economist ont récemment publié Big Data : une révolution qui va transformer notre façon de vivre, de travailler et penser (le site dédié).

Gd2 : Informatisation du monde

Ce livre est intéressant à plus d'un titre, mais avant tout pour ce qu'il nous apprend du changement du monde en cours. Riche d'exemples, facilement accessibles, il dresse un état compréhensible des enjeux des Big Data en insistant notamment sur ce que cette nouvelle étape de l'informatisation transforme. Le code n'est plus la loi ! Gd3 : Série Arte. Gd3vol.I : Série Arte n°1 - Des données à vitesse grand V. Dans quel domaine la vitesse liée au Big Data se manifeste-t-elle le plus aujourd’hui ?

Gd3vol.I : Série Arte n°1 - Des données à vitesse grand V

Les analystes de Big Data font des projections à partir desquelles des êtres humains, mais aussi des machines, peuvent prendre des décisions. Et cela nous permet d’accélérer le processus de décision de telle sorte que sur le marché du comptant à Wall Street, des milliards de décisions peuvent être prises en l’espace d’une seconde. Google est aussi un exemple parlant : sur la page d’accueil, on voit à droite des annonces payantes et, en haut, des liens sponsorisés. Gd3vol.II : Série Arte n° 2 - Bienvenue dans le monde des yottaoctets. ARTE Future : Comment définissez-vous le phénomène du Big Data ?

Gd3vol.II : Série Arte n° 2 - Bienvenue dans le monde des yottaoctets

Evgeny Morozov : Je donnerais une définition standard : il s’agit de données trop complexes ou volumineuses pour pouvoir être traitées par des systèmes informatiques et bases de données standard. C’est la première définition utilisée par certains acteurs de l’industrie de l’informatique. Depuis lors, les limites de cette expression se sont élargies. A présent, tous les types d’ensembles de données qui contiennent plus d’une variable et plus d’une ligne de données sont considérés, pour une raison ou une autre, comme des Big Data. Ainsi, les tableaux et feuilles de calcul que vous avez sous Excel se transforment comme par magie en Big Data, ce qui ne me paraît pas très pertinent pour poursuivre les analyses ; mais c’est malheureusement ainsi qu’évolue le débat public sur le Big Data.

Essayez-vous parfois d’imaginer l’ampleur réelle du Big Data aujourd’hui ? Gd3vol.III : Série Arte n°3 - Moi, l'octet. « Nous devons nous battre pour avoir la propriété de nos données » Un millier d’étudiants de l’université technique danoise (DTU) de Copenhague reçoivent, ces jours-ci, un Smartphone Google flambant neuf. Un cadeau certes, mais avec un gros bémol : il est placé sous la surveillance illimitée de l’université. Espionner les Big Data fait partie du projet « Sensible DTU », qui se propose de réaliser une analyse interdisciplinaire de notre comportement social à partir de nos données personnelles. A l’origine de l’étude : un professeur d’informatique, Sune Lehmann, (@sunemann) et un doctorant, Arek Stopczynski, (@h0pbeat).

Lors d’une interview via Skype réalisée par ARTE Future, les deux chercheurs expliquent comment et pourquoi ils surveillent leurs étudiants - et ce que signifie la sphère privée à l’ère des Smartphones. Gd4 : « Big data » : Trois défis pour les maths. LE MONDE SCIENCE ET TECHNO | • Mis à jour le | David Larousserie C’est un déluge. Un mot nouveau envahit le monde : « big data ».

Selon le moteur de recherche Google, les requêtes en France sur ce terme ont plus que décuplé entre décembre 2011 et décembre 2013. La définition n’est pourtant pas si folichonne : le terme désigne la collecte, l’exploration et l’analyse de grandes masses de données. Des chiffres, des textes ou des images, mais aussi des gènes, des étoiles, des particules ou des traces de trafic routier… Par « grand », chacun entend ce qu’il veut. La popularité du mot est en fait moins liée à la fascination pour les grands nombres qu’aux promesses et réalités du concept. Gd5 : traitement analytique bancaire. La Royal Bank of Scotland (RBS), qui génère de copieux volumes de données avec plus de 400 transactions d'agences par seconde pour les entreprises, vient de déployer un entrepôt de données parallèle exclusivement dédié au Big data. Les équipes chargées du traitement analytique ont besoin de cette infrastructure dédiée, sous peine d'être freinées par leur propre département informatique, prévient le responsable de l'analyse des données de RBS.

"Les fonctions technologiques ont encore du mal à suivre le rythme des demandes des entreprises. En tant qu'acteur et responsable du traitement analytique, je ne peux pas permettre qu'il en soit ainsi", déclare Alan Grogan, (photo ci-contre) responsable du traitement analytique pour la division Customer Solutions Group de RBS. "Je ne peux pas me tourner vers mon PDG ou vers mes clients et leur dire que je suis désolé, mais que nous n'avons pas l'évolutivité, la flexibilité ou le contrôle suffisants dans ce domaine. " "Nous avions ce problème avant. Conférences programmes. Gd6 : sciences et techniques. Gd7 : Flux d’information et constitution des connaissances scientifiques. Gd7A : Ecole thématique Flux d'information.

Gd8 : Une amnésie programmée ? CNAM. Photos de famille, documents administratifs, articles de presse ou les giga, téra, voire pétaoctets de données issus des « Big Data »… Que laisserons-nous aux générations futures ? Alors que notre mémoire a inexorablement migré vers le numérique, nous prenons tout juste conscience de la fragilité de ce patrimoine immatériel. Si l’information numérique se recopie sans erreur pratiquement à l’infini, aucun support ne peut actuellement garantir la conservation de l’information au-delà de quelques années. Mauvaise manip ou bug du disque dur, obsolescence des matériels et logiciels, vieillissement spontané des supports… notre mémoire n’est plus gravée dans le marbre.

Tout objet numérique abandonné à lui-même risque d’être définitivement perdu. Contraint par sa faible espérance de vie, il semble donc condamné à migrer sans cesse vers de nouveaux supports. Gd9 : Bar des Sciences: Débat sur le Big Data. Le Cœur des Sciences, à Université du Québec à Montréal, organise le 13 février prochain, à 18h, un débat grand public sur le Big Data, dans le cadre d’un bar des sciences, auquel je devrais participer, avec Vincent Gautrais (a.k.a. @gautrais), Yves-Alexandre de Montjoye (a.k.a. @yvesalexandre) et Jean-Hughes Roy (a.k.a. @jeanhuguesroy). Les mauvaises langues diront que je n’aurais pas pu refuser d’intervenir dans un bar (et elles n’auront probablement pas tort). Gd10 : Traitement analytique.

SAS, votre atout performance. Gd11 : Journée de rencontre Big Data. Gd12 : Kernel methods for big data Lille 2014. Gd13 : MOOC : quels enjeux pour les acteurs du marché de l’information et de la connaissance ? - Journée d'étude. S'inscrire en ligne à l'événement Mercredi 18 Juin 2014 - de 9h à 17hINRA, 147 rue de l'Université, Paris 7ème Mercredi 18 Juin 2014 - de 9h à 17h30INRA, Paris Le GFII vous convie à sa prochaine journée d'étude.

Conférences. Gd16 : Archives de la recherche. La conférence annuelle de la section des universités du Conseil international des Archives est organisée pour la première fois par la France en juillet 2014. Elle aura pour thème : les pratiques de collecte, de classement, d’identification, de conservation et de valorisation des données, documents et archives de la recherche. Le Conseil international des Archives (ICA) est une organisation neutre non-gouvernementale qui a pour objectif la gestion efficace des archives et la conservation, le traitement et l’utilisation du patrimoine archivistique mondial ; à ce titre, il représente les professionnels des archives du monde entier. L’ICA a pour mission de protéger et garantir l’accès aux archives : communication sur le métier, établissement de normes, professionnalisation des archivistes, la mise en oeuvre d’un dialogue entre archivistes, décideurs, producteurs et utilisateurs des archives.

Conférences synthèse. Gd14 : Synthèse groupement français de l'industrie de l'information. Gd15 : Inria : ” Données massives : nouvelles partitions de l’information” Gd15A : Publication actes. Gd17 : Édition: quelle valeur ont les données? Gd17A : Edition: quelle valeur ont les données? Synthèse. Publications hors conf. Gpu1 : La recherche revue. Gpu2 : Révolution des données. Gpu3 : Enjeux et usages. Gpu4 : Regards sur le numérique. Gpu4A : Que faire avec les big data ?

Data centers. Gdc1 : Stockage écologique. Gdc2 : Data Center Knowledge. Gdc3 : Google montre à quoi ressemblent ses entrailles. Le numéro un mondial de la recherche sur Internet s'est mis à photographier l'intérieur de ses centres de données et livre le résultat sur un site dédié. Ces quelques clichés permettent de mesurer, visuellement au moins, la démesure d'une société qui revendique rien de moins qu'être Internet. La démarche relève cependant de la pure opération communication pour la société, qui ne révèle rien d'autre que la dimensions esthétique de ses équipements, par exemple extrêmement gourmands en électricité. Combien savent à quoi ressemble, matériellement, Internet ?

Pour cela, Google a décidé d'exposer au monde ce qu'il décrit comme « l'intérieur d'Internet », les entrailles de la bête : ses Data Centers. Gdc4 : Datacenter d'Orange. Pro. Gpro1 : structurer sans conserver. Gpro1A : TEMIS. Gpro2 : gouvernance doc. Archimag n° 256. Gpro3 : L’ingénierie documentaire : un métier d’avenir. Gpro4 : Alliance Big Data. Gd5 : quels rôles pour les doc.