background preloader

Généralités big data

Facebook Twitter

G1 : Big data. Un article de Wikipédia, l'encyclopédie libre.

G1 : Big data

Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. G2 : Réseau de neurones artificiels.

Un article de Wikipédia, l'encyclopédie libre.

G2 : Réseau de neurones artificiels

Un réseau de neurones artificiels est un modèle de calcul dont la conception est très schématiquement inspirée du fonctionnement des neurones biologiques. Les réseaux de neurones sont généralement optimisés par des méthodes d’apprentissage de type probabiliste, en particulier bayésien. Ils sont placés d’une part dans la famille des applications statistiques, qu’ils enrichissent avec un ensemble de paradigmes [1] permettant de créer des classifications rapides (réseaux de Kohonen en particulier), et d’autre part dans la famille des méthodes de l’intelligence artificielle auxquelles ils fournissent un mécanisme perceptif indépendant des idées propres de l'implémenteur, et fournissant des informations d'entrée au raisonnement logique formel. Économie. Officiel. Gec1 : Concours Innovation 2030 : premiers résultats.

Gec2 : Challenges « big data » (appel à manifestations d’intérêt) L’augmentation considérable du volume et de la diversité des données numériques générées, couplée aux technologies d’analyse du big data, offre d’importantes opportunités de création de valeur pour les sociétés de nombreux secteurs économiques.

Gec2 : Challenges « big data » (appel à manifestations d’intérêt)

Pour dynamiser l’écosystème big data, il apparaît comme important de rassembler les entreprises, ou entités publiques, détenant des données exploitables, d’une part, et les startups ou PME ayant une grande expertise sur le big data, d’autre part. Privé. Gec3 : Marché big data. Gec4 : modèle de croissance ? Le29 avril 2013, EcoFutur consacrait sa une à l’«open data».

Gec4 : modèle de croissance ?

Autrement dit, à l’existence de «la masse infinie d’informations brutes désormais accessibles au public via Internet et que les start-up s’empressent d’exploiter». Presqu’un an plus tard, le monde numérique ne parle - presque - plus que de son rejeton : le «big data». Et de sa montée en puissance dans le business des mastodontes mondiaux du Web. Les Google, Facebook et Amazon qui collectent chaque jour des millions de données se sont rendu compte qu’ils étaient assis sur de d’or. A condition de savoir collecter, stocker et traiter massivement ces fameuses datas produites par les consommateurs et les entreprises sur la Toile. Jeudi, l’Atelier BNP-Paribas, un think tank qui se consacre aux stratégies numériques logé au Numa dans le Silicon Sentier parisien, a anticipé l’événement en organisant une session d’information et de réflexion intitulée: «Big data, big economy ?» Gec5 : Les progrès de l’analyse des données.

La démultiplication des outils de collecte de données (comme le web ou nos téléphones mobiles qui enregistrent très facilement nos déplacements, mais également nos actions, nos relations…) et l’amélioration des outils d’analyses de données offrent aux entreprises des moyens marketing de plus en plus inédits, estime Lee Gomes pour la Technology Review.

Gec5 : Les progrès de l’analyse des données

Et de donner un exemple simple et frappant : celui des Giants de San Francisco, l’équipe de baseball américain championne du monde et championne de la ligue nationale, qui a mis en place une tarification dynamique mise au point par Qcue, permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir).

Une tarification dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010. Vers le commerce algorithmique. Gec6 : Nouveau graal de l'informatique. Tous les acteurs du secteur investissent ce créneau, qui affiche un taux de croissance insolent de 40 %. 2014 sera l'année des systèmes d'analyse des données informatiques, dits de «big data».

Gec6 : Nouveau graal de l'informatique

Dans les allées du salon Big Data Paris, qui se tient mardi et mercredi, tous les participants en sont intimement convaincus. Ce n'est pas un hasard si ce secteur figure parmi les 34 plans de reconquête pour la «Nouvelle France industrielle» lancés en septembre dernier par Arnaud Montebourg. IDC estime que le poids des technologies et services liés à l'analyse et l'exploitation des données en grandes quantités en temps réel atteindra 16,9 milliards au niveau mondial en 2015, alors que ce marché ne dépassait pas 3,2 milliards de dollars en 2010. En France, il est estimé à seulement 387 millions d'euros en 2013 mais c'est un des créneaux les plus prometteurs du secteur, avec un taux de croissance de 40 % par an.

Divers. Gd1 : Un très gros business. Vous êtes agacé par ces pubs et ces promos qui vous poursuivent sur le web dès que vous avez consulté un site marchand ?

Gd1 : Un très gros business

Les commerçants en ligne qui vous souhaitent votre anniversaire par e-mail ou SMS vous irritent ? Vous n'avez encore rien vu ! Car voici que nous arrive des Etats-Unis la révolution du "big data". Grâce au traitement de "données massives" rendu possible par des logiciels et des ordinateurs surpuissants, vous serez bientôt repéré, observé, ciblé, "profilé" dans tous les compartiments de votre existence. Une masse insoupçonnée d'informations qui vous concernent pourront être extraites, recoupées et analysées par votre banquier, votre assureur, vos fournisseurs de gaz et d'électricité, vos magasins et marques habituels... mais aussi par votre municipalité, votre caisse de Sécurité sociale ou votre direction des impôts. Pour le meilleur ou pour le pire, vous deviendrez un "nuage" de données, sans cesse passé à la moulinette des algorithmes d'extraction (data mining).

Gd2 : Informatisation du monde. Gd3 : Série Arte. Gd3vol.I : Série Arte n°1 - Des données à vitesse grand V. Dans quel domaine la vitesse liée au Big Data se manifeste-t-elle le plus aujourd’hui ?

Gd3vol.I : Série Arte n°1 - Des données à vitesse grand V

Les analystes de Big Data font des projections à partir desquelles des êtres humains, mais aussi des machines, peuvent prendre des décisions. Et cela nous permet d’accélérer le processus de décision de telle sorte que sur le marché du comptant à Wall Street, des milliards de décisions peuvent être prises en l’espace d’une seconde. Google est aussi un exemple parlant : sur la page d’accueil, on voit à droite des annonces payantes et, en haut, des liens sponsorisés. Ces espaces publicitaires sont vendus aux enchères en temps réel, en fonction de la nature de la recherche lancée par l’internaute. Google fait alors une offre sur le marché qui est évaluée par d’autres algorithmes, qui décident alors d’acheter ou non cet espace. Gd3vol.II : Série Arte n° 2 - Bienvenue dans le monde des yottaoctets. ARTE Future : Comment définissez-vous le phénomène du Big Data ?

Gd3vol.II : Série Arte n° 2 - Bienvenue dans le monde des yottaoctets

Evgeny Morozov : Je donnerais une définition standard : il s’agit de données trop complexes ou volumineuses pour pouvoir être traitées par des systèmes informatiques et bases de données standard. C’est la première définition utilisée par certains acteurs de l’industrie de l’informatique. Depuis lors, les limites de cette expression se sont élargies. Gd3vol.III : Série Arte n°3 - Moi, l'octet.

« Nous devons nous battre pour avoir la propriété de nos données » Un millier d’étudiants de l’université technique danoise (DTU) de Copenhague reçoivent, ces jours-ci, un Smartphone Google flambant neuf.

Gd3vol.III : Série Arte n°3 - Moi, l'octet

Un cadeau certes, mais avec un gros bémol : il est placé sous la surveillance illimitée de l’université. Espionner les Big Data fait partie du projet « Sensible DTU », qui se propose de réaliser une analyse interdisciplinaire de notre comportement social à partir de nos données personnelles. A l’origine de l’étude : un professeur d’informatique, Sune Lehmann, (@sunemann) et un doctorant, Arek Stopczynski, (@h0pbeat). Lors d’une interview via Skype réalisée par ARTE Future, les deux chercheurs expliquent comment et pourquoi ils surveillent leurs étudiants - et ce que signifie la sphère privée à l’ère des Smartphones. ARTE Future : Sune Lehmann, Arek Stopczynski, jusqu’où va la surveillance de vos étudiants ? Qu’est-ce que vous en attendez ? S. Gd4 : « Big data » : Trois défis pour les maths.

LE MONDE SCIENCE ET TECHNO | • Mis à jour le | David Larousserie C’est un déluge. Gd5 : traitement analytique bancaire. La Royal Bank of Scotland (RBS), qui génère de copieux volumes de données avec plus de 400 transactions d'agences par seconde pour les entreprises, vient de déployer un entrepôt de données parallèle exclusivement dédié au Big data. Les équipes chargées du traitement analytique ont besoin de cette infrastructure dédiée, sous peine d'être freinées par leur propre département informatique, prévient le responsable de l'analyse des données de RBS. "Les fonctions technologiques ont encore du mal à suivre le rythme des demandes des entreprises. En tant qu'acteur et responsable du traitement analytique, je ne peux pas permettre qu'il en soit ainsi", déclare Alan Grogan, (photo ci-contre) responsable du traitement analytique pour la division Customer Solutions Group de RBS.

"Je ne peux pas me tourner vers mon PDG ou vers mes clients et leur dire que je suis désolé, mais que nous n'avons pas l'évolutivité, la flexibilité ou le contrôle suffisants dans ce domaine. " "Nous avions ce problème avant. Conférences programmes. Gd6 : sciences et techniques. Gd7 : Flux d’information et constitution des connaissances scientifiques. Gd7A : Ecole thématique Flux d'information.

Gd8 : Une amnésie programmée ? CNAM. Photos de famille, documents administratifs, articles de presse ou les giga, téra, voire pétaoctets de données issus des « Big Data »… Que laisserons-nous aux générations futures ? Alors que notre mémoire a inexorablement migré vers le numérique, nous prenons tout juste conscience de la fragilité de ce patrimoine immatériel. Si l’information numérique se recopie sans erreur pratiquement à l’infini, aucun support ne peut actuellement garantir la conservation de l’information au-delà de quelques années. Mauvaise manip ou bug du disque dur, obsolescence des matériels et logiciels, vieillissement spontané des supports… notre mémoire n’est plus gravée dans le marbre.

Tout objet numérique abandonné à lui-même risque d’être définitivement perdu. Contraint par sa faible espérance de vie, il semble donc condamné à migrer sans cesse vers de nouveaux supports. Gd9 : Bar des Sciences: Débat sur le Big Data. Le Cœur des Sciences, à Université du Québec à Montréal, organise le 13 février prochain, à 18h, un débat grand public sur le Big Data, dans le cadre d’un bar des sciences, auquel je devrais participer, avec Vincent Gautrais (a.k.a. @gautrais), Yves-Alexandre de Montjoye (a.k.a. @yvesalexandre) et Jean-Hughes Roy (a.k.a. @jeanhuguesroy). Les mauvaises langues diront que je n’aurais pas pu refuser d’intervenir dans un bar (et elles n’auront probablement pas tort). Cela dit, le public ne semble plus autorisé : dans les heures qui ont suivi l’annonce, l’événement a été complet !

Je vais en profiter, aujourd’hui, pour livrer quelques éléments de réflexion… les commentaires sont ouverts, mais la suite du débat se fera au Cœur des Sciences (j’essayerais de faire un résumé sur le blog). Pour avoir discuté avec de nombreux professionnels, dans l’industrie, qui manipulent des données quotidiennement, je les ai vu passer par les cinq grandes étapes décrites par Zubin Dowalty, . . Gd10 : Traitement analytique. SAS, votre atout performance Prenez de meilleures décisions plus rapidement SAS vous aide à résoudre vos problèmes complexes, atteindre vos objectifs clés et exploiter plus efficacement vos données. Gd11 : Journée de rencontre Big Data. Gd12 : Kernel methods for big data Lille 2014. Gd13 : MOOC : quels enjeux pour les acteurs du marché de l’information et de la connaissance ? - Journée d'étude. S'inscrire en ligne à l'événement Mercredi 18 Juin 2014 - de 9h à 17hINRA, 147 rue de l'Université, Paris 7ème Mercredi 18 Juin 2014 - de 9h à 17h30INRA, Paris Le GFII vous convie à sa prochaine journée d'étude.

Conférences. Gd16 : Archives de la recherche. Conférences synthèse. Gd14 : Synthèse groupement français de l'industrie de l'information. Gd15 : Inria : ” Données massives : nouvelles partitions de l’information” Le thème du “Big Data” est souvent traité ces temps-ci, mais rarement du point de vue des professionnels de l’information et de la documentation : c’est cette lacune que le séminaire 2014 va tenter de combler. Le lieu n’est pas encore connu, les inscriptions ne sont pas encore ouvertes, mais réservez la date ! Gd15A : Publication actes. Gd17 : Édition: quelle valeur ont les données? Gd17A : Edition: quelle valeur ont les données? Synthèse. Dans le cadre de la Social Media Week, le Labo de l’édition organisait une conférence-débat mardi 19 février 2013 sur le thème « Edition : quelle valeur ont les données ?

" . La Social Media Week est une semaine de débats et conférences sur les enjeux du web, dédiés cette année au thème « Open & Connected ». Publications hors conf. Gpu1 : La recherche revue. Gpu2 : Révolution des données. Gpu3 : Enjeux et usages. Gpu4 : Regards sur le numérique. Gpu4A : Que faire avec les big data ?

Data centers. Gdc1 : Stockage écologique. Gdc2 : Data Center Knowledge. Gdc3 : Google montre à quoi ressemblent ses entrailles. Gdc4 : Datacenter d'Orange. Pro. Gpro1 : structurer sans conserver. Gpro1A : TEMIS. Gpro2 : gouvernance doc. Archimag n° 256. Gpro3 : L’ingénierie documentaire : un métier d’avenir. Gpro4 : Alliance Big Data. Gd5 : quels rôles pour les doc.