background preloader

Big Data

Facebook Twitter

Technologies Big Data

Qu'est ce que c'est ? Des centaines de bases MongoDB attaquées à cause de mauvaises configurations. Des centaines de bases de données MongoDB sont actuellement attaquées par un pirate, qui en remplace le contenu et demande une rançon. Une attaque qui ne se base sur aucun outil particulier, mais exploite des défauts de configuration. Un pirate, se faisant appeler Harak1r1, s’attaque actuellement à des centaines de bases de données MongoDB dans lesquelles certaines étapes simples de configuration n’ont pas été accomplies par les administrateurs. Ces bases sont ainsi laissées ouvertes aux quatre vents, ceux qui savent où chercher pouvant s’y connecter depuis Internet sans que des identifiants particuliers ne soient réclamés. Un vol de données contre une petite rançon en bitcoin L’attaque a été découverte il y a maintenant un peu plus d’une semaine par Victor Gevers de la GDI Foundation, et ne cesse depuis de faire des victimes.

Quand le chercheur s’est aperçu de la situation le 27 décembre, environ 400 bases avaient été attaquées. Le schéma d’attaque est simple. Qui est à blâmer ? Élection présidentielle : une analyse Big Data prédit les finalistes. Ils s’appellent Mohamed Al Ani, Davy Bensoussan, Alexandre Brehelin, Bertrand de Véricourt et Raphaël Vignes. Au lieu des sondages, ils ont décidé de s’appuyer sur une analyse Big Data pour une analyse de l’élection présidentielle à venir. Le résultat de leur expérience ? Marine Le Pen (24,13%) affrontera François Fillon (21,77%) au second tour. Comment ont-ils fait pour déduire ces scores, et pour retenir qu’Emmanuel Macron aura échoué sur la troisième marche du podium (20,32%) juste devant Jean-Luc Mélenchon (18,66%) ?

« Aujourd’hui les outils mathématiques et statistiques du big data ainsi que la démocratisation du partage de l'opinion grâce aux réseaux sociaux laissent bien moins de place à l'erreur », écrivent-ils dans un article publié sur Le Point. Ils sont d’ailleurs les premiers à rappeler que les sondages ne sont pas bons à jeter à la poubelle. Trois approches distinctes Combiner les trois approches.

Comment le Big Data améliore le modèle des objets connectés. Michael Bironneau est le directeur technologique d’Open Energi, une entreprise anglaise qui pose des systèmes de surveillance sur les équipements industriels (réfrigérateurs, pompes à eau, chaudrons à bitume...). Ces systèmes servent à mesurer la consommation électrique pour la remonter en temps réel au réseau national. Le but de ces objets connectés est de mieux répartir la distribution de courant sur le territoire britannique et baisser la facture des clients finaux.

Diviser par 5 le coût du stockage « Open Energi a été créée pour traiter des données et, en ce sens, l’arrivée continue de nouveaux outils Big Data améliore sans cesse notre activité. Au départ, nous stockions et traitions les données collectées par nos appareils dans une base SQL sur un SAN. Passer à un datalake Hadoop hébergé dans le cloud public Azure (que nous gérons avec l’outil CloudBreak d’Hortonworks), nous a d’abord permis de diviser par cinq le coût du stockage. Accélérer le déploiement de nouveaux algorithmes. Marketing et Big data : le passage obligé des PME et ETI pour concurrencer les grandes entreprises. Les données personnelles sont aujourd’hui au cœur de la connaissance client. Le Big data est un des enjeux majeurs du marketing qui révolutionne la connaissance du client et donc la façon dont les entreprises vont s’adresser à lui.

Il répond au besoin de mieux connaître les cibles pour adresser les bons messages et ainsi développer les performances commerciales. Si c'est gratuit, vous êtes le produit Avec l’explosion d’Internet, les sociétés du numérique comme les GAFA (Google, Amazon, Facebook, Apple) sont devenues les nouvelles championnes de la donnée. En proposant à des millions d’internautes des services à forte valeur ajoutée et gratuits, ils récoltent des données personnelles. La simple notion de données personnelles va désormais bien plus loin que les simples champs "sexe/âge/CSP", la connaissance client s’étend à chaque partie de la vie de l’internaute : des habitudes de consommation à la géolocalisation en passant par nos fréquentions, vacances et même projets de vie.

Réchauffement climatique : Big Data pour un immense défi. Cet article est également disponible en anglais. Orange s’associe au Challenge « Data for Climate Action », ouvert à la communauté scientifique internationale, afin d’intensifier la lutte contre le changement climatique. En utilisant la quantité massive de données générées par des entreprises, ce challenge a pour but de mieux comprendre les événements climatiques et mieux y faire face.

Stéphanie de Prévoisin, stratégiste Marketing Anticipation chez Orange, nous explique pourquoi et comment le Groupe contribue à cet immense défi en fournissant des données statistiques de réseaux mobiles et en réfléchissant à utiliser certaines de ses antennes relais comme autant de stations météorologiques. Données météorologiques, messages postés sur les réseaux sociaux, flux de véhicules, tendances de consommation, volumes des transactions financières sont quelques exemples des données qui sont mises à disposition dans ce challenge. Télécom, Big Data et climat : quel potentiel ? Big data. Comment les entreprises recueillent et utilisent nos données ? En 2015, 11 % des entreprises françaises ont traité des big data, selon l'Insee. Les sources de données les plus utilisées sont la géolocalisation, les médias sociaux et les objets connectés ou capteurs.

Les grosses entreprises sont les plus à l’aise pour traiter ces données nombreuses et complexes. 11 % des entreprises françaises ont traité des big data en 2015. Selon l'Insee, qui a réalisé cette enquête, la big data est constituée de " données complexes, dont le volume important et l’actualisation constante rendent difficile l’exploitation par les outils classiques ". 7 % des entreprises traitent des données de géolocalisation Sans surprise, les grosses entreprises sont plus nombreuses à en utiliser que les petites (24 % contre 9 %). Lire aussi : À Rennes, Energiency sait marier big data et intelligence artificielle Lire aussi : Une expérience de datacenter souterrain concluante en Pays de Loire Traitement en interne ou externalisée des données ?

Big Data : comment Trainline a construit sa gare de triage de données. Comment mettre en valeur, sur un support numérique, toute l’offre de voyages en train d’Europe ? Et, demain, comment afficher pour chaque visiteur l’offre la plus pertinente ? C’est à ces défis que s’attaque le laboratoire de Data Science que Trainline – l’ex-Captain Train – a monté voici environ deux ans. « L’objectif était d’extraire les données intéressantes, de mener des analyses sur ces données et, éventuellement, d’en extraire des prévisions, explique Cédric Raud, le responsable des développements au sein de l’équipe marketing.

Dans la réalité, avec une petite structure – à l’époque un data scientist et deux développeurs -, ces tâches demandaient beaucoup de temps, notamment l’extraction ». Bannières de pub ‘data-driven’ Et, surtout, de premières applications sont passées en production. L’existence de cette base de données consolidée (dans PostgreSQL) permet aujourd’hui au voyagiste de déployer plus rapidement de nouveaux scénarios d’usage. Personnalisation du site Web. La justice à l’heure des algorithmes et du big data. Les logiciels et les robots remplaceront-ils un jour les avocats, les notaires et les juges ? Pour les experts, si la tendance à l’automatisation et à l’accélération technologique change la donne, certaines prédictions relèvent encore de la science-fiction.

Une « justice prédictive », des contrats exécutés automatiquement grâce à des logiciels, des robots recrutés par des cabinets d’avocats… En quelques années, les innovations technologiques et numériques ont donné lieu à toute une série d’annonces fracassantes, laissant entendre notamment que l’ubérisation des professions juridiques et judiciaires serait en marche. Mais si certaines de ces innovations bouleversent l’exercice du droit, en automatisant certaines tâches et en accélérant les procédures notamment, beaucoup ont encore un caractère exploratoire, voire s’apparentent au fantasme.

Une justice « prédictive » À certains égards, la « justice prédictive » fonctionne suivant le même principe. Un impact trop peu évalué. La Data Socialisation, prochaine révolution du Big Data ? La révolution du Big Data a bousculé les entreprises qui ont dû apprendre à utiliser l’énorme quantité d’informations qu’elles étaient désormais capables de collecter et d’analyser… Cette énorme quantité de données disponibles a été l’élément déclencheur d’une plus grande vague : celle de la transformation digitale, rendue possible grâce aux avancées technologiques réalisées ces dernières années dans des domaines tels que le marketing automation, la modélisation prédictive, l’intelligence artificielle ou le machine learning (« apprentissage automatique » en français).

Les voitures autonomes, la médecine personnalisée grâce à l’impression 3D et la « quatrième révolution industrielle » (ou industrie 4.0) se basent tous sur le Big Data. Mais la hausse de la quantité des données disponibles n’est qu’un début. La manière dont nous consommons et traitons ces données doit également évoluer si nous souhaitons découvrir le véritable potentiel du Big Data.

Le concept de Data Socialisation. Le secteur bancaire à l’épreuve du big data. Big Data : Pourquoi LeBonCoin a préféré Spark à Hadoop. Tous les français connaissent le site LeBonCoin.fr. Ils sont plus d'un sur deux à utiliser ce site pour vendre un peu de tout, depuis la layette de bébé jusqu'à des appartements, en passant par les voitures ou les libres.

Chaque jour le site recueille près d'un million de nouvelles annonces, avec un stock de l'ordre de 28 millions d'annonces consultables en permanence. Au final, LeBonCoin enregistre une audience de 7 milliards de pages vues chaque mois, ce qui représente une moyenne de 2.000 recherches par seconde. Le site se classe juste derrière Google et Facebook en termes d'audience, mais il est classé numéro 1 sur la durée des visites, qui durent en moyenne entre 16 et 18 minutes. Alors qu’il s’apprête à quitter LeBonCoin pour rejoindre Engie, Aissa Belaid, le Chief Data Officer du site depuis 2013, est revenu lors de la dernière édition du salon Cloud Computing World Expo sur la mise en place de l’architecture Big Data qui motorise le site. Hadoop, une solution jugée trop complexe. Nouveau monde. Comment le big data s'est planté dans les prévisions pour le premier tour de la présidentielle.

L’intelligence artificielle n’est pas encore près de remplacer les sondages. Plusieurs start-up qui voulaient prédire le résultat du premier tour de la présidentielle à l’aide du big data se sont largement plantées. Sondeurs 1 - big data 0 Elles se nomment Vigiglobe, Enigma, Predict my President (programme d'étudiants de Telecom Paris Tech) ou encore Filteris. Elles avaient prédit la victoire de François Fillon au premier tour ou des duels Fillon-Le Pen, Fillon-Mélenchon, etc. Bref, elles ont eu tout faux. Comment c'était censé fonctionner ? Ces start-up, spécialisées dans le big data, basaient leurs analyses principalement sur les messages postés sur les réseaux sociaux, notamment Facebook et surtout Twitter. Pourquoi ça n’a pas marché en France ? Les algorithmes de ces entreprises sont très secrets mais il semble qu’il y ait plusieurs explications. Et pour le deuxième tour ? Les analystes 2.0 spécialisés dans le big data prédisent la même chose que les instituts de sondage.

Atos met le Big Data au service de l'agriculture du futur. Nasdaq GlobeNewswire Publié le 25/04/2017 à 10:00 - Mis à jour le 25/04/2017 à 10:40 London, April, 25, 2017 Paris, Hanovre, le 25 avril 2017 - Atos, leader international de la transformation digitale, réalise une première mondiale en recueillant les données issues de l'agriculture directement par satellite pour optimiser les récoltes.

En partenariat avec la start-tup TerraNIS, Atos transforme ainsi la data en information à haute valeur ajoutée pour tout le secteur agricole, grâce à sa suite de solutions de business analytics Atos Codex. Entre les exigences de plus en plus fortes des consommateurs (attrait de la nouveauté, équité, traçabilité, sécurité.), les nouvelles contraintes réglementaires et environnementales et la hausse du coût des matières premières (graines, engrais, pesticides, eau.), le secteur agricole est sous pression.

Une révolution technologique et commerciale L'exploitation des données issues des récoltes recèle de nombreux avantages à court et long termes : Big data et relation client : DQE Software et Harris Interactive présentent la 1ère étude sur les enjeux de la Qualité de la donnée Client. Nasdaq GlobeNewswire Publié le 27/04/2017 à 14:19 - Mis à jour le 27/04/2017 à 14:20 Communiqué de presseA Paris, le 27 avril 2017 Big data et relation client : DQE Software et Harris Interactive présentent la 1ère étude sur les enjeux de la Qualité de la donnée Client Infographie « Enjeux de la Qualité de la donnée Client » disponible ci-jointe DQE Software, éditeur de solutions de DQM (data quality management), dévoile les résultats de la 1ère étude sur le niveau de maturité des annonceurs français en matière de gestion de la qualité de leurs bases de données clients, réalisée par Harris Interactive auprès des professionnels du marketing.

L'ère du Big data offre aux marques des données à profusion, pour personnaliser et optimiser leurs stratégies relationnelles. Des bases de données faiblement enrichies, avec un impact négatif sur les programmes CRM et les taux de conversion Des bases de données clients multiples, rarement réconciliées, au détriment d'une vision unique du client. Oracle passe en mode startup : Cloud, Big Data, mobilité, IoT, AR/VR, IA. Oracle est en train de former une business unit au mode de fonctionnement de type startup, dévoile Bloomberg. Avec comme objectif de travailler sur de nouvelles technologies, lesquelles pourraient inclure l’intelligence artificielle et la réalité virtuelle. Plus d’une cinquantaine de postes seraient ouverts en vue de pourvoir en personnel deux sites. Lesquel seront situés aux États-Unis, à Reston et Denver. « La mission de l’organisation et de ces deux centres est de construire et d’élaborer des solutions de pointe pour nos clients autour du Cloud Computing, du Big Data analytique, de la mobilité, de l’Internet des Objets et de la cybersécurité », précise Oracle.

Qui évoque également d’autres domaines d’activité comme l’intelligence artificielle, la réalité virtuelle et la réalité augmentée. Cette annonce est intéressante. La bonne nouvelle est qu’Oracle estime que cette nouvelle business unit devrait permettre une transformation en profondeur de l’entreprise. Big Data : comment AG2R La Mondiale apprivoise Hadoop. Comme d’autres assureurs, AG2R La Mondiale voit l’exploitation de la donnée comme un levier permettant d’ouvrir des parties de son système d’information à ses 14 millions de clients, et non plus seulement aux 11 000 salariés du groupe. D’où les questions d’architecture qui se sont fait jour, l’assureur partant, comme la quasi-totalité des entreprises, d’un système d’information siloté. Le groupe (28 milliards d’euros de collecte en 2015 environ) confie alors au cabinet de conseil Sentelis une première mission. « Une cartographie des capacités digitales de notre SI selon 4 dimensions principales : la sécurité, l’orchestration, le BPM et la donnée, raconte Christian Chabanon, le directeur architecture, expérimentation et industrialisation d’AG2R La Mondiale, un poste qui fait la jonction entre les études et la production au sein de la DSI de l’assureur.

C’est ce constat qui pousse AG2R La Mondiale à s’intéresser en 2015 aux technologies Big Data. Avec deux expérimentations. Big Data : une croissance portée par les grandes entreprises. Big data : VMware fait l’acquisition de Wavefront - ZDNet. Pascal Bacqué, Fantasme et vérité au pays des big data - La Règle du Jeu - Littérature, Philosophie, Politique, Arts. Big Data Paris : « le Big Data est mort, vive le Big Data ! » Le Big Data surtout menacé par le mauvais dialogue IT/métiers.

Cybersécurité : l'autre enjeu des big data - Sciencesetavenir.fr. Investir dans le Big data. Les limites des modèles comportementaux du big data.