background preloader

Big Data

Facebook Twitter

Hadoop Tutorial: Intro to HDFS. Ces métiers créés par le Big Data. Panorama des solutions de big data : Big Data : des solutions majoritairement open source. Les grands acteurs du web tels que Google, Yahoo ou Facebook ont été les premiers à être confrontés à des volumétries de données extrêmement importantes, et les principales innovations se retrouvent sans surprise parmi ces pionniers.

Panorama des solutions de big data : Big Data : des solutions majoritairement open source

Les développements portent essentiellement sur deux types de technologies : les bases de données ; les plates-formes de développement et de traitement des données. Ces entreprises innovantes ont choisi pour la plupart d'ouvrir le code initialement développé en interne pour en faire des projets open source. Le tableau 4.3 présente quelques exemples de technologies open source utilisées pour la gestion des données massives et dont l'origine est un développement interne : Un certain nombre des technologies citées précédemment comme Hadoop et Cassandra font partie de la fondation Apache, organisation à but non lucratif qui développe des logiciels open source, dont le célèbre serveurApache HTTP Server.

14 start-up Big Data dont vous allez entendre parler : Sqrrl. Concept : créer une entreprise autour d'Apache Accumulo, une puissante base de données NoSQL open source développée par la NSA qui comporte des technologies de sécurité sophistiquées.

14 start-up Big Data dont vous allez entendre parler : Sqrrl

Accumulo a été développée à partir de BigTable, un système de stockage de données en masse inventé par Google. Talents cachés : Adam Fuchs, co-fondateur et directeur de la technologie, a également co-fondé Apache Accumulo. Financement : Sqrrl a levé 2 millions de dollars auprès d'Atlas Venture et Matrix Partners. Les entreprises se débattent avec le big data. Selon une étude mondiale réalisée par Cisco, les professionnels et les entreprises ont du mal à extraire de la valeur stratégique de leur big data.

Les entreprises se débattent avec le big data

Seulement 28 % des personnes interrogées par Cisco se disent actuellement en mesure de tirer de la valeur de ces données. Pour réaliser son enquête intitulée Cisco Connected World Technology Report (CCWTR), l'équipementier a interrogé 1 800 professionnels dans 18 pays afin de se faire une idée sur l'état de préparation du secteur de l'IT, ses défis, ses lacunes technologiques et sa capacité stratégique à mener des projets big data. Alors que la plupart des entreprises collectent, stockent et analysent des données, le rapport de Cisco révèle que la majorité d'entre elles se débattent avec leur projet big data et ont du mal à relever les défis IT liés à l'utilisation de ce framework. Big Data, filière d’avenir pour la France. 01net. le 06/03/13 à 11h48 Dans le cadre des projets de « Quartiers numériques » mis en place par Fleur Pellerin, ministre déléguée chargée des PME, de l’Innovation et de l’Economie numérique, l’Afdel a lancé un programme autour du big data, baptisé « Big data Launchpad ».

Big Data, filière d’avenir pour la France

Pour piloter ce projet de réflexion, l’Association française des éditeurs de logiciels et solutions Internet ne pouvait trouver mieux que Bertrand Diard, dirigeant de Talend, société fondée en 2005, spécialisée dans l’intégration de données et implantée aujourd’hui au niveau mondial. Mettre en place un écosystème Fort de son expérience, Bertrand Diard sait que, pour développer le big data en France, il faut créer un écosystème. « Pourquoi les entreprises arrivent-elles à se développer dans la Silicon Valley ? Développer un incubateur. Drupal : comment le moteur de recherche Apache SolR s'est imposé. Rapide, robuste et disposant d'une vaste couverture fonctionnelle, Apache SolR a déjà été adopté par de nombreux sites Drupal.

Drupal : comment le moteur de recherche Apache SolR s'est imposé

Retour sur un projet Open Source qui a séduit experts de la communauté et ténors du web. Quel moteur de recherche choisir pour un site conçu avec Drupal ? Le CMS Open Source propose bien un moteur par défaut, mais il peut vite montrer ses limites. "Il est tout à fait acceptable pour un emploi basique, mais certaines possibilités lui manquent pour un usage plus avancé", prévient Gwenaël Chichery, directeur associé chez Actualys, agence notamment spécialisée sur ces questions. Drupal, et son moteur par défaut limité Lors d'une conférence donnée à l'événement Drupagora, cet expert avait d'ailleurs déjà souligné plusieurs fonctionnalités manquantes du moteur de recherche proposé par défaut. Il y a urgence à enseigner le big data&#160!

01net. le 22/01/13 à 15h15 Les technologies sont disponibles, mais les personnes capables de les exploiter pleinement manquent cruellement.

Il y a urgence à enseigner le big data&#160!

C’est là tout le problème du big data, qui exige des profils d’analystes aux multiples compétences. Des compétences qui, comme l’a rappelé Gilles Babinet en ouverture du congrès big data organisé en décembre dernier par Télécom ParisTech, touchent à la statistique, à l’informatique, voire au design, à la sémantique, à la linguistique ou encore à la visualisation de données. Le décisionnel à l'heure du big data - Le 02 Avril 2012 Comment gérer et traiter des quantités impressionnantes de données structurées et non structurées dans les entreprises à moyen et long terme ?

Le décisionnel à l'heure du big data -

Tel est le défi des services informatiques. Ces grands volumes de données, plus connus sous le nom de big data n'ont peu ou pas encore été pris en compte par la majorité des entreprises mais les besoins se font ressentir. «Même si les technologies autour du big data sont prématurées, cela amène les fournisseurs, les intégrateurs et les clients à réfléchir sur ce qu'ils doivent faire demain pour analyser et traiter les forts volumes de données » indique François Guérin, responsable avant-ventes chez Sybase. Et pour cause, les entreprises sont en phase de réflexion et se posent souvent cette question de savoir comment intégrer le concept du big data dans le système d'information existant.

Sommaire du dossier : 1. Nouvel onglet. La capacité de disposer de bons renseignements est depuis longtemps un facteur décisif dans la bataille contre les logiciels malveillants.

Nouvel onglet

Mais avec la recrudescence exponentielle des menaces, l'analyse de l'information peut devenir tout aussi importante que la collecte. Ce que l'avenir nous réserve en matière de lutte contre les malwares est une question ouverte. L'analyse des fichiers basée sur la signature, la méthode jusqu'ici la plus répandue pour faire face aux infections, s'avère de moins en moins efficace en raison d'une production de plus en plus volumineuse de logiciels malveillants. Mais en l'absence d'une meilleure stratégie, de nombreux produits antivirus pour l'entreprise continuent encore de compter largement sur cette méthode. Même si l'on constate des changements par ailleurs. Modéliser les menaces potentielles.

Big Data : les progrès de l’analyse des données. Nous voici entré dans l’ère des Big Data des ensembles de données tellement gigantesques qu’ils nécessitent de nouveaux outils techniques et scientifiques pour les comprendre et en tirer du sens.

Big Data : les progrès de l’analyse des données

Un déluge de données qui pose des questions profondes sur leur collecte, leur interprétation, leur analyse… Dans ce siècle des réseaux, la science des algorithmes, censée extraire le sens de ces amas d’information doit apprendre à comprendre ce qu’elle analyse. Changing the World: Big Data and the Cloud - IBM Power in Data. We are in an age when jobs like "data scientist" are not far from reality.

Changing the World: Big Data and the Cloud - IBM Power in Data

The convergence of two key technological areas -- cloud computing and big data -- are having far reaching implications that indeed are changing the world. It's leading to the discovery of new drugs to cure diseases; predicting weather patterns more accurately (even predicting earthquakes?) , finding better ways to use and save water, and so on. These are many of the ideas and projects that IBM has advanced with its Smarter Planet initiative, which has cloud computing and big data technologies at its core. Big Data Meets Cloud. Big Data. Real-Time Responses For an organization to respond in real-time it needs to have systems that must detect, analyze, and act with greater automation making more big data practical and operational. New research from James Taylor discusses how to find value in fast-moving data, high-ROI use cases, and the five essential elements of technology required.

Read more. Big Data : des projets encore émergents. Une intense rumeur marketing entoure le concept de Big Data. Néanmoins, comme l’illustre le programme destiné aux startups ouvert par SAP autour de sa technologie de base de données In-Memory, HANA, sous le vernis commercial se cachent de réels projets. Des projets, encore souvent au stade de la R&D, qui pour émerger ont besoin de technologies capables de traiter d’importants volumes de données, et ce dans des délais relativement courts, parfois même en temps réel. Début septembre, SAP, qui espère bien positionner HANA comme une brique majeure du Big Data, avait convié une vingtaine d’entreprises françaises à présenter leurs projets sur sa plate-forme. Sélection. Chef Jérôme : croiser recettes et panier d’achats en temps réel.

Big Data

Le Big Data au service de l'optimisation marketing : Le Big Data au service de l'optimisation marketing Web - web & tech. Entretiens avec les DSI et les dirigeants du secteur informatique - CIO-Online. Paroles de DSI par Jean-Pierre Blettner et Bertrand Lemaire « Avant, nous collections, analysions et jetions les données car nous considérions qu'elles n'avaient plus de valeur une fois analysées ; maintenant, nous les conservons » indique Mathias Herberts, Ingénieur disruptif au Crédit Mutuel Arkea (22/10/2012) - Le Crédit Mutuel Arkea a mis en place, depuis 2009, du Big Data avec la technologie Hadoop.

L'apport essentiel de cette technologie est la capacité à traiter d'immenses volumes de données. Comment Teradata masque la complexité du big data. 01net le 23/10/12 à 15h10 Principal frein aux déploiements d’infrastructure big data dans les entreprises : les compétences techniques… Rares sont ceux qui maîtrisent MapReduce, le modèle de programmation au cœur d’Hadoop (système de traitement de données hautement distribué). Comment masquer cette complexité ? Hadoop : accélérateur des traitements Big Data chez Crédit Mutuel Arkea - Actualités RT Infrastructure. Le 22/10/2012, par Jean Pierre Blettner, Bertrand Lemaire, Quentin Renard, Infrastructure, 1048 mots Mathias Herberts, ingénieur disruptif chez Crédit Mutuel Arkea, présente la plate-forme Hadoop qui exploite la masse de données de la banque.

Les applications de gestion des ratios de solvabilité et de détection de blanchiment d'argent améliorent largement l'existant. D'autres applications suivent. Le Crédit Mutuel Arkea est un groupe bancaire qui compte 9 000 collaborateurs, et gère 3,2 millions de sociétaires et de clients dans la bancassurance. La banque a mis en place une plate-forme Hadoop afin de traiter la masse de données dont elle dispose et gagner en agilité vis-à-vis du Mainframe. Le projet a été lancé en 2009, avec 1,5 personne avant de former un centre d'expertise.