background preloader

Big Data

Facebook Twitter

Course à l'innovation : les DSI européens décrochent. 01Business le 26/09/13 à 10h55 La culture européenne met en avant le passé.

Course à l'innovation : les DSI européens décrochent

Là où l’Asie appuie à fond sur l’accélérateur, nous avançons avec les freins bloqués », caricature Frédéric Pichard, responsable des baromètres chez CSC. Depuis cinq ans, le baromètre CIO de la SSII CSC mesure les enjeux et les évolutions de la fonction informatique au sein de l’entreprise. Cette année, l’étude a été réalisée sur une base de prospection mondiale (voir encadré méthodologie). Priorité à la sécurité avant de se lancer dans le cloud Quels sont les défis les plus importants pour votre DSI dans les annés à venir ? Pour l’ensemble des DSI interrogés, l’année 2012 a été majoritairement marquée par les développements réalisés en matière de perfectionnement de la sécurité informatique (71% de citations en moyenne sur les cinq régions) et de recours au cloud computing (69%).

En Asie, 66% des DSI voient leur budget augmenter. Les éléments les plus coûteux du budget 2012 Crédit photo : Benjamin Ellis. Méthodologie. Bases de données graphes : un tour d’horizon. Dans un précédent article, nous avons introduit quelques concepts à propos des graphes, et les avons illustrés par deux exemples en utilisant la base de données graphe Neo4j. Au cours de ces dernières années, de nombreuses compagnies ont développé leur solution de base de données graphe, en tant qu’éditeur comme Neo Technology avec Neo4j, Objectivity avec InfiniteGraph ou encore Sparsity avec dex*, ou en développant leur propre solution pour l’intégrer à leur application, comme LinkedIn ou Twitter. Il est donc assez difficile de s’y retrouver dans ce paysage riche, qui continue à évoluer très vite.

Dans ce nouvel article qui se focalise sur les bases de données graphes, nous donnerons les éléments nécessaires à la compréhension de leur positionnement dans leur écosystème, par rapport aux autres types de base de données et aux autres types d’outils dédiés au traitement de graphes. Une telle base de données répond donc généralement aux critères suivants : Graph storage et graph processing. Hadoop. Un article de Wikipédia, l'encyclopédie libre.

Hadoop

Hadoop a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009. Historique[modifier | modifier le code] En 2004, Google publie un article présentant son algorithme basé sur des opérations analytiques à grande échelle sur un grand cluster de serveurs, le MapReduce, ainsi que son système de fichier en cluster, le GoogleFS. Doug Cutting, qui travaille à cette époque sur le développement de Apache Lucene et rencontre des problèmes similaires à ceux de la firme de Mountain View, décide alors de reprendre les concepts décrits dans l'article pour développer sa propre version des outils en version Open Source, qui deviendra le projet Hadoop.

Architecture[modifier | modifier le code] Hadoop Distributed File System[modifier | modifier le code] Une architecture de machines HDFS (aussi appelée cluster HDFS) repose sur deux types de composants majeurs : MapReduce[modifier | modifier le code] CIO Agenda: Big Data Ecosystem. IN TERMS of ‘forces’ affecting the CIO Agenda, Information Strategy and Enterprise Architecture, Big Data is increasingly important.

CIO Agenda: Big Data Ecosystem

This is due to explosive growth in number of data source types: applications, digital media, mobiles, users, customers, unstructured data sets, sensors, emails, blogs etc. Data is complex and in mixed formats (text, video, audio), on-demand infrastructure scalability (including massively scalable storage) is needed to deliver Big Data capabilities, as are robust analytics and visualisation tools and techniques for distributed, parallel systems. Increasing bandwidth availability has also led to exponential data growth rates and capabilities e.g. social networks, video and microblogging. Visualization-based data discovery tools.

Visualization-based data discovery tools may account for less than 5 % of the Business Intelligence (BI) Market, but they are fighting above their weight in terms of profile.

Visualization-based data discovery tools

In 2011, Gartner placed Visualisation at the peak of the BI Hype Cycle. Despite this indicating the category may lose some of its lustre , Gartner are still predicting a compound annual growth rate of 30% in each of next 5 years. The Definition of Enterprise Big Data. With David Vellante With the inaugural O'Reilly Media Strata conference, the topic of is coming into sharper focus.

The Definition of Enterprise Big Data

When O'Reilly initiates coverage of a topic through an event like Strata, you can be sure the content will be well-thought-out, rich, relevant and visionary in nature. A key theme that emerged from the event was that Big Data is not just about cool technologies and Web 2.0 companies experimenting with gigantic data sets. Rather it's defining new value streams based on leveraging information. From Big Data to Big Busines. Big Data et Technologies du Langage.

42 Big Data Startups – Big Data News. Published by Jeff Vance at Startup50.

42 Big Data Startups – Big Data News

Which ones are missing?