
MapReduce Un article de Wikipédia, l'encyclopédie libre. Les termes « map » et « reduce », et les concepts sous-jacents, sont empruntés aux langages de programmation fonctionnelle utilisés pour leur construction (map et réduction de la programmation fonctionnelle et des langages de programmation tableau). MapReduce permet de manipuler de grandes quantités de données en les distribuant dans un cluster de machines pour être traitées. Ce modèle connaît un vif succès auprès de sociétés possédant d'importants centres de traitement de données telles Amazon ou Facebook. Il commence aussi à être utilisé au sein du Cloud computing. De nombreux frameworks ont vu le jour afin d'implémenter le MapReduce. Présentation[modifier | modifier le code] Un modèle de programmation[modifier | modifier le code] MapReduce est un modèle de programmation popularisé par Google. MapReduce consiste en deux fonctions map() et reduce(). map(clé1,valeur1) → list(clé2,valeur2) reduce(key2,list(valeur2))→ list(valeur2)[1] Hadoop Logo
MariaDB Un article de Wikipédia, l'encyclopédie libre. Historique[modifier | modifier le code] Un consortium baptisé « Open Database Alliance » a par ailleurs été créé pour assurer le développement du logiciel (comparable à la fondation Linux avec le noyau Linux). Monty Program AB[modifier | modifier le code] Société fondée par Michael "Monty" Widenius, à l’origine du projet MariaDB, elle en assure aujourd’hui la maintenance. Elle a signé un accord de fusion avec la société SkySQL[10], en avril 2013, dans le but développer MariaDB dans une version « NewSQL », en regroupant le meilleur des mondes SQL et NoSQL[11]. Fondation MariaDB[modifier | modifier le code] Versions[modifier | modifier le code] Les différentes versions de MariaDB s’articulent sur le code source de MySQL de la version 5.1 aux versions plus récentes (comme la 5.6 fin 2012). Voir aussi[modifier | modifier le code] Notes et références[modifier | modifier le code] Liens externes[modifier | modifier le code]
Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]
BigTable Un article de Wikipédia, l'encyclopédie libre. BigTable est un système de gestion de base de données compressées, haute performance, propriétaire, développé et exploité par Google[1]. Chez Google, BigTable est stockée sur le système de fichiers distribué GoogleFS. Google ne distribue pas sa base de données mais propose une utilisation publique de BigTable via sa plateforme d'application Google App Engine. fabFORCE.net General Information - What is DBDesigner 4? DBDesigner 4 is a visual database design system that integrates database design, modeling, creation and maintenance into a single, seamless environment. It combines professional features and a clear and simple user interface to offer the most efficient way to handle your databases. DBDesigner 4 compares to products like Oracle's Designer�, IBM's Rational Rose�, Computer Associates's ERwin� and theKompany's DataArchitect� but is an Open Source Project available for Microsoft Windows� 2k/XP and Linux KDE/Gnome. It is release on the GPL. DBDesigner 4 and MySQL DBDesigner 4 is developed and optimized for the open source MySQL-Database to support MySQL users with a powerful and free available design tool. All MySQL specific features have been built in to offer the most convenient way to design and keep control of your MySQL-Databases. DBDesigner 4 Development Browse through the following sections to get more information about DBDesigner4.
Global Hadoop Market worth USD 87.14 billion by 2022 Zion Market Research has published a new report titled “Hadoop Market by Type (Software, Hardware and Services) for BFSI, Government Sector, IT & ITES, Healthcare, Telecommunication, Retail and Other End-Uses: Global Industry Perspective, Comprehensive Analysis, Size, Share, Growth, Segment, Trends and Forecast, 2016 – 2022.” According to the report, the global Hadoop market was valued at approximately USD 7.69 billion in 2016 and is expected to reach approximately USD 87.14 billion by 2022, growing at a CAGR of around 50% between 2017 and 2022. Hadoop is an open source framework which is designed for storing and processing big data in a distributed environment across clusters of computers. Hadoop is useful for scalable storage platform as Hadoop can store and distribute the very large amount of data. The Hadoop market is driven by increasing demand for the big data coupled with growing volume of structured and unstructured data. This report segments the global Hadoop market as follows:
22 outils gratuits pour visualiser et analyser les données (1ère partie) Vous avez des données à explorer ? Voici quelques outils qui pourront vous être utiles pour les transformer en informations et en graphiques attrayants. Pour faire parler des données, rien ne vaut une panoplie d'outils de visualisation graphique. Il en existe de nombreux, notamment destinés aux professionnels versés dans l'analyse statistique. Mais leur prix, généralement élevé, ne convient pas aux utilisateurs moins spécialisés qui n'ont besoin qu'occasionnellement d'afficher des données sous une forme graphique. Or, il existe, pour ceux dont le budget est limité, un nombre surprenant d'outils très intéressants pour la visualisation et l'analyse de données, accessibles gratuitement. Computerworld souligne que la correction des textes se fait simplement. DataWrangler (cliquer ici pour agrandir l'image) Refine intègre plusieurs algorithmes retrouvant les mots orthographiés différemment mais qui devraient en fait être regroupés. Google Refine (cliquer ici pour agrandir l'image)
Visual Database Creation with MySQL Workbench In today's tutorial, you'll learn how to use a visual database modeling utility to draw a database diagram and automatically generate SQL. Specifically, we'll review how to use MySQL Workbench, a cross-platform, visual database design tool. What is MySQL Workbench? MySQL Workbench is a powerful tool developed by MySQL with three primary areas of functionality: SQL Development: Replaces MySQL query browser. In this tutorial, we'll focus on the Data Modeling aspect to create a database from scratch, and then have just a quick look at the SQL editor to execute our generated SQL script and create the database within MySQL. MySQL Workbench is available for Windows, Linux and Mac OSX. Note: this tutorial is based on the Community OSS Edition version 5.2 (5.2.16), currently in beta release at the time of the writing (April 2010). Planning our Database To learn how to use MySQL Workbench, we'll use a very simple database for online classes as an example. Send in MySQL Workbench Clarifying Concepts
BIG DATA - Architectures L’architecture microservices est souvent décrite comme l’architecture correcte de la SOA (“SOA done right”), je préfère utiliser le terme de Container-Oriented Architecture. Ce n’est pas une architecture complète et spécifique au Big Data. Exposé par James Lewis et Martin Fowler, les principes fondamentaux en sont les suivants : un service ne traite qu’un périmètre restreint et clairement défini de fonctionnalités, chaque service est développé avec le langage et la base de données les plus adaptés pour répondre efficacement, un service doit être sans état, chaque service est autonome, s’exécute sur son propre serveur embarqué. Le boom des microservices est du à Netflix en 2010 en réponse aux problèmes engendrées par une architecture service traditionnelle (que l’on nomme par opposition au micro services : monolithes). En effet les monolithes posent les problèmes suivants : L’architecture microservices est inspirée des technologies suivantes (et de leur maturité actuelle): Points forts
Les 50 plus beaux graphiques de visualisation de données ! - graphisme Ces dernières années le Web a vu émerger de nouvelles tendances sur la visualisation et la gestion graphique des données. On sait que sur la toile, une multitude d'informations circulent, entre statistiques et arts visuels découvrez notre sélection des p Studyscape Patrick Vuarnoz Suitmen Life Map par ritwikdey Web Trend Map v4.0 par Information Architects Killer Earth par Andrew Blauvelt Visualization of iTunes Libraries par Caleb Larsen Chart Arcs par Martin Dittus par Peter Crnokrak Netdisco Max Baker Networkism par Tatiana Plakhova Mo Money Mo Problems par Nick Hardeman Twingly Screensaver Time Magazine par Joe Lertola DriftNet par Norimichi Hirakawa Glocal par Jer Thorp Visualizing The Bible par Chris Harrison Barcode Plantage par Daniel A. Fyre par David Trowbridge, Micah Dowty Disarticulate par Ben Fry Visual Poetry par Boris Muller MSN History Visualization par MSN History Visualization flowerGarden par Greg Judelman, Maria Lantin Maeve insatallation par University of Applied Sciences Potsdam AmoebaAbstracts 1-3 Gcrawler
Hadoop vs Spark Apache : 5 choses à savoir Les outils pour traiter les données non-structurées se sont multipliés ces derniers mois. Passage en revue de deux des solutions phares, Hadoop et Spark Apache. Dans toute discussion sur le big data, on finit forcément par parler de Hadoop ou d’Apache Spark. Si les deux outils sont parfois considérés comme des concurrents, il est souvent admis qu’ils fonctionnent encore mieux quand ils sont ensemble. 1- Hadoop et Apache Spark font des choses différentes. Tous deux sont des frameworks big data, mais ils n’ont pas vraiment le même usage. 2 - Il est possible d’utiliser Hadoop indépendamment de Spark et réciproquement. Hadoop comprend un composant de stockage, connu sous le nom de HDFS (Hadoop Distributed File System), et un outil de traitement appelé MapReduce. Hadoop ne travaille qu'en mode lots avec MapReduce alors que Spark fait du temps réel en in-memory. 3 - Spark est beaucoup plus rapide que Hadoop. 4 - Tout le monde n’a pas besoin de la rapidité de Spark.
PivotViewer Control Getting Started Walking Through a Silverlight Application Take a tour of the XAML and Javascript generated by an application template that's installed with the Silverlight SDK. Organizing XAML Assets Learn how to organize XAML assets in Expression Design and Expression Blend to maximize developer efficiency. Hosting HTML Content This video demonstrates various ways you can use existing HTML content within your Silverlight application including full pages, fragments, or syndicated content. Understanding Mouse Input Learn about Mouse input and how to use some of the mouse functionality available in Silverlight. Using Custom Fonts Learn how to download and use a custom font with a Text Block in Silverlight. Adding Silverlight to a Web Page Learn what "silverlight.js" helper file is used for and what the parameters on the Silverlight plug-in can do. Silverlight 5 Silverlight 5 Release Overview In this video, Pete provides an overview of the new and updated features in the release of Silverlight 5.