background preloader

Technos

Facebook Twitter

HADOOP, HIVE, Map Reduce avec PHP : part 1. Lorsque l’on commence à débattre sur le «BIG DATA», on finit toujours par discuter du stockage.

HADOOP, HIVE, Map Reduce avec PHP : part 1

«Hadoop», de par son architecture et son fonctionnement, n’impose aucune contrainte technique sur le stockage de la donnée. Intégrant nativement le concept de Map & Reduce, «Hadoop» est un candidat sérieux pour les besoins de stockage massif et d’extraction qu’impose le «BIG DATA». Facebook a retenu «Hadoop» comme entrepôt de données pour ses calculs de statistiques marketing. Dans un précédent article consacré à «CASSANDRA», nous avions conclu «qu’une architecture permettant l’extraction, la manipulation et l’interprétation socio-économique de données massives, était composée de plusieurs maillons technologiques».

Cloudbreak, le nouveau Hadoop en tant que service, open source et indépendant de tout provider Cloud, disponible en version bêta. Le monde du Cloud, du big data et du calcul intensif vient de s'enrichir du nouveau Cloudbreak, une variante d’Hadoop, disponible en tant que service sous forme d'API.

Cloudbreak, le nouveau Hadoop en tant que service, open source et indépendant de tout provider Cloud, disponible en version bêta

Cloudbreak qui est open source est désormais accessible en bêta pour les développeurs et les entreprises. Réseau de neurones artificiels. Vidéo sur MongoDB, la base NoSQL qui réinvente la gestion de données. Dans le cadre des conférences techniques organisées par la société Soat dont Developpez.com est partenaire, David Wursteisen a présenté le mardi 19 février 2014 dans les locaux de Soat à Paris, une session sur le NoSQL MongoDB.

Vidéo sur MongoDB, la base NoSQL qui réinvente la gestion de données

Cette vidéo se focalise sur les caractéristiques, les uses cases, et les avantages et défauts de MongoDB. La présentation introduit également le fonctionnement de cette base de données, la description des documents, les notions de replicat-set, sharding, mais aussi les cas d'utilisation possibles en environnement BigData et NoBigData. Explore big data analytics and Hadoop. L’embarras du choix - Comment choisir la bonne plate-forme pour Big Data / Hadoop ? Big Data : La jungle des différentes distributions open source Hadoop. En 2004, Google a publié un article présentant son algorithme de calcul à grande échelle, MapReduce, ainsi que son système de fichier en cluster, GoogleFS.

Big Data : La jungle des différentes distributions open source Hadoop

Rapidement (2005) une version open source voyait le jour sous l’impulsion de Yahoo. Aujourd’hui il est difficile de se retrouver dans la jungle d’Hadoop pour les raisons suivantes : Ce sont des technologies jeunes.Beaucoup de buzz et de communication de sociétés qui veulent prendre le train Big Data en marche.Des raccourcis sont souvent employés (non MapReduce ou un équivalent n’est pas suffisant pour parler d’Hadoop).Beaucoup d’acteurs différents (des mastodontes, des spécialistes du web, des start-up, …).

Node.js : la tendance JavaScript côté serveur. Depuis plusieurs mois, le JavaScript est le langage le plus actif sur github, loin devant le Java ou le PHP.

Node.js : la tendance JavaScript côté serveur

Outre une forte présence sur le côté « Front » des applicatifs, le JavaScript commence à gagner ses lettres de noblesse côté « Serveur ». En témoigne aujourd’hui les nombreux projets autour de Node.js. La surcouche Node.js est de plus en plus choisie pour expérimenter des problématiques de temps réel ou de quasi-temps réel.L’objectif est de proposer des expériences utilisateurs dans des environnements très connectés (jeux vidéo, mobiles, sondage grand public, notification, etc.). How to build a Hadoop data science team? Data scientists are in high demand these days.

How to build a Hadoop data science team?

Everyone seems to be hiring a team of data scientists, yet many are still not quite sure what data science is all about, and what skill set they need to look for in a data scientist to build a stellar Hadoop data science team. Guide : Tout savoir sur Hadoop. Les Guides Essentiels Ce Guide Essentiel est un ensemble d’articles, vidéos et autres documents sélectionnés par nos rédacteurs pour vous donner une perspective complète de ce sujet.

Guide : Tout savoir sur Hadoop

La première technologie qui vient à l’esprit lorsque l’on évoque aujourd’hui le sujet du Big Data est Hadoop, le framework analytique Java développé au sein de la fondation Apache. Populaire, Hadoop reste toutefois un mystère pour nombre d’utilisateurs désireux de mettre en oeuvre la technologie ou de mieux la comprendre. LeMagIT a réuni au sein de ce dossier un ensemble d'articles dont l'objectif est d'aider à comprendre ce qu'est réellement Hadoop, comment il fonctionne, quels sont ses usages, comment la technologie est architecturée et quelles en sont les limites.

Vulgarisation. Hadoop Download. Pentaho Business Analytics Platform. L'architecture HDFS : Panorama des solutions de big data. NoSQL s'ouvre aux plateformes mobiles, Couchbase Mobile 1.0, la première base de données NoSQL native pour mobile sort. Couchbase, l’une des principales entreprises IT qui ont fait la promotion du NoSQL a récemment annoncé la sortie de son nouveau produit Couchbase Mobile 1.0, une solution pour tirer parti de la puissance du NoSQL à partir d’une plateforme mobile, but de la manœuvre : promouvoir les applications mobiles NoSQL et conquérir un nouveau marché.

NoSQL s'ouvre aux plateformes mobiles, Couchbase Mobile 1.0, la première base de données NoSQL native pour mobile sort

Cloudera buys big data encryption specialist Gazzang. Hadoop software company Cloudera has acquired Gazzang, a startup specializing in encryption software for big data environments.

Cloudera buys big data encryption specialist Gazzang

It’s Cloudera’s first significant acquisition (it bought machine learning startup Myrrix in 2012 in more of an “acquihire” situation) and it speaks to the importance of security as customers’ Hadoop deployments grow in scale and mature into production environments. The deal comes less than a month after Cloudera competitor Hortonworks acquired a security startup called XA Secure. Hadoop. Un article de Wikipédia, l'encyclopédie libre.

Hadoop

Hadoop a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009. Cloudera. Un article de Wikipédia, l'encyclopédie libre. Cloudera logo. Introduction à Apache Hadoop : installation et configuration d'un cluster simple noeud avec Cloudera CDH 5. Ce deuxième article s'intéresse à l'installation et la configuration d'un cluster Hadoop simple nœud en utilisant la distribution CDH 5 fournie par Cloudera.

Nous décrirons comment réaliser une telle installation dans un système virtualisé Linux. Hadoop et son écosystème : Panorama des solutions de big data. Hadoop est une plate-forme informatique open source capable de gérer de gigantesques volumes de données, structurées et non structurées, dans le cadre d'un système distribué. Hadoop fait partie de la fondation Apache. Rappelons que Google est à l'origine de cette plate-forme. Le moteur de recherche chercha en effet très tôt le moyen d'indexer les informations de type texte qu'il collectait, afin de présenter des résultats pertinents aux utilisateurs lors de leurs recherches sur le web. A l'époque, voyant qu'aucune solution du marché ne permettait de répondre à ce besoin, Google décida de bâtir sa propre plate-forme.