background preloader

Big Data

Facebook Twitter

Internet : les puissants reprennent les rênes. Le spécialiste de la sécurité informatique, Bruce Schneier (@Bruce_Schneier), vient de livrer sur son blog un texte très pertinent sur comment l'internet transforme les rapports de pouvoir.

Internet : les puissants reprennent les rênes

Il y explique que la technologie amplifie la puissance non seulement des internautes, mais aussi - et de plus en plus - des pouvoirs en place. "Toutes les technologies de rupture bouleversent les équilibres de pouvoir traditionnels, et l'internet ne fait pas exception. Le scénario classique est qu'il donne du pouvoir aux moins puissants, mais ce n'est que la moitié de l'histoire. L'internet donne de la puissance à tous. Les institutions puissantes peuvent être lentes à faire usage de ce nouveau pouvoir, mais, comme elles sont puissantes, elles peuvent l'utiliser plus efficacement.

"Désormais, de puissants intérêts cherchent à orienter délibérément cette influence à leur avantage. " "La réalité s'est avérée être beaucoup plus compliquée. Non. Le nationalisme internet Internet est un Etat policier. Serge Abiteboul : « Le big data est avant tout un effet de mode » 01net le 13/09/12 à 11h00 Dans vingt ans, un individu aura-t-il le contrôle de ses données personnelles ?

Serge Abiteboul : « Le big data est avant tout un effet de mode »

SERGE ABITEBOUL : Il est possible qu’une entreprise commerciale, comme Facebook ou Google, finisse par concentrer toutes les informations personnelles du monde. Nous n’aurons plus alors qu’à lui faire confiance. Ou bien, je l’espère, nos données seront distribuées sur des milliards de systèmes. Est-ce pour cela que vous prônez des sortes de « tiers de confiance de données personnelles » ? SA : La masse de renseignements est en constante augmentation. Vous estimez que le big data est surtout un effet de mode ? SA : Oui. Pourquoi cet intérêt marketing pour le big data ?

SA : Les données sont des gisements potentiels de valeur. Tout ce qui est récolté est vraiment exploité ? SA : A mon avis, non. Les technologies comme Hadoop sont-elles vraiment utilisées ? SA : Elles le sont par les sociétés web, qui ont été des précurseurs en la matière pour faire des trucs comme l’indexation du Web. Big data. Un article de Wikipédia, l'encyclopédie libre.

Big data

Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée.

Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code] Hadoop. Un article de Wikipédia, l'encyclopédie libre.

Hadoop

Hadoop a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009. Historique[modifier | modifier le code] En 2004, Google publie un article présentant son algorithme basé sur des opérations analytiques à grande échelle sur un grand cluster de serveurs, le MapReduce, ainsi que son système de fichier en cluster, le GoogleFS. Doug Cutting, qui travaille à cette époque sur le développement de Apache Lucene et rencontre des problèmes similaires à ceux de la firme de Mountain View, décide alors de reprendre les concepts décrits dans l'article pour développer sa propre version des outils en version Open Source, qui deviendra le projet Hadoop. Architecture[modifier | modifier le code] Hadoop Distributed File System[modifier | modifier le code] Une architecture de machines HDFS (aussi appelée cluster HDFS) repose sur deux types de composants majeurs : MapReduce[modifier | modifier le code]