background preloader

Veille

Facebook Twitter

Le pouvoir des données. Année: 2010 Durée: 56' 42'' Cette émission de Place de la Toile disponible en libre accès ici traite d'une problématique extrêmement intéressante - et préoccupante - : l'utilisation des énormes masses de données disponibles sur Internet pour prévoir les tendances, les comportements, et donc pouvoir les anticiper, se qui se traduit par des profits potentiellement sans limite pour les détenteurs de l'information.

Le pouvoir des données

L'enregistrement suscite beaucoup de questions. Je laisse libre cours au miennes: Internet est désormais la représentation visible de ce qui se passe dans les cerveaux d'une partie importante de la population mondiale: d'une part les innombrables sites internet et blogs de toute nature, les profils Facebook, les bibliothèques numériques, les bases de données en ligne, etc., d'autre part le pouls de la noosphère planètaire qui bat à travers les millions de requêtes adressées aux moteurs de recherche, via les tweets, les échanges sur les forums, les emails ...

IDAaaS - Home. Project Voldemort. Voldemort is a distributed key-value storage system Data is automatically replicated over multiple servers.

Project Voldemort

Data is automatically partitioned so each server contains only a subset of the total data Provides tunable consistency (strict quorum or eventual consistency) Server failure is handled transparently Pluggable Storage Engines -- BDB-JE, MySQL, Read-Only Pluggable serialization -- Protocol Buffers, Thrift, Avro and Java Serialization Data items are versioned to maximize data integrity in failure scenarios without compromising availability of the system Each node is independent of other nodes with no central point of failure or coordination Good single node performance: you can expect 10-20k operations per second depending on the machines, the network, the disk system, and the data replication factor Support for pluggable data placement strategies to support things like distribution across data centers that are geographically far apart.

Comparison to relational databases. Open Data : Le Web Sera Sémantique Ou Ne Sera Pas. Karine Devenyns (Responsable du projet Service Public d’Eolas) et Didier Gaultier (Customer Intelligence Director et Data Scientist de Business & Decision) ont réalisé une présentation fondamentale sur le thème de la donnée, carburant essentiel des Big Data, malheureusement trop méconnue des marketeurs.

Open Data : Le Web Sera Sémantique Ou Ne Sera Pas

Comprendre cette notion de donnée, ses fondements et son travail sont autant de pièces essentielles du puzzle des Big Data. En effet, comme l’a souligné Didier Gaultier dans sa présentation, « qui ne maîtrise pas ces fondements, ne peut prétendre un jour faire des Big Data ». Exemple frappant entre mille de l’importance des données, le phénomène de l’Open Data, qui révolutionne les usages des données. Au-delà des clichés liés à l’utilisation de ces données ouvertes pour développer des applications mobiles, l’Open Data crée un véritable écosystème destiné à favoriser l’émergence de nouveaux services, de nouveaux marchés, et permet aux entreprises d’innover. The Seven Most Popular APIs in Big Data – Part 1.

Vertigineux "big data". LE MONDE | • Mis à jour le | Par Sarah Belouezzane et Cécile Ducourtieux Photos, vidéos, sons, chiffres, textes...

Vertigineux "big data"

Depuis la démocratisation de l'Internet haut débit, ce sont des milliards de données qui sont déversées par les particuliers, les entreprises et même l'Etat sur la Toile. Les spécialistes appellent ça le "big data", littéralement "grosse donnée"... Ce vocable est un peu "marketing" : depuis dix-huit mois, pas une semaine ne passe sans un séminaire ou une nouvelle offre big data sur la planète high-tech. Big data approach to computationnal creativity. Les Big Data dans tous leurs états. ParisTech Review – En l’espace de deux ou trois ans, le thème des Big Data s’est imposé dans l’espace public, suscitant enthousiasme et réticences… sans qu’on sache toujours précisément de quoi il s’agit.

Les Big Data dans tous leurs états

Pouvez-vous nous l’expliquer rapidement ? Henri Verdier – Cette confusion n’a rien de surprenant, car non seulement c’est un thème récent mais, surtout, on assiste à un affrontement politique et économique autour de sa définition. L’expression « Big Data » renvoie à au moins trois phénomènes. Selon une acception étroite, elle désigne de nouvelles technologies informatiques dans le domaine du traitement de données massives. Selon une acception plus large, elle désigne la transformation économique et sociale induite par ces technologies. Big Data Livre Blanc Smile. Giaga, Terra, Petta, Zettabyte. Intel Optane, des disques SSD mille fois plus rapides. Associé à Micron Technology, Intel a développé un nouveau type de mémoire non volatile qui, selon lui, représente la première innovation majeure depuis l’introduction de la mémoire flash NAND en 1989. © Intel Intel Optane, des disques SSD mille fois plus rapides - 2 Photos À l’occasion de sa conférence Intel Developer Forum (IDF), Intel a annoncé l’arrivée en 2016 d’une nouvelle génération de SSD (solid-state drive en anglais) baptisés Optane.

Intel Optane, des disques SSD mille fois plus rapides

Le stockage des données repose ici sur une nouvelle mémoire 3D non volatile nommée 3D XPoint qui a été dévoilée le mois dernier. Le fondeur nord-américain la présente comme la première nouvelle catégorie de mémoire depuis l’avènement de la mémoire flash NAND il y a 25 ans. Elle a été co-développée avec Micron Technology et a nécessité une décennie de recherche. Cette mémoire d’un nouveau genre est censée répondre à l’explosion du volume de données que produisent les terminaux mobiles, les objets connectés et avec eux tous les services en ligne.

Big Data : Making sense at scale. D'un récent voyage dans la Silicon Valley (merci aux amis du Orange Institute), je rentre avec une conviction : tout ce que nous connaissions du web va changer à nouveau avec le phénomène des big data.

Big Data : Making sense at scale

Il pose à nouveau, sur des bases différentes, presque toutes les questions liées à la transformation numérique. En 2008, l’humanité a déversé 480 milliards de Gigabytes sur Internet. En 2010, ce furent 800 milliards de Gygabytes, soit, comme l’a dit un jour Eric Schmidt, plus que la totalité de ce que l’humanité avait écrit, imprimé, gravé, filmé ou enregistré de sa naissance jusqu’en 2003. Big Data with Twitter. Big Data (strategie.gouv.fr) Big Data : l’antisèche anti-blabla. Quoi ?

Big Data : l’antisèche anti-blabla

Mot clé à la mode, les "Big Data" agitent toutes les industries, de la politique au transport aérien, en passant par la télévision et bien sûr la publicité. L'essor des "Big Data" serait même l'une des raisons qui aurait poussé Publicis et Omnicom à se rapprocher pendant l'été. Big Data, la prochaine révolution informatique. La mine d'or du Big Data. LE MONDE ECONOMIE | • Mis à jour le | Par Julie Battilana, professeure associée à la Harvard Business School L'explosion du volume des données informatiques, du fait du développement de l'Internet et des nouvelles technologies de l'information, a ouvert de nouveaux horizons aux entreprises.

La mine d'or du Big Data

Certaines utilisent déjà une partie de ces données pour prédire le comportement des consommateurs et améliorer leur offre de produits et services. Big data for personnal medecine. Google Refine, working with messy data. 7 prédictions sur les big data en entreprise, Le Cercle. Politique Quand Manuel Valls évoque un "apartheid" en France + VIDEOS - Lors de ses vœux à la presse, Manuel Valls a promis ce mardi un combat contre les inégalités pour refonder « la citoyenneté ».

7 prédictions sur les big data en entreprise, Le Cercle

Monde Des pays musulmans s'enflamment toujours contre « Charlie Hebdo » Manifestations de colère en Russie, Iran, Niger, contre la publication d'un dessin de Mahomet considéré comme offensant. Europe. La fin de la science ? LE MONDE SCIENCE ET TECHNO | • Mis à jour le | David Larousserie Se pourrait-il que les changements techniques et théoriques induits par le « big data » aient des conséquences plus profondes, voire modifient le paradigme scientifique qui repose sur le couple déduction-induction ? Certains n’hésitent pas à franchir ce pas. En 2008, le rédacteur en chef du magazine américain Wired, Chris Anderson, avait lancé la polémique en parlant de « fin de la théorie » et d’« obsolescence de la méthode scientifique ». Plus récemment, en mars 2013 dans ParisTech Review, Jean-Pierre Malle, un ancien du groupe électronique Thales, annonçait l’« adieu à la pensée cartésienne » (titre de la version anglaise de sa tribune).

Big Data: The Evolution of Data [INFOGRAPHIC] NewSQL. Architecture de l'information #archinfo. Le vocabulaire du Data Scientist pour les nuls. Voici les principaux éléments de vocabulaire et acronymes à connaître autour de la Data Science et du Big data (cf. sourcing des définitions à la fin du post). Avec quelques explications vulgarisées selon ma compréhension et des schémas qui me semblent parlants. 10 minutes pour comprendre...NoSQL - Blog de David MASCLET.

Le partitionnement Le point de contention des applications est bien souvent la base de données qui lorsqu'elles sont transactionnelles, distribuées, ne permettent pas facilement le passage à l'échelle. Que l'on fasse du lock optimiste, pessimiste ou transaction à deux phases, on couple toujours les données entre elles, ce qui empêche la sérialisation. En plus, pour la sécurité de fonctionnement, il faut que les données soient répliquées, se qui complique encore un peu plus les choses. Dans les architectures modernes, la validation du modèle se fait désormais dans les objets, au niveau de l'applicatif. Blog. Exploration de données. Un article de Wikipédia, l'encyclopédie libre. Vous lisez un « bon article ». Big Data : comment transformer les masses de données brutes en stratégies gagnantes ! Avec l’explosion des usages internet et mobiles (réseaux sociaux, nouveaux services profilés…), l’arrivée de terminaux et boitiers de communication intelligents dans tous les aspects de la vie quotidienne et du monde industriel, la masse de données brutes s’est considérablement accrue.

Si la croissance exponentielle des informations ne date pas d’hier, les problèmes les plus ardus pour en tirer une réelle valeur ajoutée pour l’entreprise se concentrent autour de la vélocité (ex : leur vitesse de production), les critères de corrélation, la variabilité dans la qualité, l’hétérogénéité des structures, les cycles de vie et fréquences différentes, des contraintes sécurités et des exigences légales spécifiques… Ce véritable tsunami, appelé « Big Data » remet au premier plan la sempiternelle problématique de gestion et d’exploitation de l’information dans les entreprises. Le Big Data, c’est quoi ? Quels enjeux pour la direction métier et la DSI ? Le web de données et l'ère du Big DataLe blog de Jérémie Let. Science des données. Un article de Wikipédia, l'encyclopédie libre.

En termes généraux, la science de données est l'extraction de connaissance de données[1],[2]. Elle emploie des techniques et des théories dessinées (tirées) de beaucoup de champs (domaines) dans les larges zones (domaines) de mathématiques, la statistique, la théorie de l'information et la technologie de l'information, y compris le traitement de signal, des modèles de probabilité, l'apprentissage automatique, l'apprentissage statistique, la programmation informatique, l'ingénierie de données, la reconnaissance de formes et l'apprentissage, la visualisation, l'analytique prophétique, la modélisation d'incertitude, le stockage de données, la compression de données et le calcul à haute performance. Les méthodes qui s'adaptent aux données de masse sont particulièrement intéressantes dans la science de données, bien que la discipline ne soit généralement pas considérée comme limitée à ces données. Objectifs[modifier | modifier le code]

Understandable Big Data: A survey. Survey. MongoDB sacré SGBD de l'année 2013, le système de gestion de base de données NoSQL sort premier d'un classement ultra sélectif. Solid IT la firme à l’origine du classement des SGBD (Systèmes de Gestions de Base de Données) en fonction de leurs popularité récidive, et propose le classement du SGBD le plus populaire pour l’année 2013. Popularity ranking of database management systems. DCL12403USEN.PDF. The Semantic Abyss - Plumbing the Semantic Web: Simple acronyms in SKOS Turtle and RDF. Open BIM Query Language. The IFC model, the EMF model, the BIMserver.org Java classes and the BimQL Java classes are all related to each other. This page explains how they are related and simultaneously explains how BimQL was created. IFC model and EXPRESS The IFC (Industry Foundation Classes) data model is intended to describe building and construction industry data.

IFC is the most widely used and most mature open standard for BIM models. The IFC data model is written in EXPRESS. ENTITY IfcDoor SUPERTYPE OF (IfcDoorStandardCase) SUBTYPE OF (IfcBuildingElement); OverallHeight: OPTIONAL IfcPositiveLengthMeasure; OverallWidth : OPTIONAL IfcPositiveLengthMeasure; END_ENTITY; Open BIM Query Language. Open BIM Query Language. Popularity ranking of database management systems. Un exemple du mauvais usage de MongoDB. Lors de mes articles sur MongoDB, je concluais sur le fait qu’il ne conviendrait pas à tous les schémas de données. Je suis tombé sur un article très long, en anglais, qui explique très bien le problème avec une expérience très concrète, le début du développement de Diaspora (si ce réseau social décentralisé vous intéresse, vous pouvez vous inscrire sur Framasphere).

Knowledge Base of Relational and NoSQL Database Management Systems. NoSQL : arrêtons de dire n’importe quoi. J’ai regardé le mouvement NoSQL évoluer au fil des années. Time Series DBMS as a new trend? HStore — Postgres Guide. F.13. hstore. RRDtool System Properties. DB-Engines - DBMS Encyclopedia. AllegroGraph RDFStore Web 3.0's Database. NoSQL Databases: An Overview. Résultats Google Recherche d'images correspondant à. Introduction NoSql 201406 - lbroudoux. BigData_Chp3: NOSQL. Cas client : Big Data et domotique - VirtualScale.