background preloader

NoSql

Facebook Twitter

Big Data : la nécessité d’un débat. Il nous a semblé intéressant de traduire, de façon collaborative (via Framapad), l’essai original que viennent de publier danah boyd et Kate Crawford présentant « Six provocations au sujet du phénomène des Big Data ».Ces chercheuses, orientées vers l’ethnographie des usages des technologies de communication, s’interrogent – en toute connaissance de cause [cf. cette étude sur les tweets des révolutions tunisiennes et égyptiennes à laquelle a participé danah boyd]- sur les limites épistémologiques, méthodologiques, mais aussi éthiques des Big Data : champ d’études qui s’ouvre aujourd’hui sur la base des énormes jeux de données que fournit internet, en particulier celles générées par l’activité des usagers des sites de réseaux sociaux, que seuls des systèmes informatiques ont la capacité de collecter et de traiter. 6 provocations à propos des Big Data Traduction : Pierre Grosdemouge (@cultord) & Fred Pailler (@Sociographie) à l’initiative de Laurence Allard.

Big Data : la nécessité d’un débat

L’ère de Big Data a commencé. Le problème de la gauche avec internet. David Golumbia (@dgolumbia), auteur de La logique culturelle de l'informatique, publie une intéressante tribune dans Jacobin, le magazine socialiste américain.

Le problème de la gauche avec internet

Comment expliquer, questionne-t-il, que si la révolution numérique produit de la démocratie, déstabilise les hiérarchies, décentralise ce qui était centralisé... bref, favorise les valeurs de gauche, celle-ci semble alors plus dispersée que jamais, et même en voie de disparition dans les démocraties les plus avancées ? Image : l'intérieur d'un ordinateur en 3D par Fidelis. Quelle est la nature libératoire de l'informatique ? Pour David Golumbia, la raison est à chercher dans le cyber-libertarianisme. Ce terme introduit dans les années 90 par les théoriciens des médias Richard Barbrook et Andy Cameron, auteurs de "l'idéologie californienne" (Wikipédia, voir sa traduction en français), l'ont utilisé pour décrire le fonctionnement de la Silicon Valley. Comment le solutionnisme sape les fondements mêmes de l'engagement Hubert Guillaud. The time for NoSQL standards is now. A decline for Oracle over the next 15 years is inevitable.

The time for NoSQL standards is now

It will be impossible to sustain the RDBMS-only paradigm against all logic as the new wave of databases lumped in under NoSQL and big data takes over. Oracle is responding with partnerships, and it already has a NoSQL database, but it's difficult to imagine a transition that leaves Oracle's revenue stream intact -- smells almost like Novell, circa 1996. Yet the RDBMS will take its time to fade. The reason? Aside from the obvious -- it's an entrenched technology -- the advantages that made the RDBMS ubiquitous in the first place are going to keep it around a bit longer. [ Harness the power of Hadoop with InfoWorld's 7 top tools for taming big data. | Find out which database works best for you in InfoWorld Test Center's survey, "NoSQL standouts: New databases for new applications. " | Follow the latest issues in software development with InfoWorld's Developer World newsletter. ] Standards, anyone? NoSQL Databases and Polyglot Persistence: A Curated Guide.

NoSQL. Malgré l’appellation NoSQL, ce n’est pas tant le langage SQL en lui même qui est inadapté mais les grands principes sur lesquels il a été construit : le modèle relationnel et transactionnel.

NoSQL

En effet, les bases de données relationnelles mettent à la disposition des développeurs un certains nombre d’opérations de relations entre les tables : un système de jointure entre les tables permettant de construire des requêtes complexes faisant intervenir plusieurs entités (les tables en l'occurrence) un système d’intégrité référentielle permettant de s’assurer que les liens entre les entités sont valides La mise en œuvre de tels mécanismes a un coût considérable dés lors que l’on se trouve dans le contexte d’un système distribué. Big Data : Cassandra 1.2, base de données NoSQL open source. Cassandra 1.2 s’annonce comme une version majeure de cette base de données NoSQL open source.

Big Data : Cassandra 1.2, base de données NoSQL open source

Cette seconde génération de la base apporte son lot de nouvelles fonctionnalités validées par l’ASF (Apache Software Foundation). Cassandra 1.2 est tout d’abord une base de données haute performance, capable de traiter simultanément des milliers de requêtes, destinée au Big Data, NoSQL pour traiter la diversité des informations non structurées – par opposition aux données SQL structurées -, scalable pour évoluer sans interruption et à tolérance de panne.

Cette nouvelle version a densifié le support des clusters avec le clustering au travers de nœuds virtuels (vnode), chaque nœud pouvant supporter plusieurs téraoctets de données, la virtualisation des nodes simplifiant la gestion des clusters et réduisant la charge des machines virtuelles Java. Atomic batches et CQL3 Enfin Cassandra 1.2 intègre la version 3 de CQL (Cassandra Query Language). Une communauté enrichie. NoSQL : 5 minutes pour comprendre. NoSQL signifie “Not Only SQL”, littéralement “pas seulement SQL”.

NoSQL : 5 minutes pour comprendre

Ce terme désigne l’ensemble des bases de données qui s’opposent à la notion relationnelle des SGBDR. La définition, “pas seulement SQL”, apporte un début de réponse à la question “Est ce que le NoSQL va tuer les bases relationnelles?”. En effet, NoSQL ne vient pas remplacer les BD relationnelles mais proposer une alternative ou compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans certains contextes. Mais pourquoi le NoSQL ? Le premier besoin fondamental auquel répond NoSQL est la performance. NOSQL Databases.