background preloader

NoSQL : 5 minutes pour comprendre

NoSQL : 5 minutes pour comprendre
NoSQL signifie “Not Only SQL”, littéralement “pas seulement SQL”. Ce terme désigne l’ensemble des bases de données qui s’opposent à la notion relationnelle des SGBDR. La définition, “pas seulement SQL”, apporte un début de réponse à la question “Est ce que le NoSQL va tuer les bases relationnelles?”. En effet, NoSQL ne vient pas remplacer les BD relationnelles mais proposer une alternative ou compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans certains contextes. Mais pourquoi le NoSQL ? Le premier besoin fondamental auquel répond NoSQL est la performance. Cohérence : tous les noeuds du système voient exactement les mêmes données au même momentHaute disponibilité (Availability) : en cas de panne, les données restent accessiblesTolérance au Partitionnement : le système peut être partitionné Mais le théorème du CAP précise aussi que seulement deux de ces trois contraintes peuvent être respectées en même temps. Conclusion

Terminate an R Session Description The function quit or its alias q terminate the current R session. Usage quit(save = "default", status = 0, runLast = TRUE) q(save = "default", status = 0, runLast = TRUE) Arguments Details save must be one of "no", "yes", "ask" or "default". Immediately before terminating, .Last() is executed if the function .Last exists and runLast is true. Exactly what happens at termination of an R session depends on the platform and GUI interface in use. Some error statuses are used by R itself. Valid values of status are system-dependent, but 0:255 are normally valid. Note The R.app GUI on OS X has its own version of these functions with slightly different behaviour for the save argument (the ‘Startup’ preferences for this action are taken into account). References Becker, R. See Also .First for setting things on startup. Examples [Package base version 3.1.0 Index]

NoSQL Un article de Wikipédia, l'encyclopédie libre. En informatique, NoSQL désigne une famille de systèmes de gestion de base de données (SGBD) qui s'écarte du paradigme classique des bases relationnelles. L'explicitation du terme la plus populaire de l'acronyme est Not only SQL (« pas seulement SQL » en anglais) même si cette interprétation peut être discutée[1]. La définition exacte de la famille des SGBD NoSQL reste sujette à débat. Le terme se rattache autant à des caractéristiques techniques qu'à une génération historique de SGBD qui a émergé à la fin des années 2000/début des années 2010[2]. D'après Pramod J. L'architecture machine en clusters induit une structure logicielle distribuée fonctionnant avec des agrégats répartis sur différents serveurs permettant des accès et modifications concurrentes mais imposant également de remettre en cause de nombreux fondements de l'architecture SGBD relationnelle traditionnelle, notamment les propriétés ACID. Théorie[modifier | modifier le code]

Limites du modèle relationnel Les technologies Objet de développement d'applications sont désormais bien présentes dans les entreprises. Les langages tels que C++, Java, Python,… sont largement utilisés. Par contre, le stockage des informations est le plus souvent réalisé par l'utilisation de Systèmes de Gestion de Bases de Données Relationnels. Le développeur se trouve de ce fait souvent confronté au problème du mapping Objet/Relationnel qui non seulement coûte cher en développement mais ralenti aussi l'exécution des programmes. A ce constat il faut ajouter la pauvreté sémantique du modèle relationnel qui ne permet pas de prendre en compte efficacement les nouveaux besoins liées aux informations multimédia. Par exemple, si on se propose de gérer des pièces de théâtre et d'enregistrer pour chaque pièce les artistes qui composent sa troupe, on va naturellement imaginer qu'on aura à gérer: Avec un SGBD relationnel, il va falloir prévoir trois tables: Généralement, il est intéressant de combiner ces trois modes d'accès.

UNIX / Linux Tutorial for Beginners A beginners guide to the Unix and Linux operating system. Eight simple tutorials which cover the basics of UNIX / Linux commands. Introduction to the UNIX Operating System What is UNIX? Files and processes The Directory Structure Starting an UNIX terminal Tutorial One Listing files and directories Making Directories Changing to a different Directory The directories . and .. Recommended UNIX and Linux books If you wish to continue learning Unix, here is a list of good Unix and Linux books, ranging from beginners to advanced. Download This tutorial is available for download so you can work offline.

Will NoSQL and Big Data Kill the DBA? - AppDynamics: The APM Blog Remember the good old days where developers and DBAs would argue over who and what was killing the relational database? “It’s your crap SQL,” “You forgot to create an index,” “You don’t know what an index is”…and so on. Do you remember when the DBA occasionally spoke and served out humble pie on how to make SQL statements go faster? Well my friends, those biblical days could soon be over with the adoption of NoSQL technologies. Or is that not true? If you look back at the last decade, there is no doubt nearly all business today is connected or conducted online. In the olden days I spent many days and nights working with customers to help scale their applications through the rise and fall of the Internet. The problem today is that relational databases make it really difficult for organizations to scale their applications to deal with high user concurrency and transaction volumes. So how can you leverage NoSQL and make your applications more elastic? So will the DBA die? App Man.

Comment faire le choix d'une architecture Big Data ? Aujourd'hui, les entreprises ont des informations provenant de différents canaux pour tous leurs aspects métier. L'utilisation correcte de ces données permet de créer la valeur et d'avoir un avantage concurrentiel. Différentes entreprises ont compris la valeur des données et les bénéfices qu'ils peuvent en tirer, telles que Google, Facebook et Amazon, entre autres. Cependant, d'autres entreprises ont du mal à comprendre ce que signifie le big data pour eux. Les entreprises sont habituées à utiliser les SGBDR pour stocker des données structurées sur une seule machine, qui prennent en charge des centaines d'utilisateurs simultanés. Pendant des décennies les SGBDR ont permis de stocker, de servir et de traiter des données. I-A. L'approche SGBDR ne respecte pas les exigences des entreprises du Web 2.0 telles que Google, Amazon, Yahoo, Facebook et LinkedIn. I-B. La plupart des données sont générées par des utilisateurs ou des machines. I-B-1. III-A. III-B. III-C. III-C-1. III-C-2. III-C-3.

Tutoriels Unix Notion de droits Les droits d'accès aux fichiers (appelés encore modes ou permissions) sont un point essentiel du système Unix. Ils permettent de définir des droits différents sur un même fichier selon la catégorie d'utilisateurs. Ainsi les manipulations de fichiers sont restreintes selon les droits alloués à chaque fichier. Affichage des droits (ls) Pour afficher à l'écran les droits alloués à un fichier, il faut utiliser la commande ls -l qui permet de lister les fichiers d'un répertoire avec toutes les informations connexes possibles dont les droits du fichier. Exemple :ls -l-rw-r--r-- cyberzoide univ astuces.txtdrwxr-xr-x cyberzoide univ data-rw-r--r-- cyberzoide univ lettre.doc-rw------- cyberzoide univ Mail Ici n'ont été reproduites que les informations intéressantes affichées par la commande (certaines ont été effacées). En préfixe des droits (et ici en noir) est affiché le type du fichier (d pour les répertoires et - pour les fichiers normaux et les exécutables). Droits d'accès

Introduction au NoSQL Apache CASSANDRA : installation, prise en main rapide et outils d'administration Ce premier article d'une série de cinq sur la base de données NoSQL Apache Cassandra présente brièvement les fonctionnalités, l'installation, une première prise en main et quelques outils d'administration. Cet article introductif ne se veut pas être exhaustif, mais présente les concepts du NoSQL Cassandra, plébiscités par de nombreux acteurs du Web, nécessaires aux articles suivants. Les articles de la série consacrée à Apache Cassandra sont décrits ci-dessous : Article 1 : installation, prise en main rapide et outils d'administration Article 2 : modèle de données et API Java (Hector, Astyanax et JDBC) Cette liste sera complétée au fur et à mesure des publications. Je tiens à préciser que je ne suis pas un spécialiste de Cassandra. Si vous souhaitez donner votre avis sur le contenu de cet article, exprimez votre opinion, profitez de cette discussion 8 commentaires Article lu 41315 fois. N'hésitez pas à consulter ce glossaire. I-A. I-B. I-C. I-C-1. La valeur n'est pas obligatoire. I-C-2.

Une nouvelle étude montre la montée en puissance du NoSQL, avec de plus en plus d'entreprises qui se tournent vers le cloud public La NoSQL désigne une famille de systèmes de gestion de bases de données (SGBD) qui s’écarte du paradigme classique des bases relationnelles. À partir des années 2000, les grandes entreprises du web ont été amenées à traiter des volumes de données très importants, une tâche non adaptée au modèle relationnel qui souffre de plusieurs limitations liées au fait qu’il a été conçu pour fonctionner sur des ordinateurs uniques. Afin de répondre à ces limites, ces entreprises ont commencé à développer de nouvelles solutions de gestion de bases de données pouvant fonctionner sur des architectures matérielles distribuées et permettant de traiter des volumes de données importants. Ces nouveaux systèmes NoSQL sont dotés de performances qui restent bonnes avec la montée en charge (scalabilité) en multipliant simplement le nombre de serveurs, solution raisonnable avec la baisse de coûts. Classement des différentes SGBD NoSQL sur le marché Source : Forrester - Gartner Et vous ? Qu'en pensez-vous ?

Quelques commandes Unix avancées On attaque la troisième partie de la série de tutoriels consacrés aux commandes Ubuntu et Unix de manière générale. Avant de continuer, je vous recommande de regarder les billets sur : quelques généralités Unix & quelques commandes indispensables . Dans cette troisième partie, nous aborderons quelques commandes Unix avancées (ce n’est pas pour autant que c’est compliqué). C’est à partir de cette vidéo que l’on s’en rend réellement compte de l’avantage de la console sous Unix et à quel point ça peut être plus rapide qu’une interface graphique classique. Voici le sommaire de que nous allons apprendre : Les processus Lister des processus : ps & top Arrêter des processus : kill Recherche Rechercher des fichiers : locate & find Filtrer les données Afficher le début ou la fin d’un fichier : head & tail Rechercher des mots clés dans un fichier : grep & sed Découper en colonnes : cut Trier des données : sort Compter des occurrences : wc

Learn more about NoSQL databases NoSQL encompasses a wide variety of different database technologies and were developed in response to a rise in the volume of data stored about users, objects and products, the frequency in which this data is accessed, and performance and processing needs. Relational databases, on the other hand, were not designed to cope with the scale and agility challenges that face modern applications, nor were they built to take advantage of the cheap storage and processing power available today. Document databases pair each key with a complex data structure known as a document. Documents can contain many different key-value pairs, or key-array pairs, or even nested documents.Graph stores are used to store information about networks, such as social connections. Graph stores include Neo4J and HyperGraphDB.Key-value stores are the simplest NoSQL databases. Every single item in the database is stored as an attribute name (or "key"), together with its value. Dynamic Schemas Auto-sharding Replication

Pour Angela Merkel, les bases de données sont «la matière première du XXIe siècle» FIGAROVOX/ANALYSE - Au Forum économique mondial, Angela Merkel souligne l'urgence pour l'Union européenne d'axer son développement économique sur la gestion du big data. Par Alicia González, correspondante économique internationale de El País. Après que ses gros titres ont fait la une, la réunion annuelle du Forum économique mondial (WEF, selon son sigle en anglais) laisse certains sujets pour le débat et la réflexion. Il convient d'ailleurs de bien y prêter attention. La question soulevée par la chancelière Angela Merkel à propos de la fracture numérique et du modèle à choisir en Europe pour gérer les millions de données produites chaque jour par ses citoyens constitue un des principaux thèmes de cette année. Le débat suscité par Mme Merkel n'est pas des moindres. La Chine et les États-Unis dominent le marché des technologies et livrent à des pays tiers, dont l'Union européenne, les appareils, les programmes et les antivirus utilisés au quotidien.

ocropus - The OCRopus(tm) open source document analysis and OCR system

Related: