background preloader

Système de gestion de base de données

Système de gestion de base de données
Un article de Wikipédia, l'encyclopédie libre. En informatique un système de gestion de base de données (abr. SGBD) est un logiciel système destiné à stocker et à partager des informations dans une base de données, en garantissant la qualité, la pérennité et la confidentialité des informations, tout en cachant la complexité des opérations. Un SGBD (en anglais DBMS pour database management system) permet d'inscrire, de retrouver, de modifier, de trier, de transformer ou d'imprimer les informations de la base de données. Les systèmes de gestion de base de données sont des logiciels universels, indépendants de l'usage qui est fait des bases de données[2]. En 2011 la majorité des SGBD du marché manipulent des bases de données relationnelles. But visé[modifier | modifier le code] Les SGBD sont les logiciels intermédiaires entre les utilisateurs et les bases de données. Les données sont enregistrées sous forme de suites de bits représentant des lettres, des nombres, des couleurs, des formes,...

Introduction aux systèmes de gestion de bases de données Une page de Wikiversité. Début de la boite de navigation du chapitre fin de la boite de navigation du chapitre En raison de limitations techniques, la typographie souhaitable du titre, « Introduction aux systèmes de bases de données : IntroductionIntroduction aux systèmes de bases de données/Introduction », n'a pu être restituée correctement ci-dessus. Schéma conceptuel[modifier | modifier le wikicode] De manière générale, un schéma conceptuel[1] est une représentation d'un ensemble de concepts reliés sémantiquement entre eux. La relation entre les concepts s'appuie sur des termes exprimant cette relation: « appartiens à », « passe par », « mène à », « prévient que », « favorise »… Le schéma conceptuel poursuit plusieurs buts : représenter le modèle mental d'une situation, que cette représentation soit personnelle, celle d'un groupe ou d'une organisation ;résumer la structure de la connaissance extraite d'ouvrages écrits (état de l’art technique). [modifier | modifier le wikicode]

Exploration de données Un article de Wikipédia, l'encyclopédie libre. Vous lisez un « bon article ». L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. C'est aussi le mode de travail du journalisme de données[1]. L'exploration de données[2] fait suite, dans l'escalade de l'exploitation des données de l'entreprise, à l'informatique décisionnelle. Histoire[modifier | modifier le code] Collecter les données, les analyser et les présenter au client. De 1919 à 1925, Ronald Fisher met au point l'analyse de la variance comme outil pour son projet d'inférence statistique médicale. L'arrivée progressive des micro-ordinateurs permet de généraliser facilement ces méthodes bayésiennes sans grever les coûts. Applications industrielles[modifier | modifier le code]

Base de données relationnelle Un article de Wikipédia, l'encyclopédie libre. Le modèle de données relationnel permet d'utiliser les opérateurs de l'algèbre relationnelle pour retrouver une information quelconque stockée dans la base de données, ainsi que les informations connexes. Histoire[modifier | modifier le code] Dans les années 1965-1975, avec le développement de l'informatique dans les grands comptes, le besoin d'organiser les données selon un modèle qui permettrait d'établir une séparation entre la représentation logique des données et leur organisation physique (informatique) s'est fait de plus en plus sentir. Les modèles alors disponibles (modèles hiérarchique et réseau — rien à voir avec TCP/IP ou Internet) établissaient des liens forts (en fait des pointeurs physiques de stockage) à l'intérieur même du modèle de représentation des données. Le modèle de données relationnel a été défini en 1970 par l'informaticien britannique Edgar F. Modèle relationnel[modifier | modifier le code] Opérateurs :

Analyse des données Un article de Wikipédia, l'encyclopédie libre. L’analyse des données permet de traiter un nombre très important de données et de dégager les aspects les plus intéressants de la structure de celles-ci. Le succès de cette discipline dans les dernières années est dû, dans une large mesure, aux représentations graphiques fournies. Ces graphiques peuvent mettre en évidence des relations difficilement saisies par l’analyse directe des données ; mais surtout, ces représentations ne sont pas liées à une opinion « a priori » sur les lois des phénomènes analysés contrairement aux méthodes de la statistique classique. Les fondements mathématiques de l’analyse des données ont commencé à se développer au début du XXe siècle, mais ce sont les ordinateurs qui ont rendu cette discipline opérationnelle, et qui en ont permis une utilisation très étendue. fig.18 - Cartographie spectrale des Iris de Fisher qui ont donné lieu à de nombreuses études en analyse des données. Histoire[modifier | modifier le code]

NoSQL : le supra paradigme des bases de données, à votre portée. NoSQL signifie «Not only SQL». L’idée de nommer un principe par une éventualité négative parait curieuse, comme si elle démontrait qu’une limitation a été dépassée. Suivez le guide… SQL (Structured Query Language) : Langage informatique normalisé servant à exploiter des bases de données relationnelles. Base de données relationnelles : Stock d'informations décomposées et organisées dans des matrices appelées relations ou tables. Les Système de Gestion de Bases de Données Relationnelles (SGBDR) doivent répondre aux principes ACID Atomicité : une «transaction» ne peut pas être découpée. Cependant, en raison de l’explosion de la quantité de données à traiter et surtout de leur mise en réseau, dans «le nuage», on s’est buté aux conditions trop rigides d’ACID. Quand on couple deux bases de données, on doit doubler plusieurs éléments pour respecter les conditions ACID, mais si on doit en coupler 20 ou 200, on arrive rapidement à une impossibilité matérielle. Pour le monde de l’enseignement

Superordinateur Un article de Wikipédia, l'encyclopédie libre. Superordinateur à la NASA. Le superordinateur JET. Un superordinateur, ou supercalculateur, est un ordinateur conçu pour atteindre les plus hautes performances possibles avec les technologies connues lors de sa conception, en particulier en termes de vitesse de calcul. La science des superordinateurs est appelée « calcul à haute performance » (en anglais high-performance computing, HPC). Historique[modifier | modifier le code] Les premiers superordinateurs sont apparus dans les années 1960, conçus par Seymour Cray pour le compte de la société Control Data Corporation (CDC), premier constructeur mondial de superordinateurs jusque dans les années 1970. Utilisation[modifier | modifier le code] Total de la puissance de calcul des 500 meilleurs supercalculateurs mondiaux de 1993 à 2008 (selon TOP500). Les institutions de recherche civiles et militaires comptent parmi les plus gros utilisateurs de superordinateurs. Conception[modifier | modifier le code]

NoSQL : 5 minutes pour comprendre NoSQL signifie “Not Only SQL”, littéralement “pas seulement SQL”. Ce terme désigne l’ensemble des bases de données qui s’opposent à la notion relationnelle des SGBDR. La définition, “pas seulement SQL”, apporte un début de réponse à la question “Est ce que le NoSQL va tuer les bases relationnelles?”. En effet, NoSQL ne vient pas remplacer les BD relationnelles mais proposer une alternative ou compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans certains contextes. Mais pourquoi le NoSQL ? Le premier besoin fondamental auquel répond NoSQL est la performance. Cohérence : tous les noeuds du système voient exactement les mêmes données au même momentHaute disponibilité (Availability) : en cas de panne, les données restent accessiblesTolérance au Partitionnement : le système peut être partitionné Mais le théorème du CAP précise aussi que seulement deux de ces trois contraintes peuvent être respectées en même temps. Conclusion

Cloud computing Un article de Wikipédia, l'encyclopédie libre. Le cloud computing[1], ou l’informatique en nuage ou nuagique ou encore l’infonuagique (au Québec), est l'exploitation de la puissance de calcul ou de stockage de serveurs informatiques distants par l'intermédiaire d'un réseau, généralement Internet. Ces serveurs sont loués à la demande, le plus souvent par tranche d'utilisation selon des critères techniques (puissance, bande passante, etc.) mais également au forfait. Terminologie[modifier | modifier le code] En France, la Commission générale de terminologie et de néologie précise qu'il s'agit d'une forme particulière de gérance de l'informatique, dans laquelle l'emplacement et le fonctionnement dans le nuage ne sont pas portés à la connaissance des clients[7]. Les francisations « informatique en nuage »[7], « informatique dématérialisée »[9], ou plus rarement « infonuagique »[10] sont également utilisées. Principes - le Nuage[modifier | modifier le code] Services[modifier | modifier le code]

NoSQL Un article de Wikipédia, l'encyclopédie libre. En informatique, NoSQL désigne une famille de systèmes de gestion de base de données (SGBD) qui s'écarte du paradigme classique des bases relationnelles. L'explicitation du terme la plus populaire de l'acronyme est Not only SQL (« pas seulement SQL » en anglais) même si cette interprétation peut être discutée[1]. La définition exacte de la famille des SGBD NoSQL reste sujette à débat. L'architecture machine en clusters induit une structure logicielle distribuée fonctionnant avec des agrégats répartis sur différents serveurs permettant des accès et modifications concurrentes mais imposant également de remettre en cause de nombreux fondements de l'architecture SGBD relationnelle traditionnelle, notamment les propriétés ACID. Éléments historiques[modifier | modifier le code] La domination historique des SGBD relationnels[modifier | modifier le code] Les pionniers du modèle "NoSQL"[modifier | modifier le code] Théorie[modifier | modifier le code]

MapReduce Un article de Wikipédia, l'encyclopédie libre. Les termes « map » et « reduce », et les concepts sous-jacents, sont empruntés aux langages de programmation fonctionnelle utilisés pour leur construction (map et réduction de la programmation fonctionnelle et des langages de programmation tableau). MapReduce permet de manipuler de grandes quantités de données en les distribuant dans un cluster de machines pour être traitées. Ce modèle connaît un vif succès auprès de sociétés possédant d'importants centres de traitement de données telles Amazon ou Facebook. Il commence aussi à être utilisé au sein du Cloud computing. Présentation[modifier | modifier le code] Un modèle de programmation[modifier | modifier le code] MapReduce est un modèle de programmation popularisé par Google. MapReduce consiste en deux fonctions map() et reduce(). Dans l'étape Map le nœud analyse un problème, le découpe en sous-problèmes, et les délègue à d'autres nœuds (qui peuvent en faire de même récursivement). Hadoop Logo

Related: