background preloader

Ontologie est surfaite - Catégories, liens et tags

Ontologie est surfaite - Catégories, liens et tags
Ontology is Overrated: Categories, Links, and Tags This piece is based on two talks I gave in the spring of 2005 -- one at the O'Reilly ETech conference in March, entitled "Ontology Is Overrated", and one at the IMCExpo in April entitled "Folksonomies & Tags: The rise of user-developed classification." The written version is a heavily edited concatenation of those two talks. Today I want to talk about categorization, and I want to convince you that a lot of what we think we know about categorization is wrong. In particular, I want to convince you that many of the ways we're attempting to apply categorization to the electronic world are actually a bad fit, because we've adopted habits of mind that are left over from earlier strategies. I also want to convince you that what we're seeing when we see the Web is actually a radical break with previous categorization strategies, rather than an extension of them. PART I: Classification and Its Discontents # Q: What is Ontology? And yet. Domain Related:  ontologie

Loi de lotka Loi de lotka (1926) : L’objectif de la loi est de mesurer la contribution de chaque chercheur « publiant » au progrès scientifique. Elle stipule qu’un effectif réduit de chercheurs produit un nombre important de publication. En effet, en réalisant une étude sur la distribution des auteurs scientifiques, Lotka est arrivé à la conclusion suivante : le nombre de chercheurs « publiant » ni qui écrivent i articles est égale à : Avec : i max la productivité maximale d’un chercheur. Exemple : supposons que i vari de 1 à 6 et que le nombre de chercheurs ayant publié un seul article est n1=100, la loi de Lotka permet de calculer ni : Le nombre de chercheurs ayant publiés deux articles est de 25, trois articles 11…. ,3 ayant publiés 6 articles i max.

Loi de Zipf Un article de Wikipédia, l'encyclopédie libre. Pour les articles homonymes, voir Zipf. La loi de Zipf est une observation empirique concernant la fréquence des mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950). Genèse[modifier | modifier le code] le mot le plus courant revenait 8 000 fois ;le dixième mot 800 fois ;le centième, 80 fois ;et le millième, 8 fois. Ces résultats semblent, à la lumière d'autres études que l'on peut faire en quelques minutes sur son ordinateur, un peu trop précis pour être parfaitement exacts — le dixième mot dans une étude de ce genre devrait apparaître dans les 1 000 fois, en raison d'un effet de coude observé dans ce type de distribution. où K est une constante. Point de vue théorique[modifier | modifier le code] avec s juste légèrement plus grand que 1. Définition mathématique[modifier | modifier le code] Notons les paramètres de la loi de Zipf par pour le nombre d'éléments (de mots), leur rang, et le paramètre . où .

SPEAR Algorithm The SPEAR algorithm is a tool for ranking users in social networks by their expertise and influence within the community. In 2009, my co-worker Ching-man Au Yeung from University of Southampton and I presented the SPEAR ranking algorithm in our joint paper Telling Experts from Spammers: Expertise Ranking in Folksonomies at the ACM SIGIR 2009 Conference in Boston, USA. The graph-based SPEAR ranking algorithm (Spamming-resistant Expertise Analysis and Ranking) is a new technique to measure the expertise of users by analyzing their activities. The focus is on the ability of users to find new, high quality information in the Internet. At the same time, the algorithm has been shown to be very resistant to spamming attacks. The original use case – and the one described in our SIGIR paper – has been to find expert users and high quality websites for a given topic on the social bookmarking service Delicious.com, back in 2009 still a Yahoo! The two main elements of the SPEAR algorithm are: C.

Réseau bayésien Un article de Wikipédia, l'encyclopédie libre. Un réseau bayésien est en informatique et en statistique un modèle graphique probabiliste représentant des variables aléatoires sous la forme d'un graphe orienté acyclique. Intuitivement, ils sont à la fois : Pour un domaine donné (par exemple médical), on décrit les relations causales entre variables d'intérêt par un graphe. Dans ce graphe, les relations de cause à effet entre les variables ne sont pas déterministes, mais probabilisées. Ainsi, l'observation d'une cause ou de plusieurs causes n'entraîne pas systématiquement l'effet ou les effets qui en dépendent, mais modifie seulement la probabilité de les observer. L'intérêt particulier des réseaux bayésiens est de tenir compte simultanément de connaissances a priori d'experts (dans le graphe) et de l'expérience contenue dans les données. Intuition[modifier | modifier le code] Un exemple très simple dans la modélisation des risques[modifier | modifier le code] Fig. 1 : structure de causalité.

Protégé Fonctionnalités générales La plateforme Protégé, est un éditeur d'ontologies, et un framework de base de connaissances très convivial, basé sur Java. Une ontologie, en informatique, est un ensemble structuré de savoirs dans un domaine de connaissance particulier. Protégé offre 3 approches pour développer une ontologie : l'éditeur Protégé-OWL permet de construire des ontologies pour le web sémantique (Protégé 3.4.2 et Protégé 4.0.2),l'éditeur Protégé-Frames permet de construire et peupler des bases de connaissances basées sur des frames (Protégé 3.4.2),l'équipe de développement de Protégé, travaille également sur l'édition d'ontologies à travers une interface web (WebProtégé 0.5 alpha). Protégé permet d'utiliser le langage OWL, qui est le langage informatique utilisé pour modéliser des ontologies. Protégé permet un fonctionnement en mode client/serveur avec une gestion des droits ajustables en fonction des profils souhaités. Autres fonctionnalités Interopérabilité

documentation:ontologie:index [Portail des services RENATER] Ce projet de documentation des dépendances des services (applicatives, matérielles, humaines) a été initié à l'époque du CRU (Comité Réseau des Universités), avant son intégration à RENATER. Il n'est à l'heure actuelle plus développé. Pour ce projet nous avons développé une ontologie avec le logiciel Protégé. Voir article JRes 2009, diaporama JRes 2009, présentation JRes 2009. Vous trouverez ici un modèle d'ontologie du SI pour la Description Structurée des Dépendances des Services sous différents formats : Web Ontology Language : OWL V1 (2010/05/12) Ressource Description Framework Schéma : RDFs (2009/12/18) AVERTISSEMENT : Ces scripts ont été écrits pour mettre en forme les fichiers .dot générés par le plugin Ontoviz de Protégé dans le contexte du CRU. Voici le genre de graphe des dépendances que l'on aimerait pouvoir générer : Réussir à modéliser la configuration du réseau.

jplu.developpez.com :: Espace personnel de Julien Plu SKOS Simple Knowledge Organization System Reference 1. Introduction 1.1. Background and Motivation The Simple Knowledge Organization System is a data-sharing standard, bridging several different fields of knowledge, technology and practice. In the library and information sciences, a long and distinguished heritage is devoted to developing tools for organizing large collections of objects such as books or museum artifacts. The W3C's Semantic Web Activity [SW] has stimulated a new field of integrative research and technology development, at the boundaries between database systems, formal logic and the World Wide Web. These technologies are being applied across diverse applications, because many applications require a common framework for publishing, sharing, exchanging and integrating ("joining up") data from different sources. One facet of the Semantic Web vision is the hope of better organizing the vast amounts of unstructured (i.e., human-readable) information in the Web, providing new routes to discovering and sharing that information.

Ontologie (informatique) Un article de Wikipédia, l'encyclopédie libre. Par analogie, le terme est repris en informatique et en science de l'information, où une ontologie est l'ensemble structuré des termes et concepts représentant le sens d'un champ d'informations, que ce soit par les métadonnées d'un espace de noms, ou les éléments d'un domaine de connaissances. L'ontologie constitue en soi un modèle de données représentatif d'un ensemble de concepts dans un domaine, ainsi que des relations entre ces concepts. Elle est employée pour raisonner à propos des objets du domaine concerné. Plus simplement, on peut aussi dire que l' « ontologie est aux données ce que la grammaire est au langage ». L'objectif premier d'une ontologie est de modéliser un ensemble de connaissances dans un domaine donné, qui peut être réel ou imaginaire. Les ontologies informatiques sont des outils qui permettent précisément de représenter un corpus de connaissances sous une forme utilisable par un ordinateur. Notes

Métadonnée Un article de Wikipédia, l'encyclopédie libre. Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées GPS du lieu où elle a été prise. Historique[modifier | modifier le code] Tous les établissements qui ont à gérer de l'information, bibliothèques, archives ou médiathèques ont déjà une longue pratique dans la codification du signalement ou des contenus des documents qu'ils manipulent. Ces descriptions ont ensuite été informatisées sous la forme de notices bibliographiques et normalisées (voir par exemple les formats MARC en 1964 utilisant la norme ISO 2709 dont la conception a démarré en 1960). Les bibliothèques numériques ont eu recours aux mêmes dispositifs pour gérer et localiser des documents électroniques. Le terme métadonnée (en anglais : metadata) est apparu dans le cadre de la description de ressources sur Internet dans les années 1990 et s'est ensuite généralisé. Généralisation[modifier | modifier le code]

Logique de description Un article de Wikipédia, l'encyclopédie libre. Les logiques de description aussi appelé logiques descriptives (LD) sont une famille de langages de représentation de connaissance qui peuvent être utilisés pour représenter la connaissance terminologique d'un domaine d'application d'une manière formelle et structurée. Le nom de logique de description se rapporte, d'une part à la description de concepts utilisée pour décrire un domaine et d'autre part à la sémantique basée sur la logique qui peut être donnée par une transcription en logique des prédicats du premier ordre. La logique de description a été développée comme une extension des frames et des réseaux sémantiques, qui ne possédaient pas de sémantique formelle basée sur la logique. Origines et applications des logiques de description[modifier | modifier le code] Définition des logiques de description[modifier | modifier le code] La plupart des logiques de description divisent la connaissance en deux parties : , où Définition 1 : Soit pour .

Related: