background preloader

YAGO2 - D5: Databases and Information Systems (Max-Planck-Institut für Informatik)

YAGO2 - D5: Databases and Information Systems (Max-Planck-Institut für Informatik)
Overview YAGO is a huge semantic knowledge base, derived from Wikipedia WordNet and GeoNames. Currently, YAGO has knowledge of more than 10 million entities (like persons, organizations, cities, etc.) and contains more than 120 million facts about these entities. YAGO is special in several ways: The accuracy of YAGO has been manually evaluated, proving a confirmed accuracy of 95%. Every relation is annotated with its confidence value.YAGO combines the clean taxonomy of WordNet with the richness of the Wikipedia category system, assigning the entities to more than 350,000 classes.YAGO is an ontology that is anchored in time and space. YAGO is developed jointly with the DBWeb group at Télécom ParisTech University.

http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/

Academic Institution Internal Structure Ontology (AIISO) This Version [HTML] [RDF] Latest Version Previous Version Freebase Freebase is a large collaborative knowledge base consisting of metadata composed mainly by its community members. It is an online collection of structured data harvested from many sources, including individual 'wiki' contributions.[2] Freebase aims to create a global resource which allows people (and machines) to access common information more effectively. It was developed by the American software company Metaweb and has been running publicly since March 2007. Metaweb was acquired by Google in a private sale announced July 16, 2010.[3] Google's Knowledge Graph is powered in part by Freebase.[4] Freebase data is freely available for commercial and non-commercial use under a Creative Commons Attribution License, and an open API, RDF endpoint, and database dump are provided for programmers. Overview[edit]

Le référencement sémantique en 22 ressources essentielles Le référencement sémantique en 22 ressources essentielles 5.00/5 (100.00%) 1 vote Le Web sémantique cherche à structurer toutes les données du Web — le contenu, les liens, et les transactions entre les personnes et les ordinateurs. Ce Web Sémantique, qui ouvre la voie au référencement sémantique, est en train d’émerger. C’est le web 3.0 Pour vous y retrouver voici, en apéritif, un petit guide non exhaustif de ressources et d’outils intéressants sur le sujet. Définition Weka 3 - Data Mining with Open Source Machine Learning Software in Java Weka is tried and tested open source machine learning software that can be accessed through a graphical user interface, standard terminal applications, or a Java API. It is widely used for teaching, research, and industrial applications, contains a plethora of built-in tools for standard machine learning tasks, and additionally gives transparent access to well-known toolboxes such as scikit-learn, R, and Deeplearning4j. DownloadDocsCoursesBook

Report on Persistent Identifiers [CERL] Hans-Werner Hilse and Jochen Kothe, Implementing Persistent Identifiers: Overview of concepts, guidelines and recommendations. London / Amsterdam: Consortium of European Libraries and European Commission on Preservation and Access, 2006. ISBN 90-6984-508-3. Download PDF version (persistent identifier): Waikato Courses Introduction à RDFa Résumé Le Web actuel est conçu essentiellement pour une consommation humaine. Et même lorsque des données interprétables font leur apparition sur le Web, elles sont typiquement distribuées dans un fichier séparé, avec un format séparé et une correspondance très limitée entre les versions homme et machine. En conséquence, les navigateurs Web ne peuvent fournir qu'une aide minimale aux humains pour l'analyse et le traitement des données web : les navigateurs voient seulement l'information de présentation. Nous introduisons RDFa, qui fournit un ensemble d'attributs XHTML pour prolonger les données visuelles par des indications intelligibles aux machines (machine-readable).

XML vs RDF : logique structurelle contre logique des données XML et RDF sont deux modèles différents d'encodage de l'information et, pourtant, ils sont souvent confondus. Le dernier exemple en date est la mise à disposition par la British Library de 14 millions de notices bibliographiques au format, je cite, « RDF/DC ». La confusion est patente de par l'absence d'URI pour identifier les ressources décrites. Or, en tant que lecteur régulier de ce blog, vous savez que l'URI est un des fondements du modèle RDF.

Le web sémantique : un projet pour amener le web à son plein potentiel Le web sémantique (généralement associé au terme « web 3.0 »), est une notion que l’on rencontre de plus en plus. Que désigne cette association des mots « web » et « sémantique » qui appartiennent tous deux à des disciplines relativement éloignées que sont l’informatique et la linguistique ? Le web du futur sera-t-il « intelligent » et capable de juger de la pertinence d’une réponse en analysant la sémantique de la question correspondante ? Nous offrira-t-il la possibilité d’exploiter l’ensemble des contenus du web de façon parfaitement pertinente et précise ? Le web sémantique est un projet initié en 2001 par Tim Berners Lee1, inventeur du World Wide Web. Ce projet s’est développé sous l’égide du W3C qui est un organisme de standardisation des formats informatiques utilisés sur internet.

Related: