background preloader

Thesaurus

Facebook Twitter

Genèse des Systèmes d’Organisation de la Connaissance. Depuis le début des peintures rupestres jusqu’à aujourd’hui, la transmission de connaissances n’a eu de cesse de s’organiser afin d’améliorer l’accès à l’information véhiculée. Dès la préhistoire, les peintures dans les grottes s’organisaient selon l’histoire qu’elles racontaient, puis se sont réparties en trois zones spatiales (l’entrée, la zone de passage et le fond) de la grotte, aux environs de 12000 avant notre ère. Les premières apparitions de structurations après l’invention de l’écriture picto-idéographique en -4000 étaient des tableaux à buts administratifs, suivi en -800 des premiers catalogues avec un classement thématique. C’est au premier siècle avant notre ère qu’apparait la première encyclopédie « Antiquitates rerum humanarum et divinarum » de Varron présentant un classement systématique qui décrit, en 41 livres, l’histoire de l’Italie et de ses habitants.

Il faut attendre le début du XVIIe siècle à Londres pour voir apparaître une terminologie, dans le domaine médical.

Folksonomie

Eurovoc, le thésaurus multilingue de l'Union européenne. PIERRE. Pourquoi les thésaurus et taxonomies évoluent ? et comment ? Il y a quelque jour un journaliste me posait des questions sur les thésaurus, j’ai essayé de lui expliquer au mieux les évolutions en cours, je pense que c’était un peu confus. Un court essai pour essayer de mieux comprendre comment et pourquoi les thésaurus et systèmes de classification évoluent rapidement et quels sont les besoins très pragmatiques qui les font évoluer. Nous avons besoin d’un outil de recherche plein texte plus efficace et précis L’entreprise dispose de terminologies permettant de décrire son domaine et d’indexer des documents, il s’agit d’un vocabulaire métier assez pointu et fermé (juridique, médical, scientifique, gestion des retraites…) mais ou chaque concept peut, selon le public, être exprimé avec des termes un peu différents.

L’idée est d’enrichir le vocabulaire métier avec toutes les expressions répertoriées pour désigner les concepts métiers. Nous implémentons un outil de text mining pour automatiser (assister) le processus d’indexation des contenus Conclusion. Schémas de classification : thésaurus, taxonomie, ontologie… Au cœur de l’architecture de l’information et du Knowledge Management, les techniques de classification sont particulièrement d’actualité alors que les volumes d’information en ligne augmentent et que ce que nous cherchons est de plus en plus noyé parmi ce que nous ne cherchons pas. La plupart de ces techniques nous viennent de l’ingénierie documentaire. Avec le Web sémantique, l’ingénierie informatique nous apporte d’autres approches telles que les ontologies et les topic maps, souvent associées à des formalismes et outils définis.

Tour d’horizon des schémas de classification… (non exhaustif) La méta-donnée, brique de base de la classification Les méta-données sont des données décrivant les données elles-mêmes (informations, documents, images…). Elles servent donc à décrire et expliquer l’information, mais également à la trouver, l’utiliser et la gérer. D’après la traduction de Anne-Marie Vercoustre, INRIA, disponible à partir de ce lien.

Méta-données “administratives” vs “substantielles” Thésaurus. Un article de Wikipédia, l'encyclopédie libre. C'est un langage contrôlé utilisé pour l'indexation de documents et la recherche de ressources documentaires dans des applications informatiques spécialisées. Les thésaurus sont donc une catégorie de langages documentaires parmi d'autres. Les termes (dans l'exemple ci-contre : véhicule, navire,...) sont reliés entre eux par des relations de synonymie (terme équivalent), de hiérarchie (terme générique et terme spécifique) et d'association (terme associé) ; chaque terme appartient à une catégorie ou domaine.

Introduction[modifier | modifier le code] Le thésaurus est un outil linguistique qui permet de mettre en relation le langage naturel des utilisateurs et celui contenu dans les ressources. Cette technique pallie les limites du langage naturel, très riche mais aussi souvent ambigu. Le thésaurus évite ainsi les risques induits par les synonymies, les homonymies et les polysémies présentes dans le langage naturel. Mais encore : Taxilogie et classification. Les systèmes traditionnels de classification du savoir, qui reposaient sur une division disciplinaire des connaissances, semblent de moins en moins adaptés aux nouvelles exigences de la recherche d'informations, notamment sur banques de données. Les sciences de l'information ne sont d'ailleurs pas seules concernées par la taxilogie, ou étude scientifique des classifications, à laquelle contribuent d'autres disciplines, telles que la philosophie, la sémiotique, l'intelligence artificielle...

Présenter brièvement les grands systèmes de classification adoptés dans le monde et replacer les nouvelles tendances, qui se font jour dans les bibliothèques, dans le cadre plus vaste d'une recherche interdisciplinaire, tel est le propos de cette mise à jour concernant un domaine en pleine mutation. Pourquoi distinguer classification de taxilogie ? Composantes disciplinaires Philosophie et « théorie des systèmes » Mais sur quoi fonder cet « ordre naturel » du savoir ? Science de la science Royaume-Uni. Tard-Bourrichon. BRICH59. Thésauro-annuaire : thésaurus francophones gratuits en ligne. Eurovoc est un thésaurus multilingue (23 langues européennes à ce jour) couvrant tous les domaines de l'activité des instances de l'Union européenne.

Il permet d'indexer les documents dans les systèmes documentaires des institutions européennes et de leurs utilisateurs (ici exemple d'EUR-Lex). Ce produit documentaire est actuellement utilisé par le Parlement européen, l'Office des publications des Communautés européennes, les parlements nationaux et régionaux en Europe, des administrations nationales et par certaines organisations européennes. À noter qu'Eurovoc se télécharge également dans les toutes les langues... aussi bien en pdf qu'en skos/xml (sous réserve d'enregistrement).

Enfin, il faut savoir qu'Eurovoc sert de structure classificatoire à la grandiose Terminologie interactive pour l'Europe [ou en anglais Inter-Active Terminology for Europe (IATE)]. AUTRE(S) DESCRIPTEUR(S) EUROVOC : tout Eurovoc ;-) ? Cais-acsi_zacklad_-_avec_ref.