background preloader

Modèles cognitifs de la recherche d'information

Modèles cognitifs de la recherche d'information
Un article de Wikipédia, l'encyclopédie libre. Les modèles cognitifs de la recherche d'information sont des modèles comportementaux qui abordent la recherche d'information (RI) du point de vue des processus cognitifs à l'oeuvre durant l'activité. Les modèles sont centrés soit sur l'utilisateur[1], soit sur l'interaction entre l'utilisateur et le système [2] (approche plus holistique). Selon l'approche centrée utilisateur, la RI est avant tout vue comme une activité cognitive complexe. Les modèles existants font état de plusieurs étapes itératives dans le processus. Si, dans les premiers temps, les chercheurs ne voyaient dans la RI qu’une question d’adéquation entre une demande et une offre, les modèles ont depuis beaucoup évolué. La recherche d’information est une activité qui peut être abordée selon plusieurs finalités. L’activité de RI comme activité exploratoire[modifier | modifier le code] L’activité de RI comme résolution de problème[modifier | modifier le code]

Dassault Systèmes rachète Netvibes Dassault Systèmes a publié, jeudi 9 février, des résultats annuels record. Le groupe a dégagé un bénéfice net de 289,2 millions d'euros en 2011, en hausse de 31 %. Le chiffre d'affaires annuel s'est établi à 1,78 milliard d'euros, en progression de 14 % sur un an. Dassault Systèmes, la branche logiciels du groupe Dassault (aviation, armement, immobilier, presse…) développe principalement des outils de conception assistée par ordinateur. En marge de la publication de ses résultats, le groupe a annoncé l'acquisition – pour un montant non dévoilé – de la plate-forme Netvibes. Netvibes s'adresse aussi bien aux particuliers, qui peuvent agréger différents flux d'informations sur une page, qu'aux entreprises, qui peuvent proposer de la veille marketing et des portails Web personnalisés. Cette annonce intervient alors que le groupe semble vouloir investir dans des domaines technologiques stratégiques.

Indexation automatique de documents L’indexation automatique de documents est un domaine de l'informatique et des sciences de l'information et des bibliothèques qui utilise des méthodes logicielles pour organiser un ensemble de documents et faciliter ultérieurement la recherche de contenu dans cette collection. La multiplicité des types de documents (textuels, audiovisuels, Web) donne lieu à des approches très différentes, notamment en termes de représentation des données. Elles reposent néanmoins sur un socle de théories communes, telles que l'extraction de caractéristiques, le partionnement de données (ou clustering), la quantification, et plus généralement la recherche d'information. Un index est, en toute généralité, une liste de descripteurs à chacun desquels est associée une liste des documents et/ou parties de documents auxquels ce descripteur renvoie. Ce renvoi peut être pondéré. Lors de la recherche d'information d'un usager, le système rapprochera la demande de l'index pour établir une liste de réponses.

Système de recherche d'information Un article de Wikipédia, l'encyclopédie libre. Un système de recherche d'information (SRI) est un ensemble logiciel assurant l'ensemble des fonctions nécessaires à la recherche d'information. Éléments d'un SRI[modifier | modifier le code] Le moteur de recherche est au cœur d'un tel système mais il n'en est qu'un composant. On peut notamment trouver : des fonctions d'acquisition de documents ou de notices,des modules d'éditions,des fonctions d'importation et d'exportation d'information,des modules de gestion de vocabulaires, plan de classement ou thésaurus. Le principe d'un système de recherche est donc de pouvoir construire une base normalisée de documents qui permettent ensuite de retrouver rapidement l'un d'entre eux en faisant une recherche par le contenu. Exemples de SRI[modifier | modifier le code] De nombreux SRI sont plutôt spécialisés dans la documentation. Notes et références[modifier | modifier le code] ↑ Quelques références viennent de : Alexandre Serres.

Richard Stallman Richard Stallman en 2019. signature Richard Matthew Stallman, né le 16 mars 1953 à Manhattan, connu aussi sous les initiales rms (en minuscules[1]), est un programmeur et militant du logiciel libre. Initiateur du mouvement du logiciel libre, il lance, en 1983, le projet GNU et la licence publique générale GNU connue aussi sous le sigle GPL. Depuis le milieu des années 1990, il consacre la majeure partie de son temps à la promotion des logiciels libres auprès de divers publics un peu partout dans le monde. En 2010, un récit biographique qui relate la vie de Richard Stallman paraît en français sous le titre Richard Stallman et la révolution du logiciel libre. Biographie[modifier | modifier le code] Richard Matthew Stallman est né à Manhattan d'une famille juive[4] le 16 mars 1953. Tout bascula au début des années 1980. Il parle couramment anglais et français[9],[10], assez couramment espagnol et un peu indonésien. Emacs[modifier | modifier le code] Projet GNU[modifier | modifier le code]

Recherche d'information La recherche d'information (RI[1]) est le domaine qui étudie la manière de retrouver des informations dans un corpus. Celui-ci est composé de documents d'une ou plusieurs bases de données, qui sont décrits par un contenu ou les métadonnées associées. Les bases de données peuvent être relationnelles ou non structurées, telles celles mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet et les intranets. La recherche d'information sur le web à l'aide d'un moteur de recherche est une technique de l'information et de la communication, désormais massivement adoptée par les usagers. Introduction[modifier | modifier le code] Recherche d'information sans ordinateur. Avec l'apparition des premiers ordinateurs est née l'idée d'utiliser des machines pour automatiser la recherche d'information dans les bibliothèques. Des problématiques connexes se sont aussi greffées autour de la RI. Précision de vocabulaire[modifier | modifier le code] Mesures[modifier | modifier le code]

Moteur de recherche Un article de Wikipédia, l'encyclopédie libre. Un moteur de recherche est une application web permettant de retrouver des ressources (pages web, articles de forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques. Certains sites web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site lui-même (Google Video par exemple est un moteur de recherche vidéo). C'est par abus de langage qu'on appelle également moteurs de recherche des sites web proposant des annuaires de sites web : dans ce cas, ce sont des instruments de recherche élaborés par des personnes qui répertorient et classifient des sites web jugés dignes d'intérêt, et non des robots d'indexation — on peut citer par exemple DMOZ et Yahoo! Historique[modifier | modifier le code] Des moteurs historiques ont été Yahoo, Altavista (premier moteur 64 bits), et Backrub, ancêtre de Google. Fonctionnement[modifier | modifier le code] Outils[modifier | modifier le code]

Philosophie du Projet GNU See audio-video.gnu.org for recordings of Richard Stallman's speeches. Free software means that the software's users have freedom. (The issue is not about price.) We developed the GNU operating system so that users can have freedom in their computing. Specifically, free software means users have the four essential freedoms: (0) to run the program, (1) to study and change the program in source code form, (2) to redistribute exact copies, and (3) to distribute modified versions. Software differs from material objects—such as chairs, sandwiches, and gasoline—in that it can be copied and changed much more easily. For further reading, please select a section from the menu above. We also maintain a list of most recently added articles. Introduction

Apprentissage profond L'apprentissage profond[1] (plus précisément « apprentissage approfondi », et en anglais deep learning, deep structured learning, hierarchical learning) est un ensemble de méthodes d'apprentissage automatique tentant de modéliser avec un haut niveau d’abstraction des données grâce à des architectures articulées de différentes transformations non linéaires[réf. souhaitée]. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage. Dans les années 2000, ces progrès ont suscité des investissements privés, universitaires et publics importants, notamment de la part des GAFAM (Google, Apple, Facebook, Amazon, Microsoft)[2]. Description et contexte[modifier | modifier le code] L’intensité des pixels dont elle est constituée ;Ses différentes arêtes ;Ses différentes régions, aux formes particulières.

Bruit et silence Un article de Wikipédia, l'encyclopédie libre. Bruit[modifier | modifier le code] Dans les sciences de l'information et des bibliothèques, on parle de bruit lorsque des réponses non-pertinentes sont proposées par le système d’interrogation de la base de données. Ces réponses sont mêlées à des réponses pertinentes mais ces dernières risquent de ne pas être vues par l’utilisateur. Cela peut arriver notamment avec les catalogues de bibliothèque. Soit un ensemble N de documents, A est un sous-ensemble de N et comporte les réponses pertinentes pour la recherche d’un usager, B est le sous-ensemble de N constitué des réponses obtenues. Silence[modifier | modifier le code] Dans les sciences de l'information et des bibliothèques, on parle de silence lorsque des réponses pertinentes ne sont pas proposées par le système d’interrogation de la base de données, alors qu'elles existent. Bruit et silence[modifier | modifier le code] Sur une même requête, on peut rencontrer du bruit et du silence.

Prolog Un article de Wikipédia, l'encyclopédie libre. Prolog est l’un des principaux langages de programmation logique. Le nom Prolog est un acronyme de PROgrammation en LOGique. Il a été créé par Alain Colmerauer et Philippe Roussel vers 1972. Prolog est utilisé en intelligence artificielle et dans le traitement linguistique par ordinateur (principalement langages naturels). On peut construire en Prolog une base de connaissances dans un ordre indéterminé, puisque seules comptent les relations en présence et non leur séquence d'écriture. Les différents types de termes[modifier | modifier le code] Prolog n’emploie pas de typage de données au sens habituel des langages de programmation. Atomes[modifier | modifier le code] Les textes constants constituent des atomes. Nombres[modifier | modifier le code] Les implémentations courantes de Prolog ne s'occupent pas en général de différencier les nombres entiers des flottants. Variables[modifier | modifier le code] Exemples de termes composés : f(g(X),h(Y)) ?

Apprentissage automatique Apprentissage automatique Par l'entraînement, ici supervisé, sur un grand nombre de mesures, il devient facile à un programme d'apprentissage automatique de reconnaître des formes, même complexes, et d'y classifier ensuite de nouveaux points (exemple d'usage du programme mldemos). L'apprentissage automatique[1],[2] (en anglais : machine learning, litt. « apprentissage machine[1],[2] »), apprentissage artificiel[1] ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. L'apprentissage automatique comporte généralement deux phases. Historique[modifier | modifier le code] Depuis l'antiquité, le sujet des machines pensantes préoccupe les esprits. Principes[modifier | modifier le code] Exemples : Apprentissage supervisé

Related: