background preloader

Exploration de données

Exploration de données
Un article de Wikipédia, l'encyclopédie libre. Vous lisez un « bon article ». L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. C'est aussi le mode de travail du journalisme de données[1]. L'exploration de données[2] fait suite, dans l'escalade de l'exploitation des données de l'entreprise, à l'informatique décisionnelle. Histoire[modifier | modifier le code] Collecter les données, les analyser et les présenter au client. De 1919 à 1925, Ronald Fisher met au point l'analyse de la variance comme outil pour son projet d'inférence statistique médicale. L'arrivée progressive des micro-ordinateurs permet de généraliser facilement ces méthodes bayésiennes sans grever les coûts. Applications industrielles[modifier | modifier le code]

http://fr.wikipedia.org/wiki/Exploration_de_donn%C3%A9es

Related:  Knowledge Data Discovery (KDD), Data-MiningDatavizGardez votre LibertéDATA MININGStatistiques

Algorithme APriori Un article de Wikipédia, l'encyclopédie libre. L'algorithme APriori[1] est un algorithme d'exploration de données conçu en 1994, par Rakesh Agrawal et Ramakrishnan Sikrant, dans le domaine de l'apprentissage des règles d'association. Il sert à reconnaitre des propriétés qui reviennent fréquemment dans un ensemble de données et d'en déduire une catégorisation. Principes[modifier | modifier le code] Vers un Nouveau Monde de données A l'occasion de la Semaine européenne des l'Open Data qui se déroulait à Nantes du 21 au 26 mai 2012, j'étais invité à faire une présentation sur le web des données, pour dépasser et élargir la problématique particulière de la réutilisation des données publiques. En voici la transcription. Nous sommes passés d'un web de l'information et de la connaissance à un web de données.

Un « espion » dans votre téléphone portable éteint Imaginez une réunion stratégique dans une grande entreprise. Tous les participants ont consciencieusement fermé leurs portables. Pourtant, à quelques dizaines kilomètres de là, le principal concurrent ne perd pas un mot de la conversation. Ce n’est ni de la magie ni de la science-fiction : on n’a simplement glissé un « espion » dans l’un des téléphones portables. 2 – Les techniques de collecte automatisée Ces vingt dernières années ont vu le développement de techniques et d’outils informatiques qui permettent d’automatiser la collecte et la mise en forme de données, en particulier celles provenant d’internet[1]. Plus puissantes et plus faciles d’accès, ils sont aussi de plus en plus utilisés dans de nombreuses professions. Leur diffusion intéresse donc les chercheurs en sciences sociales, à la fois parce qu’elles permettent de collecter rapidement des informations sur divers aspects du monde social, mais aussi parce qu’elle conteste un peu plus leur monopole dans la production de données quantitatives.

Biens communs numériques Un article de Wikipédia, l'encyclopédie libre. Les biens communs numériques correspondent à l'ensemble des ressources numériques produites et gérées par une communauté. Comme les autres biens communs informationnels, ils se caractérisent leur non-rivalité : leur usage n'est pas exclusif et ne les détériore pas. En raison de leur caractère facilement duplicable, les biens numériques sont par nature propres à « une gestion partagée et collective »[1]. De nombreux acteurs défendent ce mode de production et de gouvernance, comme la Free Software Fondation en faveur des logiciels libres ou la fondation Wikimédia par ses dispositifs collaboratifs centralisant la connaissance. Inversement, de nouveaux types d'enclosures entravent la création de ces biens numériques, notamment par une privatisation excessive ou copyfraud.

Global Reporting Initiative Un article de Wikipédia, l'encyclopédie libre. Pour les articles homonymes, voir GRI. Le Global Reporting Initiative (GRI) a été établi vers la fin 1997 avec comme mission de développer les directives applicables mondialement en matière de développement durable, ainsi que de rendre compte des performances économiques, environnementales et sociales, initialement pour des sociétés puis, par la suite, pour n'importe quelle organisation gouvernementale ou non gouvernementale. Rassemblée par la coalition pour les économies environnementalement responsables (CERES) en association avec le programme d'environnement des Nations Unies (PNUE), le GRI incorpore la participation active des sociétés, des O.N.G., des organismes de comptabilité, des associations d'hommes d'affaires, et d'autres parties prenantes du monde entier. La version GRI actuellement en vigueur (depuis 2013) se nomme G4. Elle est appelée à remplacer progressivement les lignes directrices G3 et G3.1.

L'open data, ça sert à quoi ? Voici 5 exemples concrets. Le résumé : Du 17 au 22 septembre se tient à Helsinki (Finlande) l'Open Knowledge & Data Festival (le Festival de la connaissance et des données ouvertes). Une semaine complète dédiée aux problématiques des données et de leur réutilisation dans des domaines aussi diverses que l'éducation, la science, le journalisme, etc. L'occasion de découvrir à quoi peut aboutir l'open data. L'ouverture des données (publiques ou privées), c'est à dire le droit d'accéder, de consulter et de réutiliser des données gratuitement et facilement ne s'arrête pas à la publication massive de séries chiffrées. Ce n’est qu’une étape, indispensable mais intermédiaire, pour permettre la création de projets qui peuvent améliorer la connaissance des citoyens et la société dans laquelle ils vivent.

Comment tout savoir sur quelqu’un ? Je vous avais parlé suite à mon petit séjour en Angleterre, de la petite extension greasemonkey à base de YQL que George Brocklehurst avait proposé au HackDay... ET voici que je tombe sur une extension Firefox baptisée Identify similaire mais un peu plus boostée. Le but de cette extension est de vous fournir un maximum d'informations sur le profil social (et online) d'une personne. L'application détecte la balise XFN rel="me" sur n'importe quelle page et part ensuite à la recherche d'infos sur les sites suivants avec l'aide du YQL : C'est vraiment pratique pour tout savoir d'une personne sans se lancer dans un déterrage sur Google. C'était vraiment mon application coup de coeur aux hackday et même si le dev qui a pondu cette extension à pompé l'auteur original, ça n'en reste pas moins très pratique à utiliser.

3 – Des données au savoir L’informatique a permis d’accumuler des quantités massives de données sur des sujets divers et variés, qu’il s’agisse du génome humain, de simples opérations de vente ou encore de données textuelles. Une donnée brute, tant sous sa forme numérique que papier, n’est pas intéressante en elle-même. Le data mining (« fouille de données » pour les francophones, également appelé Knowledge Discovery From Data) lui apporte tout son intérêt. Comment transformer les données en sources de savoir ? Voici l’une des grandes questions qui préoccupent les experts de la donnée. Biens communs informationnels Un article de Wikipédia, l'encyclopédie libre. Les biens communs informationnels désignent les ressources informationnelles produites et mises en valeur par une communauté autonome et qui constituent à ce titre des biens communs. Cette notion s'applique notamment, mais pas exclusivement, aux productions éditoriales publiées sous licence libre ou entrées dans le domaine public.

PageRank Un article de Wikipédia, l'encyclopédie libre. Illustration du PageRank. Le PageRank[note 1] ou PR est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d'une page web. armelle caron - tout bien rangé tout bien rangé, anagrammes graphiques de plans de villes, impressions numériques sur toile canevas en 3 ex. 120cm x 90cm. Au sujet de ce travail, quelques articles : en allemand:

data mining : a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques. L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problématiques très diverses, allant de la gestion de relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. by agnesdelmotte Mar 21

Related:  VeilleWeb Mining1 - Qu'est-ce que le data mining ?Visualization de donnéesWebographie : cours HTML et CSSDiagnostic organisationnelLexique et définitions