Data Mining, Data Science et Big Data Analytics

Cette page recense les supports utilisés pour mes enseignements de Machine Learning, Data Mining et de Data Science au sein du Département Informatique et Statistique (DIS) de l'Université Lyon 2, principalement en Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), formation en data science, dans le cadre du traitement statistique des données et de la valorisation des big data. Je suis très attentif à la synergie forte entre l'informatique et les statistiques dans ce diplôme, ce sont là les piliers essentiels du métier de data scientist. Attention, pour la majorité, il s'agit de « slides » imprimés en PDF, donc très peu formalisés, ils mettent avant tout l'accent sur le fil directeur du domaine étudié et recensent les points importants. Cette page est bien entendu ouverte à tous les statisticiens, data miner et data scientist, étudiants ou pas, de l'Université Lyon 2 ou d'ailleurs. Nous vous remercions par avance. Ricco Rakotomalala – Université Lyon 2

http://eric.univ-lyon2.fr/~ricco/cours/supports_data_mining.html

Related: Données

Données de la recherche - veille collaborative > Library Home > Groups > Données de la recherche - veille collaborative > Library > Vers une culture de la données en SHS. Une étude à l'université de Lille Tags More Refresh Blog eye tracking : ergonomie web, tests utilisateur Le eye tracking comme outil pour la sécurité aérienne Le magazine belge L’écho publie aujourd’hui un article sur la technologie de eye tracking Pertech. Cet article présente l’oculomètre Pertech entre comme outil pour la sécurité aérienne. L’article est à télécharger au format pdf ici-même : Le eye tracking comme outil pour la sécurité aérienne Nouvelle version du site Pertech Notre site bénéficie d’une toute nouvelle version.

Top des sources Tech à suivre pour faire sa veille technologique Que vous soyez développeur web ou mobile, data scientist, web designer ou encore chef de projet IT, réaliser une veille technologique régulière est indispensable dans votre métier IT. Et pour que celle-ci soit efficace, nous vous partageons dans cet article les meilleures sources à suivre selon nos collaborateurs. Faire de la veille technologique consiste à rechercher des informations pour augmenter son niveau de connaissances et de culture, technique et fonctionnelle. Elle permet de découvrir de nouveaux produits, procédés ou tout simplement de s’informer sur l’environnement Tech en général, comme l’évolution du marché et du cadre législatif par exemple.Dans un secteur en constante évolution, cette pratique est devenue indispensable pour les professionnels de la Tech, et ce pour plusieurs raisons majeures :

Conférences de la Bibliothèque - Division de l'information scientifique (DIS) Jean-Blaise Claivaz, Coordinateur du pôle Open access et données de la recherche, CODIS, UNIGELaure Ognois, Directrice du service Recherche, UNIGEEliane Blumer, Coordinatrice du projet CUS-P2 DLCM, UNIGEPierre-Yves Burgi, NTICE, chef de projet CUS-P2 DLCM, UNIGEMarie Fuselier, Directrice de la DIS, UNIGE Programme complet Date Mercredi 6 mai 2015, de 10h15 à 12h Lieu Genève, Uni Dufour24, rue du Général-DufourAuditoire Rouiller U300Accès

Data visualisation : comprendre le potentiel de cet outil en sept exemples Définition : La “data visualisation » consiste à communiquer des chiffres ou des informations brutes en les transformant en objets visuels : points, barres, courbes, cartographies… En alliant fonctionnalités simples et esthétisme, elle offre un gain de temps conséquent dans la recherche et l’analyse des données. C’est aussi un outil de communication puissant. « La data visualisation, c’est l’art de raconter des chiffres de manière créative et ludique, là où les tableaux Excel échouent. C’est en quelque sorte mettre en musique l’information chiffrée” explique Charles Miglietti, expert en visualisation de données et co-fondateur de Toucan Toco Cette pratique permet de présenter des données complexes et brutes au premier abord en représentations visuelles interactives.

Comment faire une veille efficace sur Twitter ? 500 millions de tweets diffusés chaque jour. Plus de 330 millions d’utilisateurs actifs à travers le monde. Près de 11 millions de twittos actifs en France... Il y a deux façons de définir ce qu’est Twitter : un tout à l’ego indigeste et repu de haine ou bien un gisement d’informations de qualité produites collectivement. Avec un peu de méthode et quelques outils gratuits, il est possible de séparer le bon grain de l’ivraie : sélection des comptes à suivre, création de listes, outils et opérateurs de recherche, et conversion de Twitter en flux RSS.

Fouille de données – Persée UMS Cumulés, les contenus numériques produits par Persée – qu’ils alimentent le portail Persée ou les Perséides – constituent une masse critique de données structurées. Au-delà de la simple consultation par le biais de sites web, ces données constituent un corpus à part entière pouvant faire l’objet d’exploitations transversales : visualiser des tendances, observer l’évolution de certains concepts, termes ou métaphores d’un point de vue diachronique, mesurer des occurrences, évaluer l’influence d’un auteur ou d’un texte au regard d’un contexte. Vous pouvez accéder et utiliser ces données dans le respect du droit des tiers : ● Data Persée réunit les données décrivant l’ensemble des ressources produites par Persée, en RDF.

Manipulation et gestion de données — Bibliothèques Universitaires Besoin de rédiger un plan de gestion de données, de publier une bibliographie interactive, de constituer un corpus documentaire, d’enrichir ou de nettoyer un jeu de données ? Les BU accompagnent la manipulation et la gestion des données utilisées et produites dans le cadre d’activités de recherche. Un service évolutif Voir la plaquette présentant les services à la recherche Ce service sera déployé progressivement à partir de janvier 2016. Son périmètre sera susceptible d’évoluer en fonction des besoins identifiés. Créer un modèle conceptuel de données – TUTORIEL SAP BUSINESSOBJECTS Dans ce tutoriel vous apprendrez à créer un modèle conceptuel de données sur SAP PowerDesigner. Version : PowerDesigner 16.6 Application : SAP PowerDesigner Pré-requis : compte utilisateur avec les permissions nécessaires Contexte : Un modèle de données est une représentation des informations consommées et produites par un système, qui vous permet d’analyser les données qu’il contient et les relations entre ces données.

Prospectibles Droit de l'information Archives Les plateformes occupent une place de plus en plus prépondérante dans l’activité numérique actuelle. Que ce soit sur des applications mobiles ou à propos de nouveaux services publics ou associatifs, on retrouve cette même notion à la définition un peu floue. Définition et réglementation