background preloader

Sipina - Arbres de décision

Sipina - Arbres de décision

Arbre de décision Un article de Wikipédia, l'encyclopédie libre. Introduction[modifier | modifier le code] Dans les domaines de l'aide à la décision (informatique décisionnelle et entrepôt de données) et de l'exploration de données, certains algorithmes produisent des arbres de décision, utilisés pour répartir une population d'individus (de clients par exemple) en groupes homogènes, selon un ensemble de variables discriminantes (l'âge, la catégorie socio-professionnelle, …) en fonction d'un objectif fixé et connu (chiffres d'affaires, réponse à un mailing, …). À ce titre, cette technique fait partie des méthodes d’apprentissage supervisé. Il s’agit de prédire avec le plus de précision possible les valeurs prises par la variable à prédire (objectif, variable cible, variable d’intérêt, attribut classe, variable de sortie, …) à partir d’un ensemble de descripteurs (variables prédictives, variables discriminantes, variables d'entrées, …). lisibilité du modèle de prédiction, l’arbre de décision, fourni.

Supports de cours -- Data Mining Cette page recense les supports utilisés pour mes enseignements de Machine Learning, Data Mining et de Data Science au sein du Département Informatique et Statistique (DIS) de l'Université Lyon 2, principalement en Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), formation en data science, dans le cadre du traitement statistique des données et de la valorisation des big data. Je suis très attentif à la synergie forte entre l'informatique et les statistiques dans ce diplôme, ce sont là les piliers essentiels du métier de data scientist. Attention, pour la majorité, il s'agit de « slides » imprimés en PDF, donc très peu formalisés, ils mettent avant tout l'accent sur le fil directeur du domaine étudié et recensent les points importants. Cette page est bien entendu ouverte à tous les statisticiens, data miner et data scientist, étudiants ou pas, de l'Université Lyon 2 ou d'ailleurs. Nous vous remercions par avance. Ricco Rakotomalala – Université Lyon 2

Le site pédagogique Diagramme d'Ishikawa (causes et effets) Un article de Wikipédia, l'encyclopédie libre. Le Diagramme de causes et effets, ou diagramme d'Ishikawa, ou diagramme en arêtes de poisson ou encore 5M, est un outil développé par Kaoru Ishikawa en 1962[1] et servant dans la gestion de la qualité. Description et fonctions[modifier | modifier le code] Ce diagramme représente de façon graphique les causes aboutissant à un effet. Il peut être utilisé comme outil de modération d'un remue-méninges et comme outil de visualisation synthétique et de communication des causes identifiées. Ce diagramme se structure habituellement autour du concept des 5 M. Chaque branche reçoit d'autres causes ou catégories hiérarchisées selon leur niveau de détail. Le positionnement des causes met en évidence les causes les plus directes en les plaçant les plus proches de l'arête centrale. Variantes[modifier | modifier le code] Les termes « Moyens » ou « Machines » remplacent parfois la catégorie « Matériel ». Notes et références[modifier | modifier le code]

Statistique décisionnelle, Data Mining, Scoring et CRM Communiqué de Presse VS Communiqué Enrichi. Le jeu des 7 différences Selon PR Newswire et Businsesswire, plusieurs milliers de communiqués de presse sont envoyés sur des fils d’informations tous les jours. Jeremy Porter, auteur du blog Journalistics déclare en recevoir une centaine par jour et s’estime heureux quand deux sont intéressants. Et New Media Cowboy conclut : Personne n’aime les écrire Personne n’aime les recevoir Personne n’aime les lire Tristement paradoxal, en apparence. Alors, faut-il arrêter le bon vieux communiqué de presse ? Les objectifs du communiqué enrichi Ivy Lee (Wikipedia) Le communiqué de presse a été inventé et perfectionné il y a plus d’un siècle par Ivy Lee lors d’un accident ferroviaire grave, principalement comme outil de gestion de criseen s’assurant que tous les journalistes retiendraient la même version et qu’aucune fausse rumeur ne circulerait. Le pionnier des relations publiques Edward Bernays en a perfectionné le format pour l’amener au stade que l’on connaît et utilise, quasiment inchangé, depuis. Sommairement: 1. 2. 3. 4.

Diagramme de Pareto (80/20) Un article de Wikipédia, l'encyclopédie libre. Pour les articles homonymes, voir Pareto. Diagramme de Pareto sur les causes des retards au travail (les données sont hypothétiques) Le diagramme de Pareto est un graphique représentant l'importance de différentes causes sur un phénomène. Diagramme[modifier | modifier le code] Ce diagramme se présente sous la forme d'une série de colonnes triées par ordre décroissant. Ce diagramme est construit en plusieurs étapes[1] : collecte des donnéesclassement des données au sein de catégoriescalcul du pourcentage de chaque catégorie par rapport au totaltri des catégories par ordre d'importance Histoire[modifier | modifier le code] L'inventeur de ce diagramme est Joseph Juran, l'un des fondateurs de la démarche qualité. En 1941, au cours d’une tournée de "benchmarking" sur le thème du management de la qualité, il rencontre les dirigeants de General Motors. Juran en tire l'idée que, pour un phénomène, 20 % des causes produisent 80 % des effets.

Web Squared Journal Quelques vérités à rétablir sur les MOOC Libération a publié le 26 décembre 2013 une singulière tribune d’opposants à l’enseignement universitaire sur Internet, les MOOC (en anglais : Massive open online course). Pour mémoire, un MOOC est cours en ligne ouvert et gratuit, qui permet d’apprendre en ligne, sans discrimination, dans la droite ligne de l’enseignement libre et gratuit défendu par Jules Ferry en France. En ce qui concerne l’université, les MOOC sont, à ce stade, une expérimentation qui permet de réunir les savoir-faire des professeurs et des entreprises du numérique, en associant pleinement les étudiants à la démarche, c’est là qu’est la révolution pédagogique. La tribune publiée dans Libération repose sur des informations incomplètes, voire mensongères : - «Une révolution du système universitaire qui nous semble devoir être publiquement débattue». - «L’apparition des MOOC aux Etats-Unis dans les années 2010 relève de choix économiques de pure rentabilité.» - Qui constitue le Collectif anti-MOOC ? - Idem pour l’UNEF

Related: