background preloader

Outils_statistiques

Facebook Twitter

FactoMineR: analyse multivariée exploratoire de données avec R ; Classification Hiérarchique sur Composantes Principales (HCPC) L'article suivant décrit en détail l'intérêt d'une classification hiérarchique combinée avec une analyse factorielle. Il donne également des exemples d'utilisation. Husson, F., Josse, J. & Pagès J. (2010). Principal component methods - hierarchical clustering - partitional clustering: why would we need to choose for visualizing data?.

Rapport technique. On va réaliser une classification hiérarchique sur les composantes principales d'une analyse factorielle. Objectifs On veut regrouper les 300 individus du tableau de données en quelques classes qcorrespondant à différents profils de consommation. Les variables étant qualitatives, un ACM sera d'abord réalisée puis les coordonnées des individus sur les composantes principales seront utilisées pour la classification hiérarchique. l'ACM est utilisée en amont de la classification pour transformer des variables qualitatives en variables continues.

La première étape consiste à réaliser l'ACM du tableau de données. Philippe Cibois, Les méthodes d’analyse d’enquêtes. 1 Philippe Cibois, L’analyse factorielle, Paris, puf, « Que sais-je ? », n° 2095, 1983, 128 p. (...) 2 (...) 3 Olivier Martin, L’enquête et ses méthodes : l’analyse des données quantitatives, Paris, Armand Co (...) 1Philippe Cibois nous propose un nouveau « Que sais-je ?

» intitulé Les méthodes d’analyse d’enquêtes, qui se substitue à la version précédente parue dans la même collection : L’analyse factorielle1. Le nouveau titre traduit bien le changement d’approche. L’auteur ne présente plus les méthodes sous l’angle mathématique, mais montre comment les utiliser dans le cadre d’une enquête sociologique afin d’aboutir à des conclusions étayées par des arguments solides2. 2Dans cet esprit, l’ouvrage commence par un chapitre intitulé « Repérer les questions pertinentes ».

R blogs / lang. R-bloggers.com / lang is back online Dear readers of R-bloggers.com / lang – the site was offline for a week now due to a technical bug.

R blogs / lang

I was just informed of it, and fixed it. Fait-on dire ce qu’on veut aux chiffres. Par Rémi Sussan le 13/06/12 | 14 commentaires | 3,028 lectures | Impression La messe semble dite.

Fait-on dire ce qu’on veut aux chiffres

La connaissance devrait désormais progresser par la multiplication des données et leur traitement statistique. Au point que certains – et non des moindres – déclarent désormais dépassée la bonne vieille méthode scientifique. Les Big Data vont nous permettre de nous passer de théories, semble-t-il. Mais les statistiques sont loin d’être un outil facilement maniable, et les pièges méthodologiques ne manquent pas.

Des vérités que les adeptes contemporains du Quantified self risquent d’apprendre à leur dépends s’ils décident se fier un peu trop facilement aux diverses études concernant la santé. Les biais multiples nuisent à l’observation.

Afcm

Programmation sous R. Mots - Liste et fréquence - French Words Frequency. Voici une liste des mots (129 000 entrées) présents en français ainsi que leurs fréquence selon la table Graphemes de la base Lexique.

Mots - Liste et fréquence - French Words Frequency

Liste des mots du français et leur fréquence par million d'occurence Voici une liste des mots (336 531 entrées) présent en français générée à partir de Français Gutenberg et ispell. Liste des mots de Français GutenbergVoici une liste des mots (295 000 entrées) présents en français générée à partir de deux listes de mots: celle de Louis Bronne, René Cougnenc et Serge Delbono et celle de JC BellamyListe des mots fusionnée Auteurs L'équipe de Lexique Licence Si vous utilisez cette base, nous vous serions reconnaissant de mettre un lien vers le site de Lexique ( et de citer les auteurs.

Indiquez avec Calc les différences entre deux tableaux de valeurs. Lexico Web Page (downloadable app for the PC) Untitled. (Ludovic Lebart et André Salem) Préface de Christian Baudelot Chapitre 0 : Préface, Sommaire, Avant Propos, Introduction.

untitled

Manipulation de chaînes de caractères avec stringr - Alea. Lecture et Ecriture de fichiers. / Le langage. / Aide mémoire R. Aide-memoire-R > Le-langage > Lecture-et-Ecriture-de-fichiers Lecture d'un frame à partir d'un fichier contenant un tableau : Avec un tableau contenant des étiquettes de lignes et de colonnes et une case vide en haut à gauche, et les colonnes séparées par des espaces ou tabulations : fr <- read.table("file.csv") (le frame a alors des lignes et des colonnes nommées).

Lecture et Ecriture de fichiers. / Le langage. / Aide mémoire R.

Koutosuiss on line. Learn, Create, Understand, Test, Use and Save Regular Expression. Regular Expressions as used in R. Description This help page documents the regular expression patterns supported by grep and related functions grepl, regexpr, gregexpr, sub and gsub, as well as by strsplit.

Regular Expressions as used in R

Details A ‘regular expression’ is a pattern that describes a set of strings. Sample Size Calculator - Confidence Level, Confidence Interval, Sample Size, Population Size, Relevant Population - Creative Research Systems. This Sample Size Calculator is presented as a public service of Creative Research Systems survey software.

Sample Size Calculator - Confidence Level, Confidence Interval, Sample Size, Population Size, Relevant Population - Creative Research Systems

You can use it to determine how many people you need to interview in order to get results that reflect the target population as precisely as needed. You can also find the level of precision you have in an existing sample. Before using the sample size calculator, there are two terms that you need to know. These are: confidence interval and confidence level. If you are not familiar with these terms, click here. Enter your choices in a calculator below to find the sample size you need or the confidence interval you have. Comité consultatif sur la qualité des sondages en ligne sur l'opinion publique - La ROP au GC - TPSGC. Réaliser un questionnaire - APCE, agence pour la création d'entreprises, création d'entreprise, créer sa société,l'auto-entrepreneur, autoentrepreneur, auto-entrepreneur, auto entrepreneur, lautoentrepreneur, reprendre une entreprise, aides à  la création.

Réaliser une enquête de terrain consiste à interroger la clientèle ciblée au moyen d'un questionnaire.Ce travail consiste à : 1) Choisir un échantillon de personnes à questionner.2) Définir le type de questions à poser : questions fermées, ouvertes, etc.3) Structurer le questionnaire.4) Déterminer l'endroit où doit se dérouler l'enquête (dans la rue, par courrier, sur internet, etc.).5) Réaliser l'enquête : choix de la date, des interviewers, etc.6) Organiser la saisie et traiter les résultats : tris à plat, tris croisés, moyennes.

Réaliser un questionnaire - APCE, agence pour la création d'entreprises, création d'entreprise, créer sa société,l'auto-entrepreneur, autoentrepreneur, auto-entrepreneur, auto entrepreneur, lautoentrepreneur, reprendre une entreprise, aides à  la création

Les méthodes d'échantillonnage Pour des raisons de temps et de coûts, il est quasiment impossible d'interroger tous les clients potentiels présents sur une zone d'enquête (recensement). Le porteur de projet doit donc calculer et déterminer un échantillon représentatif de la population à étudier. Combien faut-il interroger de personnes ?

Quelle méthode d'échantillonnage utiliser ? Les autres méthodes. Dataframes avancés. / Le langage. / Aide mémoire R. Aide-memoire-R > Le-langage > Dataframes-avances Sélection de lignes ou colonnes d'un dataframe : subset(fr, nom == "jean") : sélectione le sous dataframe en retenant les lignes dont la colonne nom vaut "jean" (ca peut être une expression plus complexe comme subset(fr, nom %in% c("pierre", "jean")) fr[which(fr$nom == "jean"), ] : autre façon de faire la même sélection. fr[fr$nom == "jean", ] : encore une autre façon de faire la même sélection. subset(fr, select = c(age)) : sélectione le sous dataframe en retenant les colonnes indiquées (sans quotes !)

Dataframes avancés. / Le langage. / Aide mémoire R.

Subset(fr, select = - c(age)) : sélectione le sous dataframe en enlevant les colonnes indiquées. Sélection de lignes avec des expressions booléennes : fr[fr$nom == "jean" | ! Fr$age > 35, ] : combinaison de critères (avec opérateurs booléens '|', '&' et '! ') Groupe des utilisateurs du logiciel R. Analyse croisée. The R Project for Statistical Computing. Introduction à R - Alea. R pour les sociologues : une introduction au fameux logiciel libre d’analyse des données. Pendant longtemps, les sociologues désireux de mettre en oeuvre des outils quantitatifs d’analyse des données avaient le choix entre des outils simples et conviviaux (comme Sphinx ou Modalisa), mais peu puissants, et des outils puissants (comme SAS, SPSS, etc.), mais complexes à mettre en oeuvre, et… payants.

R pour les sociologues : une introduction au fameux logiciel libre d’analyse des données

Et puis est arrivé… R ! Son nom est bizarre, il appartient plutôt à la seconde catégorie, mais… il est gratuit ! R est en effet issu du monde des logiciels libres, et c’est une très bonne raison de l’adopter. L’autre très bonne raison, c’est sa puissance impressionnante, et son évolutivité : vous verrez, à l’usage, que R n’a rien à envier à SAS ou SPSS. QUANTI a donc choisi d’en faciliter l’accès à toutes celles et tous ceux qui veulent utiliser des méthodes quantitatives en sciences sociales, en publiant ici le « mode d’emploi » de R écrit par Julien Barnier à destination des sociologues.

Qu’est-ce que c’est ? On installe…