background preloader

Data-scientist

Facebook Twitter

Big Data

Webographie statistiques. Panorama Software. Les métiers de la data : décryptage d'une concurrence internationale - JDN. Portée par la transformation digitale, la demande en profils Big Data touche toutes les entreprises.

Les métiers de la data : décryptage d'une concurrence internationale - JDN

Toutefois, elle cache des disparités en termes de localisation géographique et de compétences recherchées. Qu’il s’agisse des dernières études de Gartner ou de McKinsey, les statistiques s’affolent lorsqu’il s’agit des prévisions de croissance sur les besoins en recrutement dans les secteurs du Big Data ou de l’analyse de données.

Cette demande portée par la transformation digitale touche toutes les entreprises. ThyssenKrupp anticipe les pannes de ses ascenseurs grâce au cloud et au Big data. Comment rendre les ascenseurs en service plus fiables et plus sûrs, tout en réduisant les coûts d’entretien ?

ThyssenKrupp anticipe les pannes de ses ascenseurs grâce au cloud et au Big data

Pour ThyssenKrupp, la solution réside dans la combinaison de l’internet des objets, du Big Data et du cloud computing. Et c’est ce que l’ascensoriste compte mettre en place pour son parc de 1,1 million d’ascenseurs dans le monde. Le Real Time Bidding pour les nuls #Etude. Si vous vous intéressez au marché de la publicité en ligne, vous avez probablement déjà entendu parler de Real Time Bidding.

Le Real Time Bidding pour les nuls #Etude

Pour faire simple, le Real Time Bidding (RTB) permet de mettre aux enchères un emplacement publicitaire ciblé :Caractéristiques de la page (emplacement, thématique, dimensions, etc.)Mais surtout profil de l’internaute qui y est soumis (qu’a-t-il vu avant, a-t-il cliqué, quel est son profil CSP si disponible, etc.) D’une certaine façon, le RTB est le grand frère effrayant du Retargeting. Google en qualité de véritable pionnier sur le sujet, a publié un Livre Blanc sur le RTB dont est extrait l’illustration suivante : Le RTB dépassera bientôt les 20% de part de marché.

Six categories of Data Scientists. We are now at 9 categories after a few updates.

Six categories of Data Scientists

Just like there are a few categories of statisticians (biostatisticians, statisticians, econometricians, operations research specialists, actuaries) or business analysts (marketing-oriented, product-oriented, finance-oriented, etc.) we have different categories of data scientists. 10 Modern Statistical Concepts Discovered by Data Scientists. You sometimes hear from some old-fashioned statisticians that data scientists know nothing about statistics, and that they - the statisticians - know everything.

10 Modern Statistical Concepts Discovered by Data Scientists

Here we prove that actually it is the exact opposite: data science has its own core of statistical science research, in addition to data plumbing, statistical API's, and business / competitive intelligence research. Here we highlight 11 major data science contributions to statistical science. I am not aware of any statistical science contribution to data science, but if you know one, you are welcome to share. Data Science Tools. Top 50 data science / big data tools, described in less than 40 words, for decision makers.

Data Science Tools

Please help us: any definition that you fill will have your name attached to it: send your definition or new term and definition to vincentg@datashaping.com. AnalyticTalentAsterdata: MPP (Massive Parallel Processing) DB, able to work work with semi-structured data by SQL commands. A part of Teradata.ClouderaEMC (submitted by Mark Burnard): Acquired Greenplum in 2010 to enable analytics on "Big Data". BiostaTGV - Statistiques en ligne. BiostaTGV - Statistiques en ligne. Paramétrique: Un test paramétrique est un test qui présuppose que les variables à étudier suivent une certaine distribution décrite par des paramètres.

BiostaTGV - Statistiques en ligne

Ces tests font parfois des hypothèses fortes (normalité des distributions, égalité des variances) d'autant plus difficiles à vérifier que les effectifs étudiés sont plus réduits Non paramétrique: Un test non paramétrique est un test dont le modèle ne précise pas les conditions que doivent remplir les paramètres de la population dont a été extrait l'échantillon. variable sur laquelle on souhaite étudier l'influence des facteurs d'étude.

On parle également de variable à expliquer. Un facteur d'étude est une des informations dont on souhaite tester le lien avec la variable réponse. Learn NoSQL Database Design From Scratch. La visualisation des données dans les médias. Edouard Beaucourt, Account Manager France et Suisse Romande, Tableau.

La visualisation des données dans les médias

Machine Learning contre statistiques : le match. En matière de prédictions basées sur des données, le Machine Learning semble avoir le vent en poupe.

Machine Learning contre statistiques : le match

Ses partisans mettent en avant l’adaptabilité de ces méthodes et leur capacité à produire des prédictions meilleures que la plupart des méthodes alternatives. Ses détracteurs lui opposent l’opacité de ses mécanismes sous-jacents qui sont à la base de ces algorithmes… Qui a raison ? Issues des techniques d’intelligence artificielle, les méthodes du Machine Learning (en français « Apprentissage Automatique ») permettent à une machine « d’apprendre » d’une manière plus ou moins autonome.

Prédire la valeur d’un client : tout est question de modèle. La VVC (Valeur Vie Client ou, en anglais, Customer Lifetime Value) est la valeur actualisée nette des profits qu’un client générera dans le futur.

Prédire la valeur d’un client : tout est question de modèle

À l’instar de la Valeur Actualisée Nette de n’importe quel type d’actif, c’est la valeur financière d’un client individuel pour l’entreprise. Les axes de compétence d’Excel - SalesWay conseil. Bien sûr, la création d’une grille d’évaluation prend du temps et doit être créée par des utilisateurs plutôt avertis. Comment progresser ? Au risque d’en décevoir certains, il faut bien se rappeler que la progression en Excel, comme pour tout autre outil informatique, passe inévitablement par la pratique. Vous pouvez toutefois distinguer deux types d’approches : la progression par évolution sur des cas rencontrés, et le développement par l’apprentissage de nouvelles techniques précises. Dans le premier cas, il s’agit pour l’utilisateur de gagner du temps et de la pertinence sur des tâches déjà accomplies de manière moins efficace. Data-driven marketing - Gartner Digital Marketing. BigData et Marketing.

Les méthodes de prévision. [Data-Scientist] Matthieu Olivier, chargé de mission DataMining chez Pôle Emploi l Data-Business.fr. Matthieu Olivier, data-scientist chargé de mission Datamining chez Pôle Emploi, nous explique ses missions de lutte contre la fraude au sein de Pôle Emploi et présente sa vision du rôle du data-scientist en entreprise et de ce qui fait le succès d’un projet Big Data. 1. Quelle formation avez-vous suivi et pourquoi avoir choisi cette voie ? Matthieu Olivier : J’ai suivi la formation des attachés statisticien de l’INSEE au sein de l’ENSAI après une prépa math sup / math spé. Je n’avais pas encore la vision concrète du métier de data-scientist mais j’éprouvais un fort intérêt pour les mathématiques et pour l’utilisation de données dans la prise de décisions.

Le Data Scientist du Big Data : un scientifique parlant business, mouton à cinq pattes - Page 4 sur 4. Devenir Data-Scientist : les formations et les MOOC Big Data l Data-Business.fr. Avec la vague Big Data, l’exploitation des données en entreprise est devenu une véritable source d’avantage concurrentiel. En tant que responsable de la valorisation de ces données, le profil de data-scientist est une perle rare. Data science, comment l’entreprise 3.0 doit-elle se préparer à son intégration en interne ? Le Data Scientist, à peine créé, déjà stressé. Les Data scientists sont sous pression. Nouveaux en entreprise, ils travaillent sur des projets hautement visibles qui impactent fortement la stratégie.

Ils doivent s’adapter en permanence et prendre des responsabilités qui ne font pas forcément partie du poste. Les Data Scientists sont plutôt des hommes, pouvant jouer une dizaine de rôles différents, et déjà majoritairement stressés. C’est un des enseignements de l’étude présentée lors de la conférence DataJob 2014, le 20 Novembre à Paris par Ariane Liger-belair, directeur académique chez l’éditeur américain Sas et Mouloud Dey, directeur solutions & marches émergents, également chez Sas. L’étude a été réalisée au Royaume Uni et menée en partenariat avec Tech Partnership.

Portail Big Data, Analytics, DataViz l Data-Business.fr. Data Driven Business - conferences, webinars, reports, intelligence. Un marketeur utilise régulièrement 100 logiciels pour son métier. Un responsable marketing emploie régulièrement plus de cent logiciels pour son métier. Certains programmes informatiques sont bien visibles, d’autres sont invisibles, tellement ils sont devenus des habitudes. Côté service informatique, il faut alors apprendre à laisser ce nouveau panorama se mettre en place en donnant un cadre global d’usage.

Un marketeur emploie plus de cent logiciels régulièrement, de manière consciente ou inconsciente. En haut de la pile, on trouve naturellement les logiciels que l’on qualifie volontiers de « logiciel marketing » tels que les outils de CRM, d’automatisation du marketing, de Web Analytics, probablement le CMS du site Web de l’entreprise, et si un blog y associé, on trouve WordPress et ses différents plugins. A/B Testing La bureautique. Marketing : vers une collaboration de plusieurs métiers ?

Depuis quelques années, les professionnels du marketing doivent assimiler une somme de bouleversements qui touchent leur activité : nouveaux canaux de communication, nouveaux comportements d’achat, consommateurs plus exigeants. Autant de défis à relever pour un secteur qui doit s’adapter en permanence en collaborant toujours mieux en interne tout en faisant l’acquisition de nouvelles compétences. Un bref rappel historique s’impose. Le marketing est né pendant les 30 glorieuses et l’avènement de la société de consommation.

Le DSI est dans les choux pour valoriser les données de son entreprise. La DSI croule sous les données. Elle souhaite investir dans l'analyse, mais elle ne sait pas tirer profit de la donnée pour favoriser la croissance. Avec une infographie de Hitachi Data Systems. Coursera. Conception et mise en œuvre d'algorithmes. Accueil.