background preloader

Data-scientist

Facebook Twitter

Big Data

Webographie statistiques. Panorama Software. Les métiers de la data : décryptage d'une concurrence internationale - JDN. Portée par la transformation digitale, la demande en profils Big Data touche toutes les entreprises.

Les métiers de la data : décryptage d'une concurrence internationale - JDN

Toutefois, elle cache des disparités en termes de localisation géographique et de compétences recherchées. Qu’il s’agisse des dernières études de Gartner ou de McKinsey, les statistiques s’affolent lorsqu’il s’agit des prévisions de croissance sur les besoins en recrutement dans les secteurs du Big Data ou de l’analyse de données.

Cette demande portée par la transformation digitale touche toutes les entreprises. ThyssenKrupp anticipe les pannes de ses ascenseurs grâce au cloud et au Big data. Comment rendre les ascenseurs en service plus fiables et plus sûrs, tout en réduisant les coûts d’entretien ?

ThyssenKrupp anticipe les pannes de ses ascenseurs grâce au cloud et au Big data

Pour ThyssenKrupp, la solution réside dans la combinaison de l’internet des objets, du Big Data et du cloud computing. Et c’est ce que l’ascensoriste compte mettre en place pour son parc de 1,1 million d’ascenseurs dans le monde. Avec l’aide du groupe canadien de services numériques CGI, il va connecter, d’ici à 5 ans, tous ses ascenseurs au cloud Azure de Microsoft. Objectif : analyser en temps réel les données issues de ses machines par les outils Big Data de l’éditeur américain pour anticiper les pannes, réduire les temps hors service et baisser les coûts de maintenance. Le Real Time Bidding pour les nuls #Etude. Si vous vous intéressez au marché de la publicité en ligne, vous avez probablement déjà entendu parler de Real Time Bidding.

Le Real Time Bidding pour les nuls #Etude

Pour faire simple, le Real Time Bidding (RTB) permet de mettre aux enchères un emplacement publicitaire ciblé :Caractéristiques de la page (emplacement, thématique, dimensions, etc.)Mais surtout profil de l’internaute qui y est soumis (qu’a-t-il vu avant, a-t-il cliqué, quel est son profil CSP si disponible, etc.) D’une certaine façon, le RTB est le grand frère effrayant du Retargeting. Six categories of Data Scientists. 10 Modern Statistical Concepts Discovered by Data Scientists. Data Science Tools. BiostaTGV - Statistiques en ligne. BiostaTGV - Statistiques en ligne. Paramétrique: Un test paramétrique est un test qui présuppose que les variables à étudier suivent une certaine distribution décrite par des paramètres.

BiostaTGV - Statistiques en ligne

Ces tests font parfois des hypothèses fortes (normalité des distributions, égalité des variances) d'autant plus difficiles à vérifier que les effectifs étudiés sont plus réduits Non paramétrique: Un test non paramétrique est un test dont le modèle ne précise pas les conditions que doivent remplir les paramètres de la population dont a été extrait l'échantillon. variable sur laquelle on souhaite étudier l'influence des facteurs d'étude. On parle également de variable à expliquer. Learn NoSQL Database Design From Scratch. La visualisation des données dans les médias. Edouard Beaucourt, Account Manager France et Suisse Romande, Tableau 12inShare Les journalistes content des histoires depuis l'invention de la presse.

La visualisation des données dans les médias

Les journaux sont devenus des leaders d'opinion à mesure qu'ils ont présenté leur vision du monde, qu'il s'agisse d'un point de vue politique ou satirique. Machine Learning contre statistiques : le match. En matière de prédictions basées sur des données, le Machine Learning semble avoir le vent en poupe.

Machine Learning contre statistiques : le match

Ses partisans mettent en avant l’adaptabilité de ces méthodes et leur capacité à produire des prédictions meilleures que la plupart des méthodes alternatives. Ses détracteurs lui opposent l’opacité de ses mécanismes sous-jacents qui sont à la base de ces algorithmes… Qui a raison ? Issues des techniques d’intelligence artificielle, les méthodes du Machine Learning (en français « Apprentissage Automatique ») permettent à une machine « d’apprendre » d’une manière plus ou moins autonome.

Cet apprentissage est basé sur des algorithmes très complexes – parfois chaotiques – où les meilleures prédictions (ou comportement si on fait l’analogie avec un organisme pensant) sont encouragées et renforcées. Le Machine Learning, c’est la mise en œuvre systématique du principe du Chien de Pavlov. Prédire la valeur d’un client : tout est question de modèle.

La VVC (Valeur Vie Client ou, en anglais, Customer Lifetime Value) est la valeur actualisée nette des profits qu’un client générera dans le futur.

Prédire la valeur d’un client : tout est question de modèle

À l’instar de la Valeur Actualisée Nette de n’importe quel type d’actif, c’est la valeur financière d’un client individuel pour l’entreprise. La VVC est donc une mesure très importante, et ce, à plusieurs niveaux. Au niveau individuel, elle permet d’identifier les clients qui seront les plus rentables, et qu’il faut donc cibler et retenir en priorité. Les axes de compétence d’Excel - SalesWay conseil. Bien sûr, la création d’une grille d’évaluation prend du temps et doit être créée par des utilisateurs plutôt avertis.

Les axes de compétence d’Excel - SalesWay conseil

Comment progresser ? Au risque d’en décevoir certains, il faut bien se rappeler que la progression en Excel, comme pour tout autre outil informatique, passe inévitablement par la pratique. Vous pouvez toutefois distinguer deux types d’approches : la progression par évolution sur des cas rencontrés, et le développement par l’apprentissage de nouvelles techniques précises. Dans le premier cas, il s’agit pour l’utilisateur de gagner du temps et de la pertinence sur des tâches déjà accomplies de manière moins efficace. Dans le second cas, l’utilisateur se donne les moyens d’accomplir des tâches actuellement en-dehors de son périmètre de compétence. Data-driven marketing - Gartner Digital Marketing. BigData et Marketing.

Les méthodes de prévision. [Data-Scientist] Matthieu Olivier, chargé de mission DataMining chez Pôle Emploi l Data-Business.fr. Matthieu Olivier, data-scientist chargé de mission Datamining chez Pôle Emploi, nous explique ses missions de lutte contre la fraude au sein de Pôle Emploi et présente sa vision du rôle du data-scientist en entreprise et de ce qui fait le succès d’un projet Big Data. 1.

[Data-Scientist] Matthieu Olivier, chargé de mission DataMining chez Pôle Emploi l Data-Business.fr

Quelle formation avez-vous suivi et pourquoi avoir choisi cette voie ? Matthieu Olivier : J’ai suivi la formation des attachés statisticien de l’INSEE au sein de l’ENSAI après une prépa math sup / math spé. Je n’avais pas encore la vision concrète du métier de data-scientist mais j’éprouvais un fort intérêt pour les mathématiques et pour l’utilisation de données dans la prise de décisions. Le Data Scientist du Big Data : un scientifique parlant business, mouton à cinq pattes - Page 4 sur 4. Des experts Hadoop pourchassés Les experts Hadoop sont également une denrée extrêmement rare.

Le Data Scientist du Big Data : un scientifique parlant business, mouton à cinq pattes - Page 4 sur 4

Il suffit parfois d’avoir déployé une plateforme Hadoop qui marche pour se retrouver rapidement recruté à l’extérieur. La mésaventure est arrivée chez FigaroClassified qui gère des sites de petites annonces. L’ingénieur qui a débuté la mise en place d’Hadoop sur un mode de test afin d’héberger la masse de données grandissante du site été débauché et FigaroClassified ne savait plus comment faire fonctionner la plateforme qu’il avait déployé. Devenir Data-Scientist : les formations et les MOOC Big Data l Data-Business.fr. Avec la vague Big Data, l’exploitation des données en entreprise est devenu une véritable source d’avantage concurrentiel. En tant que responsable de la valorisation de ces données, le profil de data-scientist est une perle rare. D’après McKinsey, il en manquerait déjà près de 200 000 aux Etats-Unis seulement, et ce chiffre pourrait dépasser le million d’ici 2017.

Si les formations Big Data « officielles » commencent à voir le jour en France, les MOOCs sont aujourd’hui le moyen privilégié par beaucoup pour s’auto-former à la Data-Science. Les compétences clés du data-scientist. Data science, comment l’entreprise 3.0 doit-elle se préparer à son intégration en interne ? Le Data Scientist, à peine créé, déjà stressé. Les Data scientists sont sous pression. Nouveaux en entreprise, ils travaillent sur des projets hautement visibles qui impactent fortement la stratégie. Ils doivent s’adapter en permanence et prendre des responsabilités qui ne font pas forcément partie du poste. Les Data Scientists sont plutôt des hommes, pouvant jouer une dizaine de rôles différents, et déjà majoritairement stressés. C’est un des enseignements de l’étude présentée lors de la conférence DataJob 2014, le 20 Novembre à Paris par Ariane Liger-belair, directeur académique chez l’éditeur américain Sas et Mouloud Dey, directeur solutions & marches émergents, également chez Sas.

Portail Big Data, Analytics, DataViz l Data-Business.fr. Data Driven Business - conferences, webinars, reports, intelligence. Un marketeur utilise régulièrement 100 logiciels pour son métier. Un responsable marketing emploie régulièrement plus de cent logiciels pour son métier. Certains programmes informatiques sont bien visibles, d’autres sont invisibles, tellement ils sont devenus des habitudes. Côté service informatique, il faut alors apprendre à laisser ce nouveau panorama se mettre en place en donnant un cadre global d’usage. Un marketeur emploie plus de cent logiciels régulièrement, de manière consciente ou inconsciente. En haut de la pile, on trouve naturellement les logiciels que l’on qualifie volontiers de « logiciel marketing » tels que les outils de CRM, d’automatisation du marketing, de Web Analytics, probablement le CMS du site Web de l’entreprise, et si un blog y associé, on trouve WordPress et ses différents plugins. A/B Testing. Marketing : vers une collaboration de plusieurs métiers ?

Depuis quelques années, les professionnels du marketing doivent assimiler une somme de bouleversements qui touchent leur activité : nouveaux canaux de communication, nouveaux comportements d’achat, consommateurs plus exigeants. Autant de défis à relever pour un secteur qui doit s’adapter en permanence en collaborant toujours mieux en interne tout en faisant l’acquisition de nouvelles compétences. Un bref rappel historique s’impose. Le marketing est né pendant les 30 glorieuses et l’avènement de la société de consommation.

Le DSI est dans les choux pour valoriser les données de son entreprise. La DSI croule sous les données. Elle souhaite investir dans l'analyse, mais elle ne sait pas tirer profit de la donnée pour favoriser la croissance. Avec une infographie de Hitachi Data Systems. Hitachi Data Systems (HDS), la filiale stockage de donnée du géant industriel japonais Hitachi, a réalisé une étude « Information Innovation Index », une première, riche d'enseignements sur l'adéquation – ou l'inadéquation ! Coursera. Conception et mise en œuvre d'algorithmes. Accueil.