background preloader

Web Scraping

Facebook Twitter

Talend Data Preparation. OpenRefine. Du problème de la qualité des données et de la manière de le résoudre... Comme le rappelait très justement Dominique Cardon dans son interview du vendredi 6 janvier sur France Inter : « [...]il faut faire attention, les algorithmes, c’est idiot, c’est une procédure statistique un peu bête qui utilise des données pour faire un grand calcul massif[...] » Comme l'a expliqué Dominique Cardon malgré les coupures incessantes d'Ali Baddou (et comme je l'avais fait beaucoup plus modestement), l'algorithme n'est pas une entité en soi : ce n'est qu'un code source mis au point par un humain qui détermine la « procédure statistique » exécuté sur et grâce à des données.

Du problème de la qualité des données et de la manière de le résoudre...

Ces dernières sont donc d'une importance fondamentale. TUTO WEB SCRAPING , 5 Formations Web Scraping en vidéo sur TUTO.COM. Comment extraire de l’information d’un site web grâce au web scraping ? Grâce au quoi ?

Comment extraire de l’information d’un site web grâce au web scraping ?

Mes triples excuses. Premièrement pour avoir utilisé un anglicisme (en cette semaine royale déjà bien assez anglaise comme ça).