background preloader

Data Science

Facebook Twitter

Untitled. Como meus conhecimentos de Data Science me ajudaram no Triatlo. Para quem não sabe, Triatlo é uma competição onde envolve três esportes diferentes: natação, bicicleta e corrida.

Como meus conhecimentos de Data Science me ajudaram no Triatlo

A modalidade Xterra é um triatlo um pouco diferente do tradicional já que as provas de bicicleta e corrida são feitas em trilhas. Eu sei que você deve está meio perplexo e minimamente curioso para saber como apliquei meus conhecimentos de data science para obter um rendimento melhor. Mas antes, irei dar uma breve introdução do meu treino, mostrando como meu mindset de projetos de machine learning, me ajudaram na trajetória. Todo meu treino foi mais direcionado para natação por algumas razões. Eu surfo há mais de 11 anos e, quem surfa, sabe: o condicionamento é totalmente diferente de quem costuma nadar no mar;Eu nunca nadei no mar mais de 300 metros sem minha prancha de surf;Já passei por um pseudo trauma quando era mais jovem no mar.

Bem, primeiro meu "baseline model" foi o meu treino. Um baseline é o resultado de um modelo/solução básica. Untitled. Untitled. O desafio de Data Science (Ciência de Dados) do Titanic é uma das competições mais conhecidas dos cientistas de dados e é promovida pelo site kaggle.com.

untitled

Neste tutorial, daremos continuidade à análise exploratória de dados que começamos na Parte I desta série. Se você ainda não viu o primeiro post, dê uma olhada, pois eles são sequenciais: Já entendemos o problema, olhamos os dados e visualizamos gráficos. Agora vamos tratar os dados para deixá-los prontos para os nossos dois modelos de Machine Learning: Regressão Logística e Árvore de Decisão. Para facilitar o seu aprendizado, disponibilizei todo o código no meu Github, onde você pode copiar a vontade. Untitled. Ciência de Dados – Ensina.AI. Como fazer um Web Scraping com Python. A necessidade e importância de extrair dados da Web está se tornando cada vez mais importante.

Como fazer um Web Scraping com Python

Cada vez mais me encontro em uma situação em que precisamos extrair dados de algum site. Por exemplo, como eu trabalho com SEO, conseguir links é muito importante. Mas como conseguir links de forma natural e em escala ao mesmo tempo? Para isso eu precisei entrar em contato com centenas de sites, sem perder tempo e usei a técnica de Web Scraping para extrair os emails que continham o domínio de sites onde eu queria links.

Maneiras de extrair dados da web Existem várias maneiras de extrair informações da web. Se você puder obter o que precisa por meio de uma API, quase sempre será a abordagem preferida em relação a extrair dados diretamente da web. O que é Web Scraping? Web Scraping é uma técnica de programação que permite extrair informações de páginas da web (websites). Você pode realizar um scraping de várias maneiras, incluindo o uso do Google Docs em quase todas as linguagens de programação. API Reference — tweepy 3.5.0 documentation. API Reference — tweepy 3.5.0 documentation.

Top 10 hacks de SQL para machine learning. Tutorial Python no Visual Studio, etapa 1, criar um projeto.

Excel

Python para ler e escrever em planilha – Monolito Nimbus. Downloading Data From Twitter Using the Streaming API. If you have been living in a Faraday cage for the last 10 years, and have never heard about it, Twitter is a very popular micro-blogging service where users create short messages called tweets that generally express opinions about different topics.

Downloading Data From Twitter Using the Streaming API

Over the last decade Twitter has become a very popular social networking application, and therefore a lot of interest has span around how to efficiently collect data from the platform. In this post we will cover how to use the Streaming API to get Tweets that contain certain words or hashtags, and how to efficiently handle the objects returned by the API. There are two main ways to download data from Twitter:

Flask

Guia Completo de Python: Aprenda Python do Básico ao Avançado. Primeiros passos Assim como a proposta da linguagem e suas principais características, começar em Python também é bastante simples.

Guia Completo de Python: Aprenda Python do Básico ao Avançado

Nos links a seguir ensinamos o que é necessário para que você possa dar os primeiros passos e começar a descobrir o quão produtivo é programar com essa linguagem: Recursos básicos Neste momento você já está com o ambiente de desenvolvimento Python configurado em sua máquina, assim como já escreveu os primeiros scripts. Sim, como já visto também, é muito comum fazer uso do Python para a criação de pequenos scripts. Programação Web com Django Acompanhando o mercado, o Python também oferece ótimas opções para a programação Web. Como visto, o Django é um framework gratuito e open source para desenvolvimento web tão alto nível que já traz para nós, programadores, uma solução ORM, simplificando ao máximo o acesso a dados no banco de dados.

Outro diferencial é a interface de administração por ele fornecida, a Django Admin.

Scrap Facebook

Scrap Twitter. Buscando tweets com Python. O ciclo de vida do Processo de Ciência de Dados de Equipe. Gallery — Matplotlib 3.1.1 documentation. This gallery contains examples of the many things you can do with Matplotlib.

Gallery — Matplotlib 3.1.1 documentation

Click on any image to see the full image and source code. You can embed Matplotlib directly into a user interface application by following the embedding_in_SOMEGUI.py examples here. Currently matplotlib supports wxpython, pygtk, tkinter and pyqt4/5. When embedding Matplotlib in a GUI, you must use the Matplotlib API directly rather than the pylab/pyplot proceedural interface, so take a look at the examples/api directory for some example code working with the API.

Pandas