background preloader

Data Visualization & Infographics

Facebook Twitter

VW LAB. Seeing Theory. 와이즈앱 – 모든 앱의 마케팅정보를 무료로. 데이터 분석가를 위한 개발 공부. 데이터 분석을 잘하기 위한 방법론 중에서 드류 콘웨이(Drew Conway)의 데이터 과학 벤 다이어 그램(the Data Science Venn Diagram)을 가장 많이 인용한다.

데이터 분석가를 위한 개발 공부

데이터 과학(data science)이라는 용어가 적절한지에 대해서는 이견이 많지만, 아래 그림이 좋은 분석 결과물을 만들기 위한 좋은 접근 방법이라는데 동의한다. 통계학을 전공한 입장에서 위의 3가지 영역 중 가장 어려움을 느낀 부분은 Hacking Skills, 즉 개발이다.

Tableau

How Websites Work. Visualization Tools. [파이썬으로 아파트분석1] 데이터 수집과 지역별 분석. 요즘 아파트 트랜드/시세에 관심이 많아져 시간이 날때마다 데이터 분석을 해 보고자 한다.

[파이썬으로 아파트분석1] 데이터 수집과 지역별 분석

Data 수집부터 Data visualization 까지. 데이터 분석가 또는 과학자라면 단순히 데이터를 분석만 하는 것 뿐만 아니라 데이터의 수집부터 가공, 탐색, 분석, 검증, 시각화 까지 모든 단계에 대해 능숙하게 작업을 처리 할 수 있어야 한다.이번 포스트에서는 데이터 수집부터 시각화까지 단계 별로 실 데이터를 활용하여 실 예제를 들어 설명하겠다.데이터 안에 숨겨진 정보를 찾기 위한 방법은 여러 가지이다.

Data 수집부터 Data visualization 까지

통계적인 분석을 통해 수치적인 결과로 알아낼 수도 있고, 그래프를 통해 시각적으로 표현할 수도 있고, 마이닝과 같은 고급 분석 방법을 통해 새로운 정보를 만들어 낼 수도 있다. 하지만 그 결과를 받은 사람의 입장으로서는 지루한 숫자들의 나열이고, 알 수 없는 도형들의 집합체일 뿐이다. 정말 데이터 안에 있는 의미, 진실을 정확히 알기 위해서는 명확한 목표를 가지고 올바른 질문을 할 수 있어야 한다. 네이선 야우저의 “비주얼라이즈 디스” 라는 책을 보면 데이터를 통해 이야기 하는 방법을 제시한다. 먼저 데이터를 수집하고, 무엇을 알고 싶은지 질문을 하고, 답을 얻기 위한 적절한 도구를 고른 후, 도구를 활용하여 데이터를 탐색한다. 당신의 삶과 업무를 바꾸는 데이터 과학 (데이터 사이언스)

Open Data

R. Infographics. 데이터과학 분야를 무료로 배울 수 있는 방법. 데이터과학 분야를 무료로 배울 수 있는 방법입니다.

데이터과학 분야를 무료로 배울 수 있는 방법

원문페이지에는 26가지의 가이드가 있습니다. 그 중에 10가지만 우선 공유합니다. 10가지만 해도 충분히 시간이 걸리고 해볼만한 일인것 같습니다. 텍스트의 일부를 번역했고 의역이 있으니 참고해주시기 바랍니다. 원문페이지 주소는 입니다. 공유해가시는 것은 환영합니다. 1. 2. 하지만 데이터과학자는 위의 언급된 사람들보다 각 분야에 대한 이해도나 실제로 만들어내는 역량은 다소 부족하지만, 각각을 어떻게 이어나가 일로 만들어낼지는 아는 사람이라고 생각합니다. 3. 4. Data Science II. Final Project Information Extracting meaning from data remains one of the biggest tasks of science.

Data Science II

The Internet and modern computers have given us vast amounts of data, so it is more important than ever to understand how to collect, process, and analyze these data while maintaining reproducibility with data provenance or "chain of custody" of the data. In this course students will learn: long-term data harvesting from web APIs with automated computer programs, data "munging" or cleaning to process data, analyzing data with existing methods such as descriptive statistics and visualizations, developing new, problem-specific measures to explore trends and features in data, and communicating data-driven results.

Particular emphasis will be placed on nontraditional (non-numeric) data such as networks, text corpora, etc.; building computational workflows by combining different tools/programs; and working with remote compute resources. [D3.js] 배우는 방법. D3.js 는 데이터 시각화 프레임워크로 잘 알려져 있고, 자바스크립트로 개발을 한다.

[D3.js] 배우는 방법

HTML5의 SVG(Scalable Vector Graphic) 을 통하여 다양한 화면 해상도에서도 깨짐없는 Visualizing이 가능하다. D3.js를 익히기 위한 과정을 정리해 본다. 개념 익히기 - 일반적인 사항에 대하여 알자. R에서 파이썬까지…데이터과학 학습 사이트 8곳. * 2018년이면 미국에서는 19만명의 데이터과학자가 부족해질 것이다.

R에서 파이썬까지…데이터과학 학습 사이트 8곳

그리고 빅데이터 속에서 인사이트를 발견할 수 있는 매니저와 분석가도 150만명이나 필요해질 것이다. – 맥킨지, 2013* 데이터 과학자는 21세기의 가장 섹시한 직업 – 하버드비즈니스리뷰 데이터과학자, 데이터 엔지니어에 대한 수요가 늘고 있다는 뉴스가 갈수록 많이 나온다. ‘나도 데이터과학을 공부해볼까?’ Code School - Try Git. MapView: basic interactive viewing of spatial data in R. Working with spatial data in R I find myself quite often in the need to quickly visually check whether a certain analysis has produced reasonable results.

mapView: basic interactive viewing of spatial data in R

There are two ways I usually do this. Either I: The Hacking Team - 'SKA' emails. 10 min read 이탈리아 해킹팀 The Hacking Team이 해킹을 당하면서 풀린 수많은 고객 리스트.

The Hacking Team - 'SKA' emails

그 중에 국정원이 속해 있어 많은 파장을 불러일으키고 있습니다. Github fork 에서 pull request 까지 그리고 merge. 요즘 gitHub에 가면 어마어마한 소스코드들이 널려있습니다.

github fork 에서 pull request 까지 그리고 merge

개발자로서 자신의 한계를 충분히 느끼게 해줍니다. ㅜ.ㅜ (충분해도 너무 충분해) 저 역시 용감(사실은 무모)하게 gitHub에 소스코드를 공개하고 프로젝트를 운영중인데요. 정말 많은 분들이 관심 가져 주시고 도와주셔서 여러가지로 아쉽지만 재미있게 개발하고 있습니다. 하지만 아쉽게도 git사용법이 어려워서 더욱 더 많은 분들이 오픈소스 프로젝트에 참여하지 못한다는 생각을 하면 가끔 밤에 잠이 안 옵니다. 그러던 차에 가능한 방법을 찾게 되어 이렇게 정리하여 글을 남김니다. 1. git 제가 전문적인 지식없이 git이 이런거다 떠드는건 사실 좀 부끄럽습니다. Git을 제대로 알기위해선 사이트에 가서 “Try Git” 링크를 찾아보세요.

웹사이트에서 git 명령어들을 학습할 수 있습니다. Welcome · R 팩키지(pakcage) GitHub Special: Data Scientists to Follow & Best Tutorials on GitHub. Introduction Twitter started the trend of ‘People to Follow’. This later got replicated by other platforms such as Facebook, Linkedin, Quora and GitHub.

Python

Competitions. The Analytics Edge. BayesianWork/python_install_guide.md at master · psygrammer/bayesianWork. 누구나 쉽게 이해할 수 있는 Git 입문~버전 관리를 완벽하게 이용해보자~ R:Литература — Psylab.info. BioPy. Ramnathv/rCharts. rShiny. R Graphics Cookbook - O'Reilly Media. Winston Chang has chosen what for me is a first class set of examples which go for maximum simplicity - no trying to remember what happens inside double square parentheses if the parameter dtring begins with just a comma!)

, and most lots and lots of graphics to show just how things are achieved. Using r Markdown. Using R Markdown – RStudio Support. R Markdown enables easy authoring of reproducible web reports from R. It offers: Easy creation of web reports from R that can be automatically regenerated whenever underlying code or data changes. A highly accessible syntax (markdown) which lower the barriers to entry for reproducible research. Ecor/ch2_Rbasic.md at master · psygement/ecor.