background preloader

Tips+utility

Facebook Twitter

Sci-Hub: removing barriers in the way of science. IPython Books - IPython Cookbook. Academic Phrasebank – Referring to Sources. One of the distinguishing features of academic writing is that it is informed by what is already known, what work has been done before, and/or what ideas and models have already been developed.

Academic Phrasebank – Referring to Sources

Thus, in academic texts, writers frequently make reference to other studies and to the work of other authors. It is important that writers guide their readers through this literature. 50+ Data Science and Machine Learning Cheat Sheets. Gear up to speed and have Data Science & Data Mining concepts and commands handy with these cheatsheets covering R, Python, Django, MySQL, SQL, Hadoop, Apache Spark and Machine learning algorithms.

50+ Data Science and Machine Learning Cheat Sheets

Cheatsheets on Python, R and Numpy, Scipy, Pandas There are thousands of packages and hundreds of functions out there in the Data science world! An aspiring data enthusiast need not know all. Here are the most important ones that have been brainstormed and captured in a compact few pages. Mastering Data science involves understanding of statistics, Mathematics, Programming knowledge especially in R, Python & SQL and then deploying a combination of all these to derive insights using the business understanding & a human instinct—that drives decisions.

Here are the cheatsheets by category: Cheat sheets for Python: Python is a popular choice for beginners, yet still powerful enough to back some of the world’s most popular products and applications. Share more & Learn! Online Statistics Education: A Free Resource for Introductory Statistics. Change your data with one example. Color Wheel Pro: Classic Color Schemes. Monochromatic color scheme The monochromatic color scheme uses variations in lightness and saturation of a single color.

Color Wheel Pro: Classic Color Schemes

This scheme looks clean and elegant. Monochromatic colors go well together, producing a soothing effect. The monochromatic scheme is very easy on the eyes, especially with blue or green hues. You can use it to establish an overall mood. IT eBooks - Free Download - Big Library. Beautiful, Free Math. Electronic library. Download books free. Finding books. The best 10 free programs for mathematics (Part III) 조대협의 블로그. 통계학의 기본 아래글은 한국 통계진흥원 손안의 통계 中 "1장 통계 개념 체크하기"를 요약 정리한 내용입니다.

조대협의 블로그

기술통계(Descriptive statistics) : 기술 통계는 수집된 자료(전체이건 표본이건)의 특성을 잘 나타내어 표나, 그림, 평균과 같은 측도 값을 구하는 통계 기법이며 추측통계(Inferential statistics) : 추측 통계는 전체 모집단을 분석하지 않고, 표본을 추출 하여 표본으로 모집단의 특성을 추정하는 방법 통계학의 처음에 정치를 위해서 개발 되었다. 국가를 경영하려면 판단의 지표가 될 수 있는 각종 요약자료가 필요 했는데, 이것이 발전해서 의학,약학,여론조사,경제학,사회학,교육학등 다양한 분야에서 사용되고 있다. 통계 변수 이산형 변수 (discrete variable) : 남/녀, 자동차 종류 등과 같이 연속성이 없는 변수 연속형 변수 (continuous variable) : 키, 몸무게등 실수와 같이 쪼게면 쪼겔수록 무한히 쪼게지는 연속된 변수 도수분포표와 히스토그램 히스토 그램 : 연속형 변수는 히스토그램을 이용하여 표현이 가능하다.

도수분포표 (frequency table) : 빈도수 분포표라고도 하는데, 연속형 변수의 경우 히스토그램 처럼 구간을 나눠서 그래프가 아니라 테이블로 표현한 거나, 이산형 변수의 경우 각 변수의 값을 테이블로 표현한 것을 도수 분포표 라고 한다. 연속형 데이터는 통계량을 요약하는데, 주로 데이터를 표현하는데 다음과 같은 값들을 사용한다. D3.js 라이브러리 소개. 그래프를 보려면 파이어폭스 또는 크롬 브라우저를 이용합니다.

D3.js 라이브러리 소개

인터넷 익스플로러에서는 블로그에서 그래프가 보이도록 사용한 HTML iframe 태그와 문제가 있는 듯 합니다. 인터넷 익스플로러에서는 이곳에서 그래프를 직접 봅니다. 요즈음 빅 데이터가 유행하면서 인포그래픽에 대한 관심이 많아지고 있다. 인포그래픽이 정보를 시각화해 정보의 이해를 쉽게 해주기 때문이다. 이런 인포그래픽을 표현하기 위한 도구들과 라이브러리들은 다양하다. D3.js 는 데이터 기반으로 문서를 처리하는 JavaScript 라이브러리이다. HTML로 간단한 페이지를 만들거나, 구글링을 하면서 CSS로 웹 페이지에 효과를 넣어보거나, JavaScript 책을 보면서 JavaScript를 작성하거나 소스를 분석하는 정도의 기술을 가진 필자도 D3.js 기술을 분석하여 그래프를 그리는 데 크게 어렵지는 않았다. D3.js 라이브러리를 처음 알게 된 계기는 필자의 전문 분야인 Apache Camel, Apache ActiveMQ, Apache ServiceMix와 같은 기업 통합 제품들을 위한 새로운 웹 관리자 프로젝트인 hawt.io 프로젝트를 통해서이다. D3.js 홈페이지에 가면 수많은 인포그래픽 데모들과 소스들을 볼 수 있다. 이미 D3.js 기반으로 좀더 추상화한 많은 상위 라이브러리들이 존재한다.

엑셀, 중복값을 처리하는 7가지 방법. 이 내용은 몇 달 전 N사 모 블로그에 직접 포스팅 했던 내용입니다.

엑셀, 중복값을 처리하는 7가지 방법

정이 많이 가는(?) 내용이라 굳이 스크랩을 사용하지 않고, 그대로 옮겨 봤습니다. (개인적으로 같은 내용의 글이 N사와 티스토리에서 어떻게 검색되고, 조회되는 지도 비교해보고 싶었습니다) 그런데...분명히 제가 작성한 글인데, 최근에 엑셀을 멀리 했더니 무슨 말인지 모르겠더군요 ;; 저의 기억력 감퇴로 인해 일시적인 게슈탈트 붕괴현상을 경험했습니다. 아마 몇 달 더 지나서 봤으면, 제가 쓴 글인 줄 몰랐을 지도 모릅니다. 1. 한개의 셀에서 중복되는 값만 강조하여 체크하는 방법입니다. 적용하고자 하는 셀을 선택 하신 후, 아래와 같이 셀 강조 규칙만 설정하면 됩니다. 2. 한개의 셀에서 중복되는 값을 다른 셀에 표시하는 방법입니다. 이와 같이 하기 위해서는 B2에 오른쪽에 쓰인 함수를 사용 하면 됩니다. 여기서 잠깐 이 함수를 살표보겠습니다. 데이터시각화 언어 D3.js 넌 대체 누구냐?!! D3.js 데이터 분석과 시각화가 주목을 받으면서 관련된 언어선택의 이슈에 맞닿게 됩니다.

데이터시각화 언어 D3.js 넌 대체 누구냐?!!

자신에게 맞는 언어를 찾아 숙련도를 높여야 하는거죠. 그러기 위해서는 각 언어에 대해 알아야 합니다. 그래서 이번에는 시각화의 대표적 언어라 할 수 있는 D3.js 를 소개합니다. 오픈소스이기 때문에 구하기도 쉽고 마찬가지로 라이브러리도 많기에 시각화를 처음 접하는 분들이 쓰기 좋은 언어입니다. D3 라는 이름은 Data Driven Document 의 축약형이다. 위 내용에 나타난 것처럼 D3.js 는 시각화 전문 프로그램은 아니나, 전문 프로그램에 준하는 효과를 낼 수 있는 오픈소스 라이브러리로 볼 수 있습니다. 페이지 : 홈페이지의 소개에 따르면 앞선 설명처럼 데이터 문서를 제작하기 위한 자바스크립트 라이브러리라고 되어있는 것을 볼 수 있습니다. D3.js is a JavaScript library for manipulating documents based on data. D3.js 의 API Reference 를 볼 수 있는 페이지입니다.