Python/pandas(4)
-
Python pandas - 상관관계 분석 -2
지난 시행착오를 통해 분석을하는데 데이터를 어떻게 만들어주느냐가 중요하다는걸 깨달았다. 그러려면 분석을 공부해야될것같다....일단은 pandas의 사용법을 익히고있으니 그거에 맞춰서만 진행해보자 지난 데이터의 잘못된점을 찾아본다면, 내가 상관관계의 분석을 a의 변화에 맞춰서 b의 변화가 얼마나 이루어지나로 이해했다고 해놓고데이터는 값이 변화하는걸 뽑은게 아니라, 여자와 남자의 구분수가 얼마나 있는지를 뽑았으니 원하는 결과가 안나왔던거 같다. 그럼 값이 변화하는 데이터를 뽑아보자. import pandas as pd from pandas import DataFrame from pandas import Series import numpy as np import matplotlib.pyplot as plt #..
2018.11.06 -
Python pandas - 상관관계 분석 -1
Python 을 이용해서 상관관계 분석을 실행하기에 앞서 상관관계분석이란 무엇인지 간단하게 알아보고왔다. 상관 분석(correlation analysis)은 확률론과 통계학에서 두 변수간에 어떤 선형적 관계를 갖고 있는 지를 분석하는 방법이다. 두변수는 서로 독립적인 관계이거나 상관된 관계일 수 있으며 이때 두 변수간의 관계의 강도를 상관관계(Correlation, Correlation coefficient)라 한다. 상관분석에서는 상관관계의 정도를 나타내는 단위로 모상관계수 ρ를 사용한다.상관관계의 정도를 파악하는 상관계수(Correlation coefficient)는 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하는 것은 아니다. 두 변수간에 원인과 결과의 인과관계가 있는지에 대한 것은 회귀분..
2018.11.06 -
Pandas 엑셀파일읽고 데이터 컨트롤
엑셀파일을 제공받아 주어진 엑셀파일을 읽어보았다 from pandas import Series import numpy as np # Reading abalone data set pd.set_option('display.float_format', None) co = pd.read_excel("D:\Project\myProject\python\pandas\CO.xlsx", sheet_name='Sheet1') co = pd.read_excel("D:\Project\myProject\python\pandas\CO.xlsx", sheet_name='Sheet1') 와같이 쓰고 sheet_name 을 해당 시트에 맞게 입력해주면 데이터가 들어온다. 주민번호 앞자리 남여구분 상담일자 위기도단계 ... 건강보험료체납..
2018.10.17 -
Python Pandas 시작
\Python 을 해본적도 없는데 갑자기 Python 으로 분석을 해야할 일이 생겼다. 데이터 분석 강의를 찾아보니 전부 R로 되어있고 파이썬 강의는 찾을 수 없었다. 왜 회사에서는 R이 아닌 파이썬으로 PPT를 준비하라고 했을까? 출처 : http://media.fastcampus.co.kr/knowledge/dataanalysis-python-r/R의 장단점장점 1 : 데이터 시각화 시각화된 데이터는 Raw 데이터 보다 훨씬 효과적으로 그 의도를 전달할 수 있습니다. R을 처음 만든 목적 자체가 ‘데이터 분석, 통계학 그리고 시각화를 하기 위해 더 좋고 친근한 방법을 만들어 보자!‘입니다. 그만큼 R은 강력한 데이터 시각화 기능을 자랑하죠. 의미 전달이나 보고가 목적이라면 R을 활용하세요. 대표적인 ..
2018.09.28