
Pandas
- 파이썬에서 사용할 수 있는 데이터 분석 라이브러리
- 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음
DataFrame
- import pandas as pd
- df = pd.DataFrame(data, index, columns, dtype, copy)
CSV 파일 읽어오기
-pd.read_csv('파일명.csv', encoding='euc-kr')
파일에 한글이 있으면 깨지기 때문에 인코딩 필수 !

열(columns) 삭제
-drop()
- inplace 뜻은 제자리에, 가동할 준비가 되어있는
inplace =True (저장함)
inplace = False(저장 안 함)
rename, drop 등의 메서드를 사용할때,
변경 값을 저장 할 때 사용


DataFrame 인덱싱 하는 방법
- 바로 인덱싱 하는방법, loc, iloc
- df[] 바로 인덱싱
- df.loc['row','column'] row와 column의 이름을 그대로 씀
- df.iloc['row','column'] row와 column의 인덱스 값으로 인덱싱하는 방법

데이터를 정렬하는 방법
sort
- 정렬, 기본값은 오름차순 정렬
sort_index()
- 인덱스(index)기준으로 데이터 정렬
sort_values()
- 컬럼의 값을 기준으로 데이터 정렬

data안에 ['요일']에서 월요일인지 아닌지 검사
-월요일이 아니면 False
-월요일이면 True

df.iloc 와 df.loc 메서드를 활용한 불리언 인덱싱
- 입력받은 불린배열의 요소 수는 DataFrame의 행의 수와 같아야한다.
- .iloc 와 .loc 메서드를 활용한 불린인덱싱은 동일한 방법으로 수행

사용할 조건이 여러개이면
-& (and) 연산자를 이용해서 , 여러개 행 인덱스에 넣어주면 된다.



pd.merge
- 공통의 열을 기준으로 두 데이터프레임을 합쳐준다
-기준열 이름이 같을때
pd.merge(left, right, on="기준열" , how = "조인방식")
-기준열 이름이 다를때
pd.merge(left, right, left_on = '왼쪽 열' , right_on='오른쪽 열' , how = '조인방식')
left : 왼쪽 데이터 프레임
right : 오른 쪽 데이터 프로임
on : (두 데이터 프레임의 기준열 이름이 같을 때) 기준열
how : 조인 방식('left','right','inner','outer') / 기본 값은 'inner'
left_on : 기준열 이름이 다를 때 , 왼쪽 기준열
right_on : 기준열 이름이 다를때 , 오른쪽 기준열

변수.to_csv('파일주소/파일이름.csv' , encoding='euc-kr')
파일에 한글이 있으면 깨지기 때문에 인코딩 필수!
위에선 파일명이 result로 내보내짐

Matplotlib 라이브러리를 이용해서 그래프를 그리는 방법
- import matplotlib.pyplot as plt 임폴트를 해준다
Pyplot
- matplotlib.pyplot 모듈은 MATLAB과 비슷하게 명령어 스타일로 동작하는 함수 모음
- 각각의 함수를 사용해서 간편하게 그래프를 만들고 변화를 줄 수 있습니다
- 예를 들어 몇 개의 선을 표현하고, 레이블로 꾸미는 등의 일을 할 수 있습니다


value_counts()
-각각의 value가 몇 개 있는지 확인해주는 메서드


스마트인재개발원
4차산업혁명시대를 선도하는 빅데이터, 인공지능, 사물인터넷 전문 '0원' 취업연계교육기관
www.smhrd.or.kr