본문 바로가기

Python

(스마트인재개발원) 머신러닝 수업 전 파이썬 복습

 

Pandas

 

- 파이썬에서 사용할 수 있는 데이터 분석 라이브러리

 

- 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음

 

DataFrame

 

- import pandas as pd

 

- df = pd.DataFrame(data, index, columns, dtype, copy)

 


CSV 파일 읽어오기

 

-pd.read_csv('파일명.csv', encoding='euc-kr')

 

 파일에 한글이 있으면 깨지기 때문에 인코딩 필수 !

 


열(columns) 삭제 

 

-drop()

 

- inplace 뜻은 제자리에, 가동할 준비가 되어있는

 

 inplace =True (저장함)

 inplace = False(저장 안 함)

 

 rename, drop 등의 메서드를 사용할때,

 변경 값을 저장 할 때 사용


DataFrame 인덱싱 하는 방법

 

- 바로 인덱싱 하는방법, loc, iloc

 

- df[]  바로 인덱싱

 

- df.loc['row','column'] row와 column의 이름을 그대로 씀

 

- df.iloc['row','column'] row와 column의 인덱스 값으로 인덱싱하는 방법


데이터를 정렬하는 방법

 

sort

- 정렬, 기본값은 오름차순 정렬

 

sort_index()

- 인덱스(index)기준으로 데이터 정렬

 

sort_values()

- 컬럼의 값을 기준으로 데이터 정렬

 


data안에 ['요일']에서  월요일인지 아닌지 검사

 

-월요일이 아니면 False

 

-월요일이면 True


df.iloc 와 df.loc 메서드를 활용한 불리언 인덱싱

 

- 입력받은 불린배열의 요소 수는 DataFrame의 행의 수와 같아야한다.

 

- .iloc 와 .loc 메서드를 활용한 불린인덱싱은 동일한 방법으로 수행

 


사용할 조건이 여러개이면 

 

-& (and) 연산자를 이용해서 , 여러개 행 인덱스에 넣어주면 된다.

 


 

pd.merge

- 공통의 열을 기준으로 두 데이터프레임을 합쳐준다

 

-기준열 이름이 같을때

 pd.merge(left, right, on="기준열" , how = "조인방식")

 

-기준열 이름이 다를때

 pd.merge(left, right, left_on = '왼쪽 열' , right_on='오른쪽 열' , how = '조인방식')

 

 left : 왼쪽 데이터 프레임 

 right : 오른 쪽 데이터 프로임

 on : (두 데이터 프레임의 기준열 이름이 같을 때) 기준열

 how : 조인 방식('left','right','inner','outer') / 기본 값은 'inner'

 left_on : 기준열 이름이 다를 때 , 왼쪽 기준열

 right_on : 기준열 이름이 다를때 , 오른쪽 기준열

 


변수.to_csv('파일주소/파일이름.csv' , encoding='euc-kr')

 

파일에 한글이 있으면 깨지기 때문에 인코딩 필수!

 

위에선 파일명이 result로 내보내짐

 

 

 

 

 

Matplotlib 라이브러리를 이용해서 그래프를 그리는 방법

- import matplotlib.pyplot as plt  임폴트를 해준다

 

Pyplot 

- matplotlib.pyplot 모듈은 MATLAB과 비슷하게 명령어 스타일로 동작하는 함수 모음

 

- 각각의 함수를 사용해서 간편하게 그래프를 만들고 변화를 줄 수 있습니다

 

- 예를 들어 몇 개의 선을 표현하고, 레이블로 꾸미는 등의 일을 할 수 있습니다

 

 


 

value_counts()

 

-각각의 value가 몇 개 있는지 확인해주는 메서드

 

 


https://www.smhrd.or.kr/

 

스마트인재개발원

4차산업혁명시대를 선도하는 빅데이터, 인공지능, 사물인터넷 전문 '0원' 취업연계교육기관

www.smhrd.or.kr