개발 Dev/데이터 분석

[데이터분석/파이썬] csv 파일을 Pandas 데이터프레임으로 읽기 / 데이터프레임을 csv 파일에 쓰기

BoBooBoo 2023. 7. 9. 00:50
반응형

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어)

 

요약

  • Pandas 의 read_csv()
    • encoding='EUC-KR'
    • low_memory=False
    • dtype={'column': str}
    • index_col=0
  • Pandas 의 to_scv()

 

내용

Pandas 의 read_csv 함수를 이용하면 csv 파일을 데이터 프레임으로 읽을 수 있다.

 

  • encoding='EUC-KR'
    • 파일의 인코딩 형식 지정
  • low_memory=False
    • Pandas 는 메모리를 효율적으로 상요하기 위해 CSV 파일을 나눠서 읽는데, 이때 각 열의 데이터가 어떤 타입인지 자동으로 파악한다. 이 때, 읽은 단위에서 파악한 열의 데이터 타입이 다를 경우 경고를 발생시킨다.
    • low_memory 를 False 로 설정하면 파일을 한 번에 읽기 때문에 이 경고를 무시할 수 있다.

 

1
2
3
4
5
import pandas as pd
# 파일을 한번에 읽기 위해 low_memory 를 False 로 설정
df = pd.read_csv('서울특별시교육청남산도서관 장서 대출목록 (2023년 06월).csv',           
                 encoding='EUC-KR', low_memory=False)
df.head()
cs

 

 

  • dtype={'column_name' : TYPE, 'column_name' : TYPE, ... } 
    • low_memory 의 데이터 타입에 대한 경고를 방지하기 위해 column 의 타입을 직접 명시해 줄 수도 있다

 

 

  • index_col=NUMBER
    • 위의 예들 처럼 기본적으로 Pandas 는 데이터의 index 를 자동으로 생성해준다.
    • 이미 인덱스가 존재하는 데이터인 경우 직접 그 column 을 지정해 줄 수도 있다.

 

 

pandas 의 to_scv 함수를 이용하면 데이터 프레임을 csv 파일로 저장할 수 있다.

 

 

반응형