개발 Dev/데이터 분석
[데이터분석/파이썬] csv 파일을 Pandas 데이터프레임으로 읽기 / 데이터프레임을 csv 파일에 쓰기
BoBooBoo
2023. 7. 9. 00:50
반응형
* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어)
요약
- Pandas 의 read_csv()
- encoding='EUC-KR'
- low_memory=False
- dtype={'column': str}
- index_col=0
- Pandas 의 to_scv()
내용
Pandas 의 read_csv 함수를 이용하면 csv 파일을 데이터 프레임으로 읽을 수 있다.
- encoding='EUC-KR'
- 파일의 인코딩 형식 지정
- low_memory=False
- Pandas 는 메모리를 효율적으로 상요하기 위해 CSV 파일을 나눠서 읽는데, 이때 각 열의 데이터가 어떤 타입인지 자동으로 파악한다. 이 때, 읽은 단위에서 파악한 열의 데이터 타입이 다를 경우 경고를 발생시킨다.
- low_memory 를 False 로 설정하면 파일을 한 번에 읽기 때문에 이 경고를 무시할 수 있다.
1 2 3 4 5 | import pandas as pd # 파일을 한번에 읽기 위해 low_memory 를 False 로 설정 df = pd.read_csv('서울특별시교육청남산도서관 장서 대출목록 (2023년 06월).csv', encoding='EUC-KR', low_memory=False) df.head() | cs |
- dtype={'column_name' : TYPE, 'column_name' : TYPE, ... }
- low_memory 의 데이터 타입에 대한 경고를 방지하기 위해 column 의 타입을 직접 명시해 줄 수도 있다
- index_col=NUMBER
- 위의 예들 처럼 기본적으로 Pandas 는 데이터의 index 를 자동으로 생성해준다.
- 이미 인덱스가 존재하는 데이터인 경우 직접 그 column 을 지정해 줄 수도 있다.
pandas 의 to_scv 함수를 이용하면 데이터 프레임을 csv 파일로 저장할 수 있다.
반응형