반응형
* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어)
요약
- Pandas 의 read_csv()
- encoding='EUC-KR'
- low_memory=False
- dtype={'column': str}
- index_col=0
- Pandas 의 to_scv()
내용
Pandas 의 read_csv 함수를 이용하면 csv 파일을 데이터 프레임으로 읽을 수 있다.
- encoding='EUC-KR'
- 파일의 인코딩 형식 지정
- low_memory=False
- Pandas 는 메모리를 효율적으로 상요하기 위해 CSV 파일을 나눠서 읽는데, 이때 각 열의 데이터가 어떤 타입인지 자동으로 파악한다. 이 때, 읽은 단위에서 파악한 열의 데이터 타입이 다를 경우 경고를 발생시킨다.
- low_memory 를 False 로 설정하면 파일을 한 번에 읽기 때문에 이 경고를 무시할 수 있다.
1 2 3 4 5 | import pandas as pd # 파일을 한번에 읽기 위해 low_memory 를 False 로 설정 df = pd.read_csv('서울특별시교육청남산도서관 장서 대출목록 (2023년 06월).csv', encoding='EUC-KR', low_memory=False) df.head() | cs |

- dtype={'column_name' : TYPE, 'column_name' : TYPE, ... }
- low_memory 의 데이터 타입에 대한 경고를 방지하기 위해 column 의 타입을 직접 명시해 줄 수도 있다
- index_col=NUMBER
- 위의 예들 처럼 기본적으로 Pandas 는 데이터의 index 를 자동으로 생성해준다.
- 이미 인덱스가 존재하는 데이터인 경우 직접 그 column 을 지정해 줄 수도 있다.
pandas 의 to_scv 함수를 이용하면 데이터 프레임을 csv 파일로 저장할 수 있다.
반응형
'개발 Dev > 데이터 분석' 카테고리의 다른 글
[데이터분석/파이썬] requests와 Bueatiful Soup를 이용해서 웹 크롤링하기: yes24에서 책 페이지 수 가져오기 (1) | 2023.07.16 |
---|---|
[데이터분석/파이썬] 도서 정보 OpenAPI 사용하기 (도서관 정보나루) (0) | 2023.07.13 |
[데이터분석/파이썬] XML 포맷 다루는 방법 (xml.etree.ElementTree, 판다스 read_xml) (0) | 2023.07.09 |
[데이터분석/파이썬] json 포맷 다루는 방법 (json, pandas) (0) | 2023.07.09 |
[데이터분석/파이썬] gdown 으로 구글 드라이브에 저장된 csv 파일 읽어오기 (gdown, chardet) (0) | 2023.07.08 |