혼공분석 7

[데이터분석/파이썬] 판다스에서 데이터프레임의 특정 행(row)과 열(column)을 삭제하기

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) * 작성일 : 2023년 07월 23일 목표 판다스에서 데이터프레임의 특정 행(row)과 열(column)을 삭제하기 데이터는 도서관 정보나루에서 받아온 서울특별시 교육청 남산 도서관 장서 대출 목록 2023년 6월 (CSV) 파일을 이용했습니다. 아래 사이트에서 다운받을 수 있습니다. 도서관 정보나루 전국 서울 부산 대구 인천 광주 대전 울산 세종 경기 강원 충북 충남 전북 전남 경북 경남 제주 전체 영유아(0~5) 유아(6~7) 초등(8~13) 청소년(14~19) 20대 30대 40대 50대 60대 이상 전체 영유아(남) 영유 www.data4library.kr 데이터는 아래와 같이 작성되어 있습니다. 가장 마지막에 콤마(,)가 포함되어 있는..

[데이터분석/파이썬] requests와 Bueatiful Soup를 이용해서 웹 크롤링하기: yes24에서 책 페이지 수 가져오기

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) * 작성일 : 2023년 07월 16일 목표 책 『혼자 공부하는 데이터 분석』 의 페이지 수를 Yes24 홈페이지에서 크롤링하기 https://www.yes24.com/Product/Goods/116253011 혼자 공부하는 데이터 분석 with 파이썬 - YES24 혼자 해도 충분하다! 1:1 과외하듯 배우는 데이터 분석 자습서이 책은 독학으로 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로 학습’할 수 있도록 구성했습니다. 뭘 모르는지조차 www.yes24.com Yes24 에서 ISBN13 으로 검색하면 다음과 같은 URL을 이용합니다. https://www.yes24.com/Product/Search?domain=BOOK&quer..

[데이터분석/파이썬] 도서 정보 OpenAPI 사용하기 (도서관 정보나루)

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) 작성일 : 2023년 07월 13일 이번 글은 도서관 정보나루 홈페이지에서 Open API 를 신청하고 데이터를 받아오는 과정을 설명합니다. 작성일 기준으로 시간이 오래 지날 경우 홈페이지 구성이나 내용이 일부 다를 수 있습니다. 먼저 도서관 정보나루 홈페이지에 접속합니다. 도서관 정보나루 전국 서울 부산 대구 인천 광주 대전 울산 세종 경기 강원 충북 충남 전북 전남 경북 경남 제주 전체 영유아(0~5) 유아(6~7) 초등(8~13) 청소년(14~19) 20대 30대 40대 50대 60대 이상 전체 영유아(남) 영유 www.data4library.kr 거의 1500개에 가까운 도서관으로부터 1억 7천여권의 책에 대한 정보를 제공하고 있습니다. ..

[데이터분석/파이썬] XML 포맷 다루는 방법 (xml.etree.ElementTree, 판다스 read_xml)

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) 함수 / 메서드 기능 ElementTree.fromstring(str) XML 문자열을 xml.etree.Element 객체로 변환 Element.tag Element 객체의 tag Element.findtext('tag') Element 객체 내부에 있는 특정 tag에 쌓인 text 값 반환 Element.findall('tag') Element 객체 내부에서 특정 tag 값에 해당하는 Element 의 list Pandas.read_xml(str) XML 문자열을 판다스 데이터프레임으로 변환 xml.etree.ElementTree xml.etree.ElementTree 의 fromstring() 을 이용해서 XML 문자열을 객체로 변환 Ele..

[데이터분석/파이썬] json 포맷 다루는 방법 (json, pandas)

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) 함수 / 메서드 기능 json.dumps() 파이썬 객체를 JSON 문자열로 변환 json.loads() JSON 문자열을 파이썬 객체로 변환 pandas.read_json() JSON 문자열을 판다스 시리즈나 데이터프레임으로 변환 pandas.DataFrame() list 를 판다스 데이터프레임으로 변환 JSON 은 파이썬의 딕셔너리 (dictionary) 와 리스트 (list) 를 중첩해 놓은 것과 비슷함 아래 같은 방법으로 JSON 형식을 이용해 파이썬 딕셔너리를 만들 수 있음 json 패키지 사용 (import json) 파이썬 객체를 json 문자열로 변환하기 json.dumps() 사용 json 문자열을 파이썬 객체 (딕셔너리) 로 변..

[데이터분석/파이썬] csv 파일을 Pandas 데이터프레임으로 읽기 / 데이터프레임을 csv 파일에 쓰기

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) 요약 Pandas 의 read_csv() encoding='EUC-KR' low_memory=False dtype={'column': str} index_col=0 Pandas 의 to_scv() 내용 Pandas 의 read_csv 함수를 이용하면 csv 파일을 데이터 프레임으로 읽을 수 있다. encoding='EUC-KR' 파일의 인코딩 형식 지정 low_memory=False Pandas 는 메모리를 효율적으로 상요하기 위해 CSV 파일을 나눠서 읽는데, 이때 각 열의 데이터가 어떤 타입인지 자동으로 파악한다. 이 때, 읽은 단위에서 파악한 열의 데이터 타입이 다를 경우 경고를 발생시킨다. low_memory 를 False 로 설정하면 파..

[데이터분석/파이썬] gdown 으로 구글 드라이브에 저장된 csv 파일 읽어오기 (gdown, chardet)

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어) 목차 구글 드라이브에 있는 csv 파일의 다운로드 링크 만들기 파이썬으로 구글 드라이브에 있는 csv 다운로드 (gdown package) 다운 받은 csv 파일의 인코딩을 확인 (chardet package) 파일 내용 출력해보기 내용 1. 구글 드라이브에 있는 csv 파일의 다운로드 링크 만들기 2. 파이썬으로 구글 드라이브에 있는 csv 다운로드 import gdown gdown.download('https://drive.google.com/uc?id=1YWQYhKWFkKGasxdznAy4ZokGD0oQtvq2&export=download', '서울특별시교육청남산도서관 장서 대출목록 (2023년 06월).csv', quiet=False) 3..

반응형