개발 Dev/데이터 분석
[데이터분석/파이썬] XML 포맷 다루는 방법 (xml.etree.ElementTree, 판다스 read_xml)
BoBooBoo
2023. 7. 9. 23:10
반응형
* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어)
함수 / 메서드 | 기능 |
ElementTree.fromstring(str) | XML 문자열을 xml.etree.Element 객체로 변환 |
Element.tag | Element 객체의 tag |
Element.findtext('tag') | Element 객체 내부에 있는 특정 tag에 쌓인 text 값 반환 |
Element.findall('tag') | Element 객체 내부에서 특정 tag 값에 해당하는 Element 의 list |
Pandas.read_xml(str) | XML 문자열을 판다스 데이터프레임으로 변환 |
xml.etree.ElementTree
- xml.etree.ElementTree 의 fromstring() 을 이용해서 XML 문자열을 객체로 변환
- Element.tag 로 현재 객체의 Tag 값을 볼 수 있음
- Element.findtext('tag') 를 사용하면 객체 내부의 특정 tag 에 둘러 쌓인 문자열을 가져올 수 있음
- XML 내부에 같은 이름의 태그들이 포함되어 있는 경우, Element.findall('tag') 을 이용해서 list 형태로 가져올 수 있음
Pandas 로 XML 다루기
- read_xml(str) 을 사용해서 XML 문자열을 판다스 데이터프레임으로 변환
끝.
반응형