개발 Dev/데이터 분석

[데이터분석/파이썬] XML 포맷 다루는 방법 (xml.etree.ElementTree, 판다스 read_xml)

BoBooBoo 2023. 7. 9. 23:10
반응형

* 참고 교재 : 혼자 공부하는 데이터 분석 (한빛미디어)

 

함수 / 메서드 기능
ElementTree.fromstring(str) XML 문자열을 xml.etree.Element 객체로 변환
Element.tag Element 객체의 tag
Element.findtext('tag') Element 객체 내부에 있는 특정 tag에 쌓인 text 값 반환
Element.findall('tag') Element 객체 내부에서 특정 tag 값에 해당하는 Element 의 list
Pandas.read_xml(str) XML 문자열을 판다스 데이터프레임으로 변환

 

xml.etree.ElementTree

  • xml.etree.ElementTree 의 fromstring() 을 이용해서 XML 문자열을 객체로 변환
  • Element.tag 로 현재 객체의 Tag 값을 볼 수 있음

 

 

  • Element.findtext('tag') 를 사용하면 객체 내부의 특정 tag 에 둘러 쌓인 문자열을 가져올 수 있음

 

 

  • XML 내부에 같은 이름의 태그들이 포함되어 있는 경우, Element.findall('tag') 을 이용해서 list 형태로 가져올 수 있음

 

 

Pandas 로 XML 다루기

  • read_xml(str) 을 사용해서 XML 문자열을 판다스 데이터프레임으로 변환

 

 

끝.

반응형