파이썬으로 웹 크롤링하는데 아직도 뷰티풀수프랑 셀레니움만 사용하시나요?
이젠 trafilatura(트라필라투라)를 사용하게 될 겁니다.
트라필라투라를 사용하면 코드 세네줄만으로도 웹페이지 본문을 아주 쉽게 수집할 수 있고 json, xml 등 원하는 형식으로 출력까지 가능합니다.
뿐만 아니라 rss 피드 url이 있으면 웹페이지 수십 개 본문 스크랩도 코드 몇 줄로 쉽게 해결할 수 있습니다.
#python #trafilatura #웹크롤링
📩 광고, 비즈니스 문의: kimflstudio@gmail.com
강의 내용에 대한 질문은 댓글을 이용해 주세요.
==========
🌐웹 크롤링 강의: inf.run/jX3V
🤖자동화 강의: bit.ly/48NBwkW
💻회원 가입: / @kimfl
➡️프로그래머 김플 스튜디오 : / @kimfl
==========
31 мар 2024