Python

[Ch 3-1. 시카고 샌드위치 맛집 분석] from "파이썬으로 데이터 주무르기(민형기 지음)"

Brian_93 2020. 5. 27. 20:49

오늘은 "시카고 샌드위치 맛집 분석"이라는 주제로 분석을 수행해보았다.

 

이번 챕터에서는 1, 2장과는 다르게 BeautifulSoup을 사용하여 "웹 스크래핑(크롤링)"을 통해 인터넷으로부터 직접 데이터를 긁어오는(?) 식으로 진행되었다.

 

"웹 스크래핑". 일명 "크롤링"이라고도 불리는 이 작업을 수행해주면서, HTML에 대한 지식이 절실함을 느꼈다.

 

유트브를 보면서 HTML에 대한 기본 지식 공부도 시작해야겠다...

 

 

★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/3d5f24967bacbeeefb5330a4dae365f9

 

Jupyter Notebook Viewer

샌드위치 맛집 리스트 50개 각각에 대해서 절대경로로 잡힌 url은 그대로 두고, 상대경로로 잡힌 url은 절대경로로 변경! urllib 에 있는 urljoin 이라는 명령을 사용

nbviewer.jupyter.org

 

 

★ 참고 자료

- 파이썬으로 데이터 주무르기 교재