본문 바로가기

Python

[Ch 3-1. 시카고 샌드위치 맛집 분석] from "파이썬으로 데이터 주무르기(민형기 지음)"

오늘은 "시카고 샌드위치 맛집 분석"이라는 주제로 분석을 수행해보았다.

 

이번 챕터에서는 1, 2장과는 다르게 BeautifulSoup을 사용하여 "웹 스크래핑(크롤링)"을 통해 인터넷으로부터 직접 데이터를 긁어오는(?) 식으로 진행되었다.

 

"웹 스크래핑". 일명 "크롤링"이라고도 불리는 이 작업을 수행해주면서, HTML에 대한 지식이 절실함을 느꼈다.

 

유트브를 보면서 HTML에 대한 기본 지식 공부도 시작해야겠다...

 

 

★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/3d5f24967bacbeeefb5330a4dae365f9

 

Jupyter Notebook Viewer

샌드위치 맛집 리스트 50개 각각에 대해서 절대경로로 잡힌 url은 그대로 두고, 상대경로로 잡힌 url은 절대경로로 변경! urllib 에 있는 urljoin 이라는 명령을 사용

nbviewer.jupyter.org

 

 

★ 참고 자료

- 파이썬으로 데이터 주무르기 교재