오늘은 "시카고 샌드위치 맛집 분석"이라는 주제로 분석을 수행해보았다.
이번 챕터에서는 1, 2장과는 다르게 BeautifulSoup을 사용하여 "웹 스크래핑(크롤링)"을 통해 인터넷으로부터 직접 데이터를 긁어오는(?) 식으로 진행되었다.
"웹 스크래핑". 일명 "크롤링"이라고도 불리는 이 작업을 수행해주면서, HTML에 대한 지식이 절실함을 느꼈다.
유트브를 보면서 HTML에 대한 기본 지식 공부도 시작해야겠다...
★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/3d5f24967bacbeeefb5330a4dae365f9
Jupyter Notebook Viewer
샌드위치 맛집 리스트 50개 각각에 대해서 절대경로로 잡힌 url은 그대로 두고, 상대경로로 잡힌 url은 절대경로로 변경! urllib 에 있는 urljoin 이라는 명령을 사용
nbviewer.jupyter.org
★ 참고 자료
- 파이썬으로 데이터 주무르기 교재
'Python' 카테고리의 다른 글
[Ch 4. 셀프 주유소는 정말 저렴할까] from "파이썬으로 데이터 주무르기(민형기 지음)" (0) | 2020.06.01 |
---|---|
[Ch 3-2. 네이버 영화 평점 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" (0) | 2020.05.28 |
[Ch 2. 서울시 범죄 현황 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" (0) | 2020.05.26 |
[알고리즘_Programmers] 6주차 문제 및 풀이 (총 5 문제) (1) | 2020.05.24 |
[Ch 1. 서울시 구별 CCTV 현황 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" (0) | 2020.05.24 |