본문 바로가기

Python

(29)
[Ch 4. 셀프 주유소는 정말 저렴할까] from "파이썬으로 데이터 주무르기(민형기 지음)" 4장에서는 서울시를 대상으로 셀프 주유소의 '휘발유' 가격이 일반 주유소에 비해 더 저렴한지에 대한 분석을 수행하였다. Selenium 을 사용하여 인터넷에서 서울시 구별 주유소 정보를 가져왔다. 이 때, chromedriver의 버전이 내 노트북과 맞지 않아서 다시 재 다운로드 한 뒤에 분석을 수행하였다. ※ 본인의 노트북 Chrome 버전에 맞는 chromedriver를 설치해야 한다!! 먼저 인터넷으로부터 가져온 정보들을 분석하기 좋은 형태로 가공해 준 다음, boxplot 및 지도 시각화를 통해 "셀프 주유소는 정말 저렴할까?"에 대한 확인을 해보았다. 시각화에 대한 결과와 코드는 아래의 링크에서 확인할 수 있다 ★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gis..
[Ch 3-2. 네이버 영화 평점 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" 이번 챕터에서는 "네이버 영화 평점 분석"이라는 주제로 분석을 수행해보았다. 마찬가지로 인터넷에 있는 정보를 크롤링해서 내가 원하는 형태로 가공해 준 다음, 날짜별 영화 평점의 변화를 시각화하는 작업까지 수행해주었다. 개인적으로 이번 주제는 지난 챕터 주제였던 "시카고 샌드위치 맛집 분석"보다 더 흥미로웠다. 아마 "영화"라는 주제가 모두에게 흥미로운 주제일 것이라고 생각한다. 관심이 그만큼 많기 때문에, 분석을 좀 더 집중해서 수행해 볼 수 있었던 것 같다. 최종 시각화를 할 때, 내가 평소 관심 가졌던 5개의 영화(택시운전사, 47 미터, 스파이더맨: 홈커밍, 라라랜드, 500일의 썸머)의 날짜별 평점 변화를 확인해보았다. 이처럼 내가 관심 가는 주제를 선택해서 분석해보면 코딩 실력도 많이 늘고, 흥..
[Ch 3-1. 시카고 샌드위치 맛집 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" 오늘은 "시카고 샌드위치 맛집 분석"이라는 주제로 분석을 수행해보았다. 이번 챕터에서는 1, 2장과는 다르게 BeautifulSoup을 사용하여 "웹 스크래핑(크롤링)"을 통해 인터넷으로부터 직접 데이터를 긁어오는(?) 식으로 진행되었다. "웹 스크래핑". 일명 "크롤링"이라고도 불리는 이 작업을 수행해주면서, HTML에 대한 지식이 절실함을 느꼈다. 유트브를 보면서 HTML에 대한 기본 지식 공부도 시작해야겠다... ★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/3d5f24967bacbeeefb5330a4dae365f9 Jupyter Notebook Viewer 샌드위치 맛집 리스트 50개 각각에 대해서 절대경로로 잡힌 url은 그대로 ..
[Ch 2. 서울시 범죄 현황 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" 오늘은 "서울시 범죄 현황 분석"이라는 주제로 직접 코드를 따라쳐보며 분석을 수행해보았다. 이번 분석 목적은 뉴스 기사에 나온 "강남 3구가 과연 범죄로부터 안전할까?"라는 가설을 확인해보는 것이었다. 하지만 분석을 해 본 결과, 강남 3구가 범죄로부터 그렇게 안전하지 않다는 사실을 확인했다. (뉴스 기사에서는 분명 안전하다고 했는데...?) 결과를 직접 시각화해서 눈으로 확인할 때마다, Python에 이렇게 좋은 시각화 모듈 및 라이브러리들이 있구나라는 것을 새삼 다시 깨닫는다. ★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/f7664f8666cee542ac4e3ef62b6e0b7b Jupyter Notebook Viewer '강간 발생..
[알고리즘_Programmers] 6주차 문제 및 풀이 (총 5 문제) ※ 6주차 문제들... 할많하않 ^^;; 이 문제는 결국 풀지 못하고, 구글 신의 도움을 받아 코드를 참고하였다... 위 풀이에서는 짝수는 어차피 소수가 될 수 없으니, n 미만의 자연수들 중에서 홀수들만 뽑아내서 코드의 효율성을 높여주었다. 그리고 "에라토스테네스의 체"라는 개념을 사용하여 문제를 풀면 된다...(이름부터 정이 안가네 ㅎ) "에라토스테네스의 체"라는 개념을 이해하기 위해, 아래 링크를 걸어놓은 위키피디아 사이트를 참고하였다. ko.wikipedia.org/wiki/%EC%97%90%EB%9D%BC%ED%86%A0%EC%8A%A4%ED%85%8C%EB%84%A4%EC%8A%A4%EC%9D%98_%EC%B2%B4 에라토스테네스의 체 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의..
[Ch 1. 서울시 구별 CCTV 현황 분석] from "파이썬으로 데이터 주무르기(민형기 지음)" 오늘부터 "파이썬으로 데이터 주무르기(민형기 지음)" 교재에 있는 코드들을 하나하나 따라쳐보면서, 직접 데이터 분석을 해보기 시작했다. 파이썬으로 코드 구현을 직접 해보면서, 데이터 탐색 과정이라고 불리우는 "EDA 과정"에 대해 많은 것을 배울 수 있을 것 같다. 오늘 분석해 본 주제는 "서울시 구별 CCTV 현황 분석"이다. 서울시의 구별로 CCTV 개수를 파악하여 시각화하는 과정까지 수행해보았다. 처음이라 그런지 굉장히 재밌고 흥미로웠다 ^^ 이런 마음가짐이 쭉 이어지길...!! ★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/53e41c395f2b19b360bd3ccb38928cd8 Jupyter Notebook Viewer 결과를 ..
[Pandas 기초] 이번 포스팅에서는 파이썬에서 굉장히 중요한 Pandas에 대해서 공부한 내용을 올리겠다. 아래 링크에 있는 내용들만 완벽하게 숙지해도, 데이터 전처리를 수행함에 있어서 큰 문제는 없을 듯 싶다. 따라서 공부하며 정리해놓은 내용들은 머리 속에 확실하게 각인시켜 놓을 것!! ★ 코드 및 설명 링크 : https://nbviewer.jupyter.org/gist/HyeongWookKim/2cc59fba5701108f96e044c336b586e1 Jupyter Notebook Viewer 주피터에서 'df2.'를 입력하고 탭을 누르면, dtypes 외에 다른 속성들을 확인할 수 있다 nbviewer.jupyter.org
[알고리즘_Programmers] 5주차 문제 및 풀이 (총 5 문제) ※ 5주차부터는 문제도 길어지고 난이도도 좀 높아졌다. 우선 주어진 x 가 문자열이 아니므로, x 를 문자열로 변경시킨 후에 리스트로 변환해주어야 한다. 이 과정만 문제 없이 구현한다면 정말 간단한 문제이다. ^^ 위에서 내가 한 작업을 한 줄로 요약해줄 수도 있넹 ㅎㅎㅎ.. 이 문제도 큰 무리 없이 풀었다. 주어진 arr 리스트의 각 요소 값들을 divisor로 나눠보면서, 나누어 떨어지는 값들만 result 리스트에 추가하고 sort( )로 정렬해준다. 마찬가지로 내가 위에서 해준 작업들을 list comprehension을 사용하면 한 줄로 구현이 가능하다. 근데 난 왜 이렇게 좋은걸 안 써먹는거지.... 쓰려는 노력이라도 좀 하자!! ^^;; --> 좀 많이 어려웠음... 우선 본격적인 풀이에 앞..