본문 바로가기

Data Science/Statistics

(2)
가능도(Likelihood) 이번 포스팅에서는 "가능도(Likelihood)" 에 대해서 정리해보려 한다. 가능도(Likelihood)의 정확한 개념과 더불어, "가능도"와 "확률"의 차이점에 대해 한 번 정리를 해보려 한다. 우선 확률(Probability)과 가능도(Likelihood)의 정의를 살펴보면 다음과 같다. 확률: 주어진 확률분포에서 해당 관측값이 나올 확률 가능도: 주어진 관측값이 특정 확률분포로부터 나왔을 확률 (= 연속확률밀도함수의 y 값) 음.. 이렇게 한 줄로 된 정의만 보면 무슨 말인지 통 이해가 안 될 것이다... (위 정의만으로 이해가 된다면 그 분은 아마도 통계학 전공자일 것이다) 자, 그러면 "확률(Probability)"의 개념부터 천천히 설명해 보도록 하겠다. "확률"이란 주어진 확률분포가 있을 ..
차원의 저주(The Curse of Dimensionality) 오늘은 "차원의 저주(The Curse of Dimensionality)"에 대해 정리해보는 시간을 갖도록 하겠다. 그래서 차원의 저주가 뭔데?! 차원의 저주를 대표할 수 있는 하나의 사자성어가 있는데, 바로 "과유불급"이다. 결론부터 말하면 차원의 저주란 데이터 용량이 커질수록 불필요한 샘플이 많아지는 현상을 뜻한다. (참고로 "차원의 증가 = 변수의 개수 증가"라고 이해를 하면 쉽다) 차원의 저주와 관련하여 구글에 검색해보면 가장 상위에 뜨는 블로그가 하나 있는데, 이 블로그의 관리자 분께서 정말 이해하기 쉽도록 설명을 해두셨다. 그리고 K-NN 방법이 왜 차원의 저주 문제에 치명적인지도 명확하게 설명이 되어 있으니, 아래의 링크를 참고하면 좋을 것 같다. https://datapedia.tistor..