dbscan 예제

  • 0

dbscan 예제

함수 plot.dbscan()은 코어 점(예: 시드 점) 및 테두리 점에 대해 서로 다른 점 기호를 사용합니다. 검은색 점은 이상값에 해당합니다. 클러스터 구성을 변경하기 위해 eps 및 MinPts로 재생할 수 있습니다. 이 예제에서는 이러한 유형의 데이터를 인위적으로 생성합니다. 책의 저자가 제공한 아래 코드를 통해(클러스터 수의 사소한 변경과 함께) k-means가 올바르게 처리할 수 없는 일부 데이터를 생성할 수 있습니다. 구현속도가 훨씬 빠르며 함수 fpc:dbscan()보다 더 큰 데이터 집합에서 작업할 수 있습니다. DBSCAN을 실용으로 생각해 봅시다. 전자 상거래가 있고 고객에게 관련 제품을 추천하여 판매를 개선하려고 한다고 가정해 보겠습니다. 우리는 고객이 무엇을 찾고 있는지 정확히 알지 못하지만 특정 고객에게 관련 제품을 예측하고 추천 할 수있는 데이터 세트를 기반으로합니다.

DBSCAN을 전자 상거래 데이터베이스 기반의 데이터 집합에 적용하고 사용자가 구입한 제품을 기반으로 클러스터를 찾을 수 있습니다. 이 클러스터를 사용하여 고객 A가 펜 1개, 책 1개, 가위 1개, 고객 B가 1권의 가위를 구입한 경우와 같은 고객 간의 유사점을 확인할 수 있으며, 고객 B에게 펜 1개도 추천할 수 있습니다. 이것은 DBSCAN의 사용의 작은 예일 뿐이지만 여러 영역에서 많은 응용 프로그램에서 사용할 수 있습니다. 이것은 두 매개 변수의 선택에 따라 클러스터링이 어떻게 변경되는지에 대한 예입니다: fpc::dbscan() 함수의 결과는 다음과 같이 표시될 수 있습니다: 기본적으로 함수가 일부 상수 λ보다 크거나 같은 경우입니다. f(x) = x2 및 λ = 4의 예는, λ-상층 레벨 f 세트(-∞,-2]U[2,∞)가 될 것이다. 이 게시물에서 나는 안드레아스 C. 뮐러와 사라 귀도에 의해 파이썬과 기계 학습 소개에서 몇 가지 콘텐츠를 가지고 k-평균 클러스터링이 보이지 않을 때 DBSCAN 클러스터링의 강점 중 일부를 보여주기 위해 제공 된 예제 중 하나에 간단히 확장하고 싶습니다 데이터 모양을 잘 처리할 수 있습니다. 이 주제를 확장하려면 168페이지에서 시작하여 3장의 전체 내용을 읽는 것이 좋습니다. 알고리즘의 작동을 설명 할 때 책을 인용 할 것입니다. fpc::dbscan() 및 dbscan::dbscan()를 사용하여 DBSCAN을 계산합니다. 2개의 패키지가 설치되어 있는지 확인: 테두리 포인트는 핵심 지점이 아닌 클러스터의 포인트입니다.


Recent Post

큐 스택 예제

마크업 예제

리눅스 qt 예제

Categories

  • No categories
Leave us a message if you have any question...
Powered by
Website is Protected by WordPress Protection from eDarpan.com.