분석 2

Pycluster

Pycluster 예제 data 파일에서부터 사용법을 기록한다. data 파일은 Row wise로 되어 있다고 가정한다. Data 파일 예제 (Language : text) Node1 1 2 3 4 Node2 2 3 1 2 Node3 1 1 1 1 이 데이터를 가지고 Hierarchical Clustering 하는 방법은 test.py (Language : python) from Pycluster import * import sys handle = open(sys.argv[1]) record = read(handle) genetree = record.treecluster(method='a') genetree.scale() cclass = genetree.cut(5) python test.py data.t..

Passion/Python 2009.02.25

Cluster Analysis (군집 분석)

1. 개념 Cluster Analysis는 개체 및 속성을 의미있는 집단으로 그룹핑하고 분석하는 방법이다. 개체는 동질적인 집단으로 또는 배타적인 집단으로 분류될 수 있다. 군집분석이 판별분석과 다른 점은 분류는 이미 알려진 그룹의 구조와 수대로 나누어 각 그룹에 새로운 개체를 할당하는 것이 목적이지만, 군집분석은 그룹의 수나 구조가 가정되어 있지 않고 유사성(similarity) 또는 근접성(proximity)에 근거한 그룹화이다. 군집분석의 예로는 환자들의 증후들을 이용하여 몇 개의 동질적인 집단으로 나누어서 이들이 가지고 있는 공통된 특성들을 조사하거나 성격에 따른 개인의 분류, 소비자행동의 유사성을 바탕으로 시장세분화를 하는 데 이용될 수 있다. 2. 군집화하는 방법 군집분석은 특성들의 유사성, ..

Passion/Algorithm 2009.01.21