GIS/Spatial Analysis7 K-means Clustering, K-평균 군집화 개요거리와 특성을 기반으로 K개의 군집을 만드는 비지도학습 알고리즘 분석 순서군집 개수(K) 설정 > 초기 중심점 설정 > 군집 할당 > 중심점 재설정 > 군집 재할당중심점 이동하지 않을 때까지 중심점 재설정 및 군집 재할당 반복중심점 재설정 시, 중심점은 그 군집의 데이터들 가운데(무게 중심)에 위치한 지점으로 재설정군집 개수 설정에는 Elbow Method 활용 가능초기 중심 설정에는 K-menas++ 활용 가능 단점초기 K 값과 중심점을 임의로 정해야 하며, 결과 값이 달라질 수 있cluster의 모양이 원형이 아닐 때는 정확한 결과를 도출하지 못함 참고 자료https://velog.io/@jhlee508/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-K-%ED%8F%89%E.. 2024. 11. 4. Gravity model for spatial decay effect 수식거리 조락 효과는 아래 식에서 β를 알아내려고 하는 것K는 신경 안 써도 됨 ㄹPi와 Pj는 i와 j의 "conceptual sizes" (상대적 중요성) e.g. 여행 흐름, immigration, 무역, 통화량 등Dij는 i와 j 사이의 거리Iij는 i와 j 사이의 상호작용β 값이 크면 거리 조락 효과가 크게 나타나는 것. (가까울 수록 더 많이 연결되어 있음) 예시Yuan, Y., Liu, Y., & Wei, G. (2017). Exploring inter-country connection in mass media: A case study of China. Computers, Environment and Urban S.. 2024. 11. 4. Density-Based Spatial Clustering of Applications with Noise (DBSCAN) 밀도 기반 클러스터링 개요Density-Based Spatial Clustering of Applications with Noise (DBSCAN)은 Ester et al. (1996)이 제안한 밀도 기반 클러스터링 알고리즘이다. 주어진 point data에서 Eps, MinPts 두가지 파라미터를 활용하여 임의 모양과 수의 클러스터를 찾는다. Eps는 반경, MinPts는 반경 내 이웃의 최소 수를 의미한다. 한 point에서 지정한 Eps 안에 MinPts 이상의 point가 있으면 클러스터를 형성한다. 단점- 클러스터링 전에 파라미터를 직접 지정해야 한다.- 시계열 데이터를 처리할 수 없다. ReferenceZhuang, S., & Chen, C. (2021, July). Aerial battlefield targets.. 2024. 10. 24. Dynamic Time Warping (DTW) with trajectory data 시계열 분석 DTW개요- 두 개의 입력 시계열 간의 거리 메트릭을 생성한다.- 데이터를 벡터로 변환하고 벡터 공간에서 해당 지점 간의 유클리드 거리를 계산하여 계산하여 두 시계열의 유사성 계산한다.- 첫 번째와 마지막 포인트를 포함한 모든 포인트가 각각 연결되어야 한다. 계산 방법DTW 그리드를 만든다.각 그리드 내부에 두 시계열의 거리 측정값(e.g. absolute differences)이 들어간다.total distance를 최소화하는 그리드를 통과하는 경로를 찾는다. 수식P={p1,p2,...,pm}, Q={q1,q2,...,qm} 이라는 두 시계열 데이터가 있을 때, P와 Q 사이의 DTW 거리는 다음과 같다.$$D(P, Q) = dist(p_1, q_1) + \m.. 2024. 9. 28. Moran's I와 Getis-Ord Gi*의 차이점 Moran's I와 Getis-Ord Gi는 모두 공간통계에서 사용되는 지수로, 공간 패턴을 분석하는 도구이다. 하지만 각각의 개념과 분석 목적에는 차이가 있다. Moran's ISpatial Autocorrelation 분석Moran's I는 공간적 이질성을 측정하는 지수다. 이 지수는 각 지점의 값과 주변 지점들 값 사이의 상관관계를 계산하여 공간 패턴의 유사성 또는 이질성을 파악한다. Moran's I는 -1에서 1까지의 값을 가지며, 양수일 경우 양의 공간 자기상관성(동질성)을 나타내고 음수일 경우 음의 공간 자기상관성(이질성)을 나타낸다. Moran's I는 특정 변수의 공간적 집중 현상, 공간 클러스터링, 공간 자기상관성 등을 분석하는데 사용된다. 보통 LH(low-high), HL(high-.. 2023. 7. 12. Two-Step Floating Catchment Area, 2SFCA 접근성 분석 Two-Step Floating Catchment Area(2SFCA)2SFCA 방법론은 Luo and Wang(2003)에 의해 제안되었으며, 수요와 공급 그리고 거리를 활용하여 두 단계의 계산을 통해 접근성을 계산한다. Step 1.첫번째 단계에서는 공급의 위치를 기준으로 일정 기준 거리 내의 수요 인구를 합하고, 공급 대 수요 합의 비율을 계산한다. 이 값을 인구 대비 공급자 비율(Provider to Population Ratio, PPR)이라고 칭한다. 이때 기준 거리를 의미하는 d0는 연구자가 주관적으로 설정하며, 실제 도로망을 활용하면 연구의 정확성이 높아질 수 있다. Sj는 j 위치의 가용 의료 시설 수, Pk는 기준 거리 내에 있는 k 위치의 인구 밀도, $.. 2023. 3. 27. Moran's I, 공간적 자기 상관 정량화 1. 공간적 자기 상관성 공간적 자기 상관성은 지리적 인접성(geographical proximity)을 전제로, 하나가 변하면 다른 하나도 변하는 관계의 정도를 의미한다. 이 변화는 같은 방향(양의 자기 상관) 또는 반대 방향(음의 자기 상관)일 수 있다. 공간적 자기 상관성은 인과관계를 암시하지만 확립하지는 않는다.공간적 자기 상관성을 정량적으로 측정하기 위하여 다양한 지수들이 제안되었으나, 가장 보편적으로 활용되는 통계지수 중 하나는 Moran’s I 통계량(이후 I 통계량)이다. 2. Moran's I I 통계량을 계산하기 위해서는 네 단계의 절차가 필요하다.첫째, 분석대상지를 일정한 형태 및 크기의 공간분석단위(spatial analysis unit)로 분할한다.둘째, 지리적 공.. 2023. 2. 21. 이전 1 다음 728x90 반응형