[데이터 시각화 교과서] 15-16장
⟪Fundamentals of Data Visualization⟫, Claus O. Wilke
[데이터 시각화 교과서] 15-16장
Fundamentals of Data Visualization
15 Visualizing geospatial data
15.1 Projections
- 지도 제작이 어려운 이유는, 둥근 지구를 평면에 나타내야 하기 때문에 투영 작업에서 왜곡이 존재
- 정각 도법(conformal projection): 각도를 유지하는 투영 방식
- 메르카토르 도법: 16세기 항해를 위해 고안. 지구를 원기둥에 투영
- 정적 도법(equal-area projection): 면적을 유지하는 방식
- 지리 공간 데이터를 알맞은 배경에 나타내기 위해 각기 다른 종류의 정보가 표시된 레이어 여러 개로 이루어진 지도를 그리는 것이 효과적
- 단계구분도: 여러 지역에 걸친 정량 정보를 나타낼 때, 보여주려는 데이터 차원을 기준으로 지역별로 색을 다르게 칠한 지도
- 색으로 밀도를 표현할 때 가장 효과적
- 실무에서는 밀도가 아닌 정량 데이터에 따라 색을 넣은 단계구분도도 흔히 접함
15.4 Cartograms
- 카토그램, 왜상통계지도: 인구 밀도를 반영해 주들의 모양을 변형해보는 등 변형한 지도
- 카토그램 히트맵: 각 주를 정사각형으로 표현하는 등
- 주마다 따로따로 도표를 그린 다음 도표들을 해당 주의 위치에 배치하는 등
16 Visualizing uncertainty
16.1 Framing probabilities as frequencies
- 이산적 결과 시각화: 잠재적 결과를 구체적으로 표현한 것
- 빈도 프레이밍: 확률을 빈도로 시각화하는 작업
- 확률 분포: 실현될 가능성이 있는 모든 결과와 각 결과가 발생할 가능성을 표시한 것
- 분위수 점 도표: 이산적 결과의 속성과 연속형 분포를 결합
16.2 Visualizing the uncertainty of point estimates
- 표준편차와 표준오차
- 표본을 통해 모수 추정과 불확실성 계산: Bayesian, frequentist
- 단계별 오차 막대
결정론적 해석 오류
- 유의성: 신뢰도가 어느 정도 수준을 넘어서 관측값들 사이의 차이가 무작위 표집에서 비롯되었다는 추정을 무시할 수 있을 때 유의한 차이가 있다고 말함
끝눈금이 있는 단계별 오차 막대, 끝눈금이 없는 단계별 오차 막대, 끝눈금이 있는 단일 구간 오차 막대, 끝눈금이 없는 단일 구간 오차 막대, 신뢰 스트립, 신뢰 분포
- 빈도주의: 신뢰 구간을 통해 불확실성 가늠 / 베이지안: 사후 분포와 신용 구간을 계산
- 베이지안 신용 구간이 보여주는 것은 실제 모수 값, 빈도주의 신뢰 구간이 보여주는 것은 귀무가설
- 감은 눈 모양 도표, 눈 모양 도표
16.3 Visualizing the uncertainty of curve fits
- 추세선에서는 보통 신뢰 대역을 그려 불확실성 시각화
- 단계별 신뢰 대역
16.4 Hypothetical outcome plots
- 가설적 결과 도표: 가능도는 같지만 모양은 서로 다른 도표 몇 개를 돌아가며 보여주는 애니메이션을 통해 불확실성을 표현하는 시각화 방식
This post is licensed under CC BY 4.0 by the author.