Post

[데이터 시각화 교과서] 15-16장

⟪Fundamentals of Data Visualization⟫, Claus O. Wilke

[데이터 시각화 교과서] 15-16장

Fundamentals of Data Visualization

15 Visualizing geospatial data


15.1 Projections

  • 지도 제작이 어려운 이유는, 둥근 지구를 평면에 나타내야 하기 때문에 투영 작업에서 왜곡이 존재
  • 정각 도법(conformal projection): 각도를 유지하는 투영 방식
    • 메르카토르 도법: 16세기 항해를 위해 고안. 지구를 원기둥에 투영
  • 정적 도법(equal-area projection): 면적을 유지하는 방식
    • 구드 호몰로사인 도법
    • 알베르스 정적 도법

      15.2 Layers

  • 지리 공간 데이터를 알맞은 배경에 나타내기 위해 각기 다른 종류의 정보가 표시된 레이어 여러 개로 이루어진 지도를 그리는 것이 효과적
    • 언덕, 계곡, 물길을 보여주는 지형 레이어, 도로망 레이어, 풍력발전기 각각의 위치를 표시 한 레이어 등

      15.3 Choropleth mapping

  • 단계구분도: 여러 지역에 걸친 정량 정보를 나타낼 때, 보여주려는 데이터 차원을 기준으로 지역별로 색을 다르게 칠한 지도
    • 색으로 밀도를 표현할 때 가장 효과적
    • 실무에서는 밀도가 아닌 정량 데이터에 따라 색을 넣은 단계구분도도 흔히 접함

15.4 Cartograms

  • 카토그램, 왜상통계지도: 인구 밀도를 반영해 주들의 모양을 변형해보는 등 변형한 지도
  • 카토그램 히트맵: 각 주를 정사각형으로 표현하는 등
  • 주마다 따로따로 도표를 그린 다음 도표들을 해당 주의 위치에 배치하는 등

16 Visualizing uncertainty


16.1 Framing probabilities as frequencies

  • 이산적 결과 시각화: 잠재적 결과를 구체적으로 표현한 것
  • 빈도 프레이밍: 확률을 빈도로 시각화하는 작업
  • 확률 분포: 실현될 가능성이 있는 모든 결과와 각 결과가 발생할 가능성을 표시한 것
  • 분위수 점 도표: 이산적 결과의 속성과 연속형 분포를 결합

16.2 Visualizing the uncertainty of point estimates

  • 표준편차와 표준오차
  • 표본을 통해 모수 추정과 불확실성 계산: Bayesian, frequentist
  • 단계별 오차 막대
  • 결정론적 해석 오류

  • 유의성: 신뢰도가 어느 정도 수준을 넘어서 관측값들 사이의 차이가 무작위 표집에서 비롯되었다는 추정을 무시할 수 있을 때 유의한 차이가 있다고 말함
  • 끝눈금이 있는 단계별 오차 막대, 끝눈금이 없는 단계별 오차 막대, 끝눈금이 있는 단일 구간 오차 막대, 끝눈금이 없는 단일 구간 오차 막대, 신뢰 스트립, 신뢰 분포

  • 빈도주의: 신뢰 구간을 통해 불확실성 가늠 / 베이지안: 사후 분포와 신용 구간을 계산
    • 베이지안 신용 구간이 보여주는 것은 실제 모수 값, 빈도주의 신뢰 구간이 보여주는 것은 귀무가설
  • 감은 눈 모양 도표, 눈 모양 도표

    16.3 Visualizing the uncertainty of curve fits

  • 추세선에서는 보통 신뢰 대역을 그려 불확실성 시각화
  • 단계별 신뢰 대역

    16.4 Hypothetical outcome plots

  • 가설적 결과 도표: 가능도는 같지만 모양은 서로 다른 도표 몇 개를 돌아가며 보여주는 애니메이션을 통해 불확실성을 표현하는 시각화 방식
This post is licensed under CC BY 4.0 by the author.