Post

[데이터 시각화 교과서] 10-11장

⟪Fundamentals of Data Visualization⟫, Claus O. Wilke

[데이터 시각화 교과서] 10-11장

Fundamentals of Data Visualization

10 Visualizing proportions


10.1 A case for pie charts

  • 파이 차트: 데이터 전체를 뜻하는 원을 부분 데이터가 차지하는 비중에 비례하는 크기의 조각들로 분할
  • 누적 막대 도표: 파이 차트와 동일한 방법이되, 직사각형. 막대를 가로로 쌓는 경우 각 막대가 전체에서 차지하는 비중을 눈으로 확인하기 어렵다
  • 데이터 시각화 전문가에 따라 병렬 또는 누적 막대를 선호하는 경우가 많다
  • 파이 차트는 단순한 분수를 강조할 때 효과적이며 데이터셋이 적을 때 유용
  • 누적 막대는 여러 조건이나 시간의 흐름에 따른 추이를 나란히 놓고 비교할 때 유용
  • 병렬 막대는 각 조각을 따로 놓고 바로 비교하기에 유용

10.2 A case for side-by-side bars

  • 파이 차트의 경우 엇비슷한 데이터를 다룰 때 모호 ⟶ 누적 막대로 표현하면 내용이 더 선명하게 보임
  • 누적 막대를 연속으로 배열하는 것은 중간 막대의 시작점이 달라지기 때문에 연도 등 비교해야 하는 자료에서는 부적절 ⟶ 병렬 막대가 알맞음

10.3 A case for stacked bars and stacked densities

  • 누적 막대를 연속으로 배열할 때 막대가 누 개씩만 누적되어 있다면, 비율 변화 시각화에 알맞음
  • 누적 밀도 도표의 한계점은 전체 대비 부분 비율을 표현하기 어렵다는 점

10.4 Visualizing proportions separately as parts of the total

  • 병렬 막대와 누적 막대의 한계를 극복하기 위해서, 부분별로 도표를 따로 그리고 해당 부분이 전체에서 차지하는 비중을 나타내는 도표들을 개별적으로 그림
  • 같은 데이터셋을 부분 밀도 도표로 나타내면 의미가 명료하게 보이지만, 특정 시점에 해당하는 비율을 파악하기 힘들다는 단점 존재 ⟶ 절대적인 숫자가 아닌 비율을 y축에 표시하면 해결

11 Visualizing nested proportions


  • 내포 비율(nested proportion): 추가되는 각 범주형 변수로 인해 기존 비율에 내포되는 데이터가 더 세분화 된 것의 비율

11.1 Nested proportions gone wrong

  • 비율의 합이 100%를 넘는 경우

11.2 Mosaic plots and treemaps

  • 모자이크 도표는 색을 칠한 면적마다 가로 세로 길이가 다름
    • 각 변수가 전체에서 차지하는 비율에 맞게 x축을 세분
    • x축의 관련 범주 위치에서 y축을 변수마다 전체에서 차지하는 비율에 맞게 세분
    • 직사각형 각각의 면적은 데이터 값에 비례
  • 트리맵은 큰 직사각형 안에 작은 직사각형을 반복적으로 끼워 넣음
    • 직사각형 수를 늘리게 되면 복잡하고 혼란
    • 트리맵은 어떤 비율을 설명함에 있어 여러 범주형 변수의 조합이 중요한 의미를 가지지 않을 때 효과적
  • 모자이크 도표와 트리맵 모두 조건에 따른 데이터의 크기 차이를 비교하기 힘듦

11.3 Nested pies

  • 파이 차트 응용
  • 내부와 외부에 원을 그리는 파이 차트
    • 데이터들이 2가지 변수를 모두 가지고 있다는 사실이 드러나지 않음
  • 변수 하나에 따른 비율을 나타내는 조각들로 파이 세분화, 이 조각들을 다른 변수에 따라 다시 세분화
    • 트리맵과 비교하여 불필요한 여백이 생김
    • 파이차트는 레이블을 밖에 적지만, 트리맵과 같이 안쪽에 적는 것이 강조 됨
    • 일부 파이 조각이 너무 작음

11.4 Parallel sets

  • 평행 집합 도표는 범주형 변수가 둘 이상인 비율 데이터를 시각화할 때 유용
  • 각 범주형 변수에 따라 어떻게 분류되는지 보여주고, 음영띠를 넣어 하위 그룹들이 어떻게 관련되어 있는지 표현
  • 색을 칠하는 기준은왼쪽에 두는 것이 좋으며, 집합들의 순서에 따라 각 띠의 교차점을 줄일 수 있음
This post is licensed under CC BY 4.0 by the author.