[데이터 시각화 교과서] 20-21장
⟪Fundamentals of Data Visualization⟫, Claus O. Wilke
[데이터 시각화 교과서] 20-21장
Fundamentals of Data Visualization
20 Redundant coding
- 불필요한 기호화: 핵심 정보를 색으로 표시하지 않고 도표를 보기 좋게 꾸미는 용도로만 색을 사용하는 것.
20.1 Designing legends with redundant coding
- 산점도를 그릴 때 대비되지 않는 색을 사용하면 파란색과 노란색에 대한 색약이 있는 사람에게는 파란색과 녹색이 비슷하게 보이는 등 구분하기 힘듦.
- 산점도 상에서 비슷한 위치에 있는 종류는 대비되는 색을 넣고, 멀리 떨어져 있는 경우는 비슷한 색을 넣어도 괜찮다.
- 색 뿐만 아니라 도형을 사용해 모양도 서로 다르게 표현.
- 선 도표에서 범례를 나타낼 때 선이 나열된 순서와 범례의 순서를 같게 함. 범례와 데이터의 순서를 맞춤.
20.2 Designing figures without legends
- 가능하면 범례를 넣을 필요 없도록 도표를 디자인: 레이블 달기
- 선 도표의 경우 범례 대신 선 끝부분에 레이블을 달 수 있음
- 산점도의 경우 범례 대신 곡선으로 묶어 레이블을 달 수 있음
- 밀도 도표의 경우 각 밀도 추정 선에 레이블을 달 수 있음
- 여러 시각적 속성으로 기호화할 때 각 시각적 속성마다 범례를 만들기 보단, 범례 계열의 시각 요소를 만들어 정보를 함께 전달하는 것이 나음
- 산점도 주위에 밀도 추정 선을 가장자리에 함께 넣는 것
- 융기선 도표 밑에 x축을 따라 색상 막대를 넣어 색으로 변환하는 스케일로 시각화하는 것
21 Multi-panel figures
- 다중패널 도표: 데이터셋이 방대하고 복잡할 때, 데이터셋을 구성하는 하위 데이터셋을 따로 시각화하고, 이렇게 그린 패널 여러 개를 합친 것
- 소형 다중패널(small multiples): 정규 격자에 패널을 여러 개 올린 도표
- 복합형 도표(compound figures): 서로 별개인 도표 패널들을 임의로 배치
21.1 Small multiples
- 하나 이상의 변수를 기준으로 데이터를 분할하고, 분할한 데이터 조각을 모두 시각화 해 완성된 개별 도표들을 격자에 배열
- 면 분할(faceting) 기법: 지지플롯2 라이브러리에서
facet_grid()
로 도표를 만드는 기능으로 그릴 수 있다. - 방대한 데이터를 다루는 도표에서는 각 패널의 축 범위와 눈금을 통일하는 것을 권장
21.2 Compound figures
- 별개의 패널 몇 개를 조표 하나로 조합해서 하나의 중요한 관점을 전하는 경우
- 복합형 도표를 이루는 패널들에 매기는 번호는 도표 전체의 디자인과 잘 어루러져야 함
- 패널 각각의 배치에도 신경써야 함
- visual language(데이터를 표시하기 위해 사용하는 그래픽 요소 등)의 일관성을 유지
- 패널을 배열하는 방식을 신경 써야 함. 각 패널의 축과 그 밖의 그래픽 요소들이 정렬을 이뤄야 함.
This post is licensed under CC BY 4.0 by the author.