목차
- 시각적 속성
- 데이터 유형
- 데이터 스케일에 따른 시각화
1. 시각적 속성 (Aesthetics type)
데이터 시각화의 과정
데이터 값을 "체계적이고 논리적인 방식을 통해" 시각적 속성으로 변환 후 속성을 이용해서 최종 그래프를 만듬
시각화 유형
산점도, 파이차트, 히트맵등 다양
모든 데이터 시각화는 데이터 값을 정량화(수치화) 가능한 속성으로 표현 후 그래픽으로 나타내는데 이를 시각적 속성(aesthetics) 라고 함
시각적 속성은 그래프를 구성하는 요소의 모든 측면을 나타낸다.
시각적 속성의 유형
2. 데이터 유형
모든 시각적 속성은 연속형 데이터를 표현할 수 있는 데이터와 없는 데이터로 나눔
데이터의 연속성에 따른 데이터 유형
- 연속형 데이터(continous data)시각적 속성 중 위치, 크기, 색, 선, 굵기는 주로 연속형 데이터 표현
- ex) 1~100 까지의 실수 데이터 (1.13, 10.2,52.3 .........) 연속적으로 연결되는 데이터
- 값이 연속적으로 이어진 데이터
- 이산형 데이터(discrete data)시각적 속성 중 주로 형태와 선 유형이 이산형 데이터 표현
- ex) 한 테이블에 앉을 수 있는 인원 5명~ 6명 → 5.5명은 인원이 될수 없음 인원은 5명 또는 6명으로 정수형 인원만 됨
- 값이 이산적으로 떨어진 데이터
형태에 따른 데이터 유형
- 숫자형 데이터(정량적 데이터)
- 숫자로 나타내고 셀 수 있는 데이터 (1, 2, 3, 4, 3.5, 4.7 등)
- 범주형 데이터(정성적 데이터)ex) 일반적 요인의 수준서열이 있는 일반적 요인의 수준 예시 : GOOD, SOSO, BAD
- 서열이 없는 일반적 요인의 수준 예시 : 토끼, 고양이, 개
- 범주형 데이터를 가진 변수는 요인(factor)라고 하며, 여러 범주를 수준(level)이라고 함
변수 유형 예시
Month - 순서요인(정성적), Day - 이산형 숫자값, Location - 비순서 요인, StationID - 비순서 요인
Temperature - 연속형 숫자
3. 데이터 스케일에 따른 시각화
데이터 값을 시각화 하기 위해서는 적절한 시각화 스케일을 지정해서 매핑해야한다.
예를 들어, X = {1,2,3,4,5} 라는 데이터 집합이 있을 경우 수직선 x에 대응 시킬 수 있다.
또는 색이나 모양을 다르게 해서 다르게 데이터 집합에 있는 값들을 다르게 표현 할 수 있다.
만약 스케일과 값이 일대일이 아닌 경우에는 시각화하는 것이 알아보기 어려울 수 있다.
데이터 스케일에 따른 예시
위의 두 그림은 5개 지역의 연간 평균온도를 나타낸것이다. 보통 위의 그래프 그림을 사용해서 연간 온도를 많이 표현한다. x축은 범주형 변수인 month와 y축은 정성적 연속형 변수인 온도를 나타내고 있다.
히트맵으로 만들어진 그림은 온도를 기준에 맞춰서 두 이산형 범주변수를 통해 나타내고 있다. 결국 두 그림 모두 지역의 연간 평균온도를 나타낸것이지만 어떤것을 강조해서 보여주고 어떤 스케일을 시각화 해줄것인지에 따라서 시각화 결과는 다르게 나타날 수 있다.
시각화에는 정답은 없지만 사람들이 보기 쉽고 직관적인 시각화 방법이 정답에 가장 가까울 수 있다고 볼 수 있다.
출처
그림 1-1 ~ 1-5 데이터 시각화교과서 저. 클라우스 윌케(Klaus O. Wilke)
'데이터 시각화 (Data Visualization)' 카테고리의 다른 글
[데이터 시각화 이론] 0. 데이터 시각화에 대해 (0) | 2021.08.02 |
---|
댓글