| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 머신러닝
- Python
- 힙정렬
- python기초
- 자연어처리
- Transformer
- 기초
- dementional reduction
- SQL
- 데이터엔지니어
- 데이터 시각화
- CLIP
- 정보처리기사
- 생성형 인공지능
- LangGraph
- ASR
- 랭그래프
- 에이전트
- 알고리즘
- 캐글
- TTS
- python 기초
- UMAP
- RNN
- 트랜스포머
- 객체지향
- 소프트웨어 개발
- RDBMS
- CNN
- 딥러닝
- Today
- Total
수달이네 기술 블로그
4. 시각적 표현 본문
심미적 객체

그래픽 요소: 모양, 크기, 색상을 가진 객체
Cartesian Coordinates(데카르트 좌표)

데이터 시각화에서 자주 사용되는 데카르트 좌표계이다.
- x와 y값으로 위치가 고유하게 지정된다.

위는 데카르트 좌표계를 이용하여 선형 그래프를 나타낸 것이다.
- x축의 간격이 좁고 y축의 간격이 넓은 도형은 y축의 변화를 강조하며,
- y축의 간격이 좁고 x축의 간격이 넓은 도형은 x축의 변화를 강조한다.
- 이상적으로는 중요한 차이가 눈에 띄도록 종횡비를 선택하는 것이 좋다.
- 하지만 위에서 보면 50부터 그래프가 시작하며, 그래프별로 너무 큰 차이를 보이도록 하여 왜곡이라 생각될 수 있다.
Nonlinear Axes(비선형 축)
선형 축: 위 데카르트 좌표계 처럼 x축과 y축이 모두 동일한 간격으로 배치되는 것.
- 데이터를 정확하게 표현할 수 있다.
비선형 축: 데이터의 신뢰성을 올리기 위해 정규 분포로 만들어 주기 위해서 log scale처럼 각 간격이 다른 것.

- 첫번째 데이터 분포를 보면 0에 데이터가 모여있는 것을 확인할 수 있다.
- 데이터가 몰려있으면 적은 크기의 값은 정확하게 비교하기 힘들어진다.
- 따라서 두번째처럼 일정한 비율로 로그 비율을 표기해주는 것이 안정적이다.
- 로그 값을 이용했으면 x축은 값 자체가 아닌 로그 비율을 작성해주는 것이 올바르다.(계수 해석을 위함)

- 해당 그래프에서도 마찬가지

- 로그 척도에서 값 1은 중간점이다. 즉, 로그 척도는 0~∞까지 나타낼 수 있으며 음수는 표현하지 못한다.
- 위에선 우측이 나쁜 시각화라 했지만, 만약 이상치를 강조하고 싶을 경우 우측과 같이 표현하기도 한다.
- 하지만 이전에도 말했듯 왜곡으로 해석할 수 있다.
Curved Axes(원형축, 극좌표계)


극 좌표계는 각도와 원점으로 부터의 반경 거리로 위치를 지정한다.
해당 좌표계의 경우 주기적인 특성을 가진 데이터(사계절 온도변화 등)스케일의 한쪽 끝에 있는 데이터 값을 다른쪽 끝에 있는 데이터 값과 논리적으로 연결이 가능하다.
색상
색상

모든 심미적 객체는 연속적인 데이터의 표현과 이산적인 데이터의 표현으로 나뉜다.
- 위에서 색상은 연속적인 데이터 표현에 적합하고, 나누어둔 네모들은 이산적인 표현에 적합했다.
즉, 데이터 값에 미적 요소를 매핑하려면 어떤 미적 요소에 해당하는지 지정해야함.
- 위에선 x축에 월들을 y축엔 지역을 표현하고, z축(색상)엔 온도를 표시했다.
색을 통한 구분
이산적 구분: 대부분의 경우 지도상의 국가, 특정 제품의 제조업체 등의 데이터를 구분하는 수단으로도 사용한다.

- 이때 사용하는 것이 왼쪽의 정성적인 색상 구분
연속적 구분: 소득, 온도, 속도 등의 데이터 값을 나타내는 경우에도 사용된다.

- 이때 사용하는 것이 위쪽의 정량적 데이터 값을 나타내는 색상구분(방향성이 중요함)
강조
눈에 띄는 색상 집합으로 요소를 표현하면 강조효과를 줄 수 있다.

- 강조 색상 스케일: 차분한 색상 집합과 그에 상응하는 강하고 어둡거나 채도가 높은 색상 집합을 포함하는 스케일(왼쪽이 그냥 색상, 오른쪽이 강조 색상 스케일

- 가장 강조하는 쉬운 방법은 위처럼 강조하는 부분 제외 대부분의 색상을 흑백으로 만드는 것.
시각화
양의 시각화

새로 혹은 가로로 배열된 막대를 사용하여 양을 시각화한다.
stacked의 경우 적은 바의 개수로 확인할 수 있으나, 직접적인 양 비교가 힘들다는 점에서 이점이 별로 없다.
히트맵은 색상까지 활용하여 xy축에 매핑하고 색상으로 양을 시각화한다.
분포의 시각화

히스토그램과 밀도그래프의 경우 분포를 가장 쉽게 시각화 할 수 있다.
3번째 누적 밀도 그래프나 분위수-분위수 그래프는 데이터를 잘 나타낼 수 있짐반 해석하기 어려울 수 있다.
boxPlot, ViolinPlot, 등 의 그래프
- 맨꼭대기선 최대값, 맨 바닥선 최솟값, 박스는 중간값부터 1/n값을 표시한다.
비율의 시각화

파이 차트(원형차트), 막대그래프 등으로 시각화 할 수 있다.
원형 차트의 경우 비율을 강조하며, 개별 값은 막대에서 쉽게 비교 가능
마지막 누적 밀도 그래프의 경우 비율이 연속 변수를 따라 변할때 적합하다.
비례의 시각화

여러 그룹화 변수에 따라 비율이 지정되는 경우
모자이크 플롯
- 한 그룹화 변수의 모든 수준이 다른 그룹화 변수의 모든 수준과 결합될 수 있다 가정
트리맵
- 한 그룹의 하위 구분이 다른 그룹의 하위 구분과 완전히 다른 경우 효과적
병렬집합
- 세개 이상의 그룹화 변수가 있는 경우 효과적
상대적인 값의 시각화

산점도는 하나의 정량적 변수를 다른 변수에 대해 상대적으로 나타낼때 사용
점이 많을 경우 등고선, 2차원 구간 , 6각형 구간 등을 사용하는 것이 효과적
불확실한 정보의 시각화

오차막대를 통해 추정치, 측정값에 대한 가능한 값의 범위를 표현
- 마지막 분위수 점 그림의 경우 분포를 이산 단위로 보여줌.

해당 선 그래프의 경우 뒤의 밴드를 통해 신뢰구간을 보여준다.
'학교공부 > 데이터시각화' 카테고리의 다른 글
| 7. 정적, 동적 패턴 (0) | 2025.10.19 |
|---|---|
| 6. 시각적 탐색, 글리프 (0) | 2025.10.19 |
| 5. 색 (0) | 2025.10.18 |
| 2. 시각 연구의 기본 용어 정리 (0) | 2025.09.17 |
| 1. 데이터 시각화 이론 (0) | 2025.09.06 |