[Tableau] 심화 그래프 작성2
트리맵 차트
트리맵 차트는 면적과 색깔을 통해 데이터를 비교할 수 있도록 하는 차트이며, 다차원 차트의 한 종류이다.
데이터에서 하나의 특성을 차원이라고 표현하는데, 다차원 차트의 경우 하나의 그래프에 3개 이상의 특성을 담고있는 차트를 말한다. 예를 들어, 일반적인 꺾은 선 그래프의 경우 x축에는 시간의 흐름(1개 특성), y축에는 측정값(2개 특성), 예를 들면 매출액과 같은 값을 표현한다. 그래서 우리는 꺾은 선 그래프를 통해 시간과 매출이라는 두 개의 특성을 담은 정보를 한 눈에 확인할 수 있다.
하지만 트리맵 차트의 경우, 최대 3개의 특성을 한 번에 표현할 수 있다. 트리맵 차트에서는 박스의 구분, 박스의 크기, 박스의 색상 세 가지 특성을 활용할 수 있기 때문이다. 카테고리 별로 매출액이 얼마나 발생했는지 확인하기 위해 차트를 그린다고 생각해보자. 파이 차트로 표현할 경우, 각도를 통해 원을 쪼개어 항목 별로 매출이 얼마나 발생했는지를 표현하는데, 트리맵 차트의 경우 원이 아닌 사각형을 통해 표현한다. 전체를 하나의 큰 사각형으로 두고, 항목 별로 사각형에서 차지하는 면적으로 사각형을 쪼개어 측정값의 크기를 표현한다.
그런데 이렇게만 했을 경우, 구분하기 위한 항목(1개 특성)과 측정값(2개 특성)이라는 두 개의 특성 밖에 차트에 표현이 안된다. 여기서 우리는 사각형의 색을 통해 하나의 특성을 더 표현할 수 있다. 매출액과 더불어 판매량까지 함께 비교하고 싶은 상황일 경우, 판매량 값이 많을 경우 진하게, 적을 경우 연하게 색 스펙트럼을 이용해서 칠해주게 되면 우리는 하나의 차트를 통해 카테고리, 매출액, 판매량 이렇게 3개의 정보를 얻을 수 있게된다.
위의 트리맵 차트에서 우리는 사각형의 크기로 매출액을 비교할 수 있고, 색의 진하기로부터 판매량을 비교할 수 있다.
여기에 더해 트리맵 차트는 계층성을 표현하기에도 매우 적합하다. 계층의 표현은 트리맵 차트가 가지는 아주 강력한 효과이다. 상위 계층부터 하위 계층까지 한 번에 데이터를 비교하기에 매우 효과적이기 때문이다. 계층은 상위 계층으로 사각형을 구분하고, 그 사각형 안에서 다시 하위 계층으로 사각형을 구분하는 방식으로 표현할 수 있다. 예를 들면, 카테고리별 매출액을 비교한다고 했을 때, 대표 카테고리로 상위 계층을 잡고, 서브 카테고리를 하위 계층으로 잡고 트리맵 차트를 그리면, 하나의 차트로 대표 카테고리 간 비교도 가능하고, 대표 카테고리 내에서 서브 카테고리 간의 매출액 비교도 가능할 뿐 아니라, 더 나아가 서브 카테고리들끼리의 비교도 할 수 있는 강력한 시각화 자료를 만들 수 있다.
하나의 차트를 통해 여러 정보를 한 번에 전달할 수 있다는 것은 큰 강점이지만, 주의해야 할 점이 있다. 많은 정보가 혼재되어 오히려 전달력이 떨어질 수 있다는 점이다. 대시보드를 만들 때는 제작자 외에 사람들도 쉽게 데이터를 받아들일 수 있도록 만드는 것이 중요한데(특히나 메인 KPI 지표와 같이 실무자 외의 사람들에게 제공되는 대시보드), 많은 정보가 담길 수록 그래프는 복잡해지고, 이해하기가 어려워질 수밖에 없기 때문이다. 그러므로 트리맵 차트를 활용할 때는 색상까지 새로운 차원에 할당하여 더 많은 정보를 줄 것인지, 아니면 크기와 색상을 동일한 차원에 할당하여 시각적 전달 효과만 강조할 것인지를 상황과 목적에 맞춰 잘 선택하는 것이 중요하다.
태블로에서 트리맵 차트를 작성해보도록 하자. 일단은, 크기와 색깔 모두 매출을 표현하기 위해 사용해보도록 하자.
우선 메인이 되는 측정값을 정하자. 그리고 이 측정값을 어떻게 쪼갤 것인지를 고민해보자. 예시에서는 매출을 측정값으로, 카테고리를 차원으로 선택하였다. 트리맵 차트는 사각형의 '크기'와 '색깔'로 데이터를 구분하는 차트이므로, 집계 기준이 되는 지역 필드를 크기 마크 카드와 색깔 마크 카드로 드래그 앤 드롭을 하면 될까?
여기서 문제가 생긴다. 집계 기준은 카테고리이지만, 우리는 그래프를 카테고리의 크기가 아닌 매출의 크기로 표현하고 싶다. 이는 표현 방식과 집계 기준의 혼동에서 오는 문제이다.
파이 차트와 비교했을 때, 파이 차트의 경우 표현 방식은 원과 각도이고, 집계 기준은 카테고리였으며 이를 색깔로 표현했었다. 트리맵 차트의 경우 크기와 색깔은 집계 기준이 아닌 표현 방식이기 때문에 집계 기준이 되는 차원 필드가 아닌 측정값 필드가 표현되어야 한다. 그렇다면 집계 기준은 어떻게 표현할 수 있을까? 파이 차트의 경우 색깔을 통해 집계 기준을 구분하려고 했기 때문에 해당 필드를 '색깔' 마크 카드에 드롭했지만, 다른 표현 없이 그저 구분만 하고 싶을 경우에는 '세부 정보' 마크 카드에 드롭하면 된다. 집계 기준 필드가 위계를 가지고 있다면, 마크 카드에 있는 +- 표시를 통해 차트에 위계 표현을 줄 수 있다.
1. 원하는 측정값을 워크시트에 드롭하면, 데이터가 표현된다. 일반적으로 아무 설정도 하지 않을 경우 텍스트로 표현된다.
2. 데이터를 집계할 기준이 되는 필드를 세부 정보 마크 카드로 드롭한다(단 지 구분하는 것이 목적). 이렇게 하면 텍스트가 집계 항목 별로 쪼개어 표현된다.
3. 우리는 매출액을 '크기'로 표현하고 싶은 것이므로 매출액 필드를 크기 마크 카드로 드롭한다.
4. 여기에 더해 '색깔'까지 사용하여 강조하고 싶은 경우, 매출액 필드를 색상 마크 카드로 드롭한다.
여기서 색까지 이용해 매출을 강조해서 표현하고 싶으면, 매출 필드를 '색깔' 마크 카드에 드롭하면 된다. 반대로 매출이 아닌 집계 기준을 더 강조하고 싶으면 지역 필드를 '색깔' 마크 카드에 드롭하여 그룹별로 다른 색으로 표현된 트리맵 차트를 그릴 수도 있다. 매출에 더해, 다른 필드까지 한 번에 표현하고 싶으면 해당 필드를 색깔에 드롭하여, 다차원 차트로 그릴 수도 있다. 트리맵 차트에 대한 이해와, 작성법을 익힌 후에 목적에 맞게 효과적인 시각화 방법을 구현할 수 있도록 해보자.
*가장 편한 방식은 원하는 필드들을 선택한 뒤, 표현 방식 탭을 이용해 기본 차트를 작성한 후에 수정하는 것이다. 계속 강조했듯이 원리를 이해하여, 태블로 실력을 키우기 위함이다.