차트로 이야기하기: 데이터 시각화를 통한 데이터 전달의 미학

안녕하세요, 데이터다이빙입니다.😀

오늘은 데이터 분석 프로세스에서 빠질 수 없는 “데이터 시각화”의 필요성과 다양한 차트(=그래프)종류, 그리고 활용방법에 대해 소개드리고자 합니다. 대부분의 처음 접하는 비전공자분들은 ‘시각화’를 생각하시면 엑셀, PPT 등을 먼저 떠올리시겠지만, 최근에는 하루만에 배워서 데이터 시각화에 활용 가능한 강력한 BI툴들이 매우 많습니다!

그래서 꼭 코드를 활용하지 않아도 쉽게 시작해 볼 수 있고, 눈에 보이는 확실한 결과물을 완성할 수 있다는 이유로 데이터 공부를 시작하시는 많은 비전공자분들이 첫 번째 목표로 “데이터 시각화”를 꼽기도 합니다.


데이터 분석 프로세스는 아래의 표와 같이 정리할 수 있는데요,
비즈니스의 인사이트 도출 및 커뮤니케이션을 통해 최종 의사결정을 위해서는 아이디어를 제안하고 이를 뒷받침해 줄 수 있는 “근거자료”가 마련되어야 합니다.

데이터 프로세스 - 데이터 다이빙 강의자료 일부

1️⃣ 데이터 시각화가 필요한 ‘진짜’ 이유

아래 두 자료는 시간의 흐름에 따라 변화하는 1호선 지하철 혼잡도에 대한 내용입니다. 첫 번째는 글(텍스트)로 표현된 자료이며, 두 번째는 시각화를 통해 표현된 자료입니다.

아래 두가지 방식 중 어떤 설명이
더 한눈에 파악하기 쉬우신가요?
데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

텍스트로 표현된 자료는 그의 내용 자체가 어렵진 않지만, 사실 한눈에 직관적으로 파악이 어렵습니다.
HubSpot의 소셜미디어 사이언티스트인 댄(Dan Zarrella)은 이미지를 포함한 트윗이 이미지가 없는 트윗에 비해 95% 이상 리트윗되는 사실을 발견하기도 했는데요, 이는 그림을 활용하여 정보를 전달할 때 텍스트보다 정보 전달이 훨씬 더 빠르다는 것을 의미합니다.

다시 말하자면 복잡한 데이터가 ‘시각화’되어 전달된다면,
우리는 단순히 수치를 나열한 글보다 훨씬 더 많은 양의 정보를 처리할 수 있다는 말입니다.

2️⃣ 데이터에 따라 ‘알맞은’ 차트를 선택해야 하는 이유

아래는 동일한 데이터를 다른 차트로 시각화 한 예시입니다. 왼쪽은 막대 차트로 시각화를 하였고 오른쪽은 버블 차트로 시각화를 하였는데요,

데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

(왼쪽) 막대 차트의 경우 월별 데이터의 크기를 y축 정보로 알 수 있고, 막대 길이를 기준으로 약 몇 배 정도 차이가 나는지 파악할 수 있습니다.
ex) 5월 방문자가 4월 방문자의 2배보다 조금 안된다.

(오른쪽) 그러나, 원으로 데이터의 크기를 비교할 때는 ‘면적’을 기준으로 비교하기 때문에, 데이터의 크기 차이를 대략적으로 가늠하기 쉽지 않습니다.
ex) 5월 방문자가 4월 방문자보다 얼마나 더 큰 수치인지 알기 어렵다.

따라서, 알맞은 유형의 차트를 선택해야 보는 사람에게 전달하고자 하는 메세지를 인지적 부담 없이 쉽고 명확하게 전달할 수 있습니다.

3️⃣ 데이터 종류에 따른 대표적인 5가지 데이터 시각화 방법

1) 원형 그래프

데이터를 원 모양의 그래프로 표시하는 그래픽 표현 기법으로, 구성을 표현할 때 자주 사용됩니다.
변수, 즉 구성요소가 많지 않을 때 효과적입니다!

데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

2) 가로 막대그래프

항목별 차이, 순위를 비교할 때 용이한 그래프입니다. 표시해야 할 항목이 많아 세로 막대그리프로 간결한 데이터 시각화가 어려울 경우에 사용합니다.

데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

3) 세로 막대그래프

항목별 차이를 나타낼 때 자주 사용됩니다. 세로 막대 차트는 가로축으로 표시될 항목의 개수가 최대 10개 이하일 경우에 사용하는 것이 좋습니다.

데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

4) 꺾은선 그래프

시간의 흐름과 관련된 데이터를 시각화할 때 필요한 차트입니다. 시간이 지나면서 변화하는 값들, 예측된 데이터의 가능성을 강조할 때 사용하면 효과적입니다!

5) 점 그래프

복수의 변수를 비교하거나 상관관계를 파악할 때 유용한 차트입니다.

데이터 시각화의 중요성 - 데이터 다이빙 강의자료 일부

4️⃣ 데이터 시각화를 위해 사용하는 Tool은 무엇일까요?

1. 파이썬 (Python)

데이터 시각화를 하는데 자주 사용되는 툴은 바로 Python(파이썬)입니다. Python에는 다양한 라이브러리를 제공하고 있는데, 그중에서 seaborn, matplotlib은 대표적인 Python 시각화 패키지라고 할 수 있습니다.

2. 태블로 (Tableau)

다음으로 소개해 드릴 툴은 Tableau(태블로)입니다.

현재 글로벌 데이터 시각화 시장을 선점하여 높은 점유율을 확보하고 있는데요, 피벗테이블과 피벗 차트 형태로 엑셀과 유사한 작업환경을 갖추고 있습니다. 심플한 유저 인터페이스를 제공하기 때문에 전문적인 코딩 지식 없어도 누구나 쉽게 데이터를 시각화할 수 있어 인기가 많습니다.

태블로로 데이터 시각화하기 - 데이터 다이빙 강의자료 일부

3. 파워비아이 (Power BI)

Power BI는 데이터 연결 및 분석이 가능하게 하는 시각화 도구로써, 실무자가 직접 경영 환경을 분석하여 의사결정을 돕는 비즈니스 분석 도구입니다.

엑셀 기반의 쿼리 중신 계싼 도구로서 표/테이블 형식의 데이터를 가져와 시각화하여 보여주고 데이터를 대시보드 형태로 시각화 해주기 때문에 다양한 데이터를 더욱 쉽고 빠르게 분석할 수 있습니다. 엑셀 기능을 활용하여 보고서 작성을 할 수 있다는 점, 모바일 환경에서도 대시보드를 확인할 수 있기 때문에 매우 편리합니다.

4. 엑셀 (Excel)

다음으로는 앞에 소개 드린 새로운 툴들이 나오기 이전부터 실무에서 데이터를 분석 및 시각화하는 데 널리 쓰여오고 있는 툴인 ‘엑셀’이 있습니다.

엑셀은 어려운 전문 도구 학습법에서 벗어나 모든 구성원이 쉽게 접하고 다룰 수 있는 분석 도구라고 할 수 있습니다.

그래서 저는 어떤 시각화 툴을 써야 하나요?

위에 언급한 4가지 시각화 툴을 제외하고도 여러 다양한 도구들이 존재합니다. 그래서인지 어떤 기준으로 골라야 할지, 어떤 툴이 실무에서 도움이 될지 판단하기가 어렵다고 느끼실텐데요,
그래서 저희 데이터다이빙이 4가지 툴을 비교 분석한 표를 제작해 보았습니다!

PythonTableauPowerBIExcel
기능범용 프로그래밍 언어,
다양한 데이터
과학 라이브러리
사용자 친화적인
인터페이스,
빠른 대용량 데이터 처리,
대시보드 생성
사용자 친화적인
인터페이스,
MS 제품군과 호환성,
대시보드 생성
기본적인 데이터 분석과
시각화 기능
특징프로그래밍 경험이 필요,
코드로 다양한
시각화 가능
드래그 앤 드롭으로
쉽게 사용 가능,
코드 작성 필요 없음
드래그 앤 드롭으로
쉽게 사용 가능,
코드 작성 필요 없음
직관적이고 사용자
친화적인 인터페이
필요 상황깊은 데이터 분석,
머신 러닝,
사용자 정의
시각화 필요 시
비개발자가 대용량
데이터 처리와
시각화를 할 때,
대시보드 필요 시
MS 제품군과의
호환성 필요 시,
비즈니스 인텔리전스와
대시보드에
초점이 맞춰질 때
작고 간단한 데이터 세트 분석,
데이터베이스나 복잡한 계산이
필요 없을

이번에는 이렇게 데이터 시각화의 필요성, 그리고 다양한 차트 유형과 현재 인기 있는 시각화 전문 Tool을 소개해 드렸습니다.

데이터 시각화에서 쓰이는 다양한 차트를 제작해 보고 싶으시거나,
실무 데이터를 활용한 시각화 작업을 연습하는 시간이 필요하시거나,
앞서 언급한 Python, Tableau 등의 시각화 전문 Tool을 기초부터 심화과정가지 맞춤 설계된 교육자료를 통해 더 다양하고 자세하게 배워보고 싶으시다면,

데이터다이빙 홈페이지 내 문의하기를 통해 자세한 커리큘럼 문의 바랍니다 🙂

Similar Posts