Category
📚1일차 학습 안내
:railway_track::school_satchel:Tableau Bootcamp의 첫 날이 밝았습니다!
2주간의 데이터 여정에 함께할 Tableau Rookie 여러분을 진심으로 환영합니다:tableau:
오늘은 앞으로 배우게 될 모든 Tableau 내용의 기초가 되는 중요한 학습 영상과 자료를 공유드립니다.
이번 영상은 실습이 함께 진행되므로, 영상 링크 아래의 실습 파일을 꼭 다운로드 받아주세요!
영상의 길이가 다소 길 수 있지만 집중해서 시청해 주시고,
시청 후에는 1일차 퀘스트(과제)를 꼭 수행해 주세요! ✅
학습 동영상 (아래의 영상 중 한가지를 선택해서 들어주세요!)
- 선택 1 : 신효임 컨설턴트와 함께하는 Tableau 온라인 기초실습교육 (Link)
- 선택 2 : 김연진 컨설턴트와 함께하는 Tableau 온라인 기초실습교육 (Link)
- 📁 학습 과정에서 필요한 실습 데이터 파일 (다운로드)
학습 더 알아보기 자료
👾1일차 퀘스트(과제) 안내
1일차 퀘스트에서는 📁“스타벅스 메뉴 데이터”와 “매장 정보 데이터”를 이용해 시각적 분석을 하고 대시보드를 만들어보도록 하겠습니다. 아래의 데이터 파일을 다운로드 받아주세요
https://korea-tableau-users.slack.com/files/U08D6PP1P0Q/F08MWQBQTFX/_tableau_bootcamp__1___________________________________________________________________.twbx
[⭐️1일차 학습 내용 리마인드] Tableau가 동작하는 기본 원리를 다시 한번 살펴보면,
- 필드는 정성적 데이터와 정량적 데이터에 따라 “차원”과 “측정값”으로 구분됩니다.
- 차원 : 정성적 데이터, 분석 기준이 되는 값, 불연속형 데이터로 측정값을 쪼개어 보는 하나의 관점 (Ex. 제품명, 날짜, 지리명 등)
- 측정값 : 정량적 데이터, 연속형 데이터로 집계 되는 수치
- 측정값은 차원을 기준으로 집계되어 표현됩니다.
- 집계 : 합계, 평균, 중앙값, 카운트, 카운트(고유), 최소값, 최대값, 백분위수, 표준편차, 분산을 의미
- 하나의 측정값을 어떤 기준으로 집계하느냐에 따라서 다양한 데이터 분석이 가능합니다.
- 측정값을 화면에 가져다 높으면 기본적으로 합계 값을 보여주는데요, 측정값을 다른 집계 기준으로 보고 싶다면, 집계 형태를 변경해줘야 합니다.
- 집계 형태를 변경하는 방법
– 행 또는 열, 마크 선반에 놓여진 알약에서 → 마우스 오른쪽 버튼 클릭 후 → 측정값의 집계 형태를 변경 or
– 측정값을 가져올 때부터 집계 형태를 변경 (Window는 측정값에서 마우스 오른쪽 버튼 클릭 상태로 드래그 / Mac은 Option 키 누른 상태로 드래그)
- 집계 형태를 변경하는 방법
- 필드를 행 선반에 놓으면 Y축 표현, 열 선반에 놓으면 X축에 표현됩니다.
- 마크 선반에 있는 형태, 색상, 크기, 레이블, 세부 정보, 도구 설명, 경로, 각도, 모양 속성을 통해 원하는 형태로 시각화를 표현할 수 있습니다.
- 필요한 값은 필터 선반을 통해 필터링할 수 있습니다.
- 대시보드는 기존에 만들어 놓은 워크시트를 조합합니다.

[⭐️1일차 퀘스트(과제) 안내] 이제 본격적으로 1일차 과제를 함께 수행해볼까요?
1️⃣ 카테고리 별 평균 칼로리 & 평균 카페인
첫번째 과제에서는 막대 차트를 활용해서 카테고리 별 평균 칼로리와 평균 카페인을 구하는 시각화 해보겠습니다! (FYI. 다이어트 중인 저는 칼로리도 낮고 카페인 함유도 적은 음료를 마시고 싶습니다😂)
본격적으로 시작하기에 앞서, 우리는 왜 막대 파트를 사용할까? 그 이유를 한번쯤 생각해보셨나요?
막대 차트는 값의 크기를 비교하는데 유용한 시각화입니다. 아래의 예시를 한번 살펴보도록 할게요.
아래의 그림과 같이 막대 차트처럼 값을 “길이”로 표현할 수도 있고, 버블 차트처럼 값을 “원의 크기”를 통해서 표현할 수도 있습니다.
오른쪽과 왼쪽의 차트에서 독일, 멕시코, 인도의 매출을 한번 비교해보시겠어요? 어느 나라의 매출이 가장 클까요?
막대 차트에서는 독일이 가장 매출 값이 크다는 것을 한눈에 알 수 있지만, 버블의 크기로는 값의 차이를 비교하기 쉽지 않습니다. (FYI. 우리의 뇌는 크기나 너비 보다는 길이를 비교하는데 더 특화되어 있다고 해요🧠)
이처럼 막대 차트는 수치 데이터 값들 간의 양적 차이를 비교하는데 유용하기 때문에 가장 보편적으로 사용되는 시각화 중에 하나입니다.
- 특정 참조선 (Ex. 평균값, 중간값) 등을 표현해 해당 막대의 참조선 도달 여부를 비교할 수도 있고,
- Bar in Bar 차트를 통해 목표값 도달 여부도 함께 살펴볼 수 있습니다.
반면, 버블 차트는 정확한 값의 비교가 아닌 전체적인 데이터 트렌드를 살펴보는데 있어서 유용하게 사용할 수 있습니다. 이와 같이, 다양한 시각화를 목적에 따라 적재적소에 활용하는 것이 중요하죠!
1번 과제에서는 📁“스타벅스 메뉴 데이터”를 사용하도록 하겠습니다.
👇 1번 과제 인증 결과물

💡퀘스트(과제) 가이드라인
- 카테고리와 칼로리, 카페인을 행 선반에 올려야 할지, 열 선반에 올려야 할지 고민해보세요. (행 선반은 Y축, 열 선반은 X축)
- 칼로리와 카페인의 집계 형태를 평균으로 변경해주세요.
- 왜 집계 형태를 “평균”으로 변경해야 할까요?
하나의 카테고리 안에는 여러 개의 메뉴가 있습니다. 카테고리를 기준으로 합계로 집계해주시면 → 카테고리 안에 있는 모든 메뉴들의 카페인 값이 모두 더해져서 → 카테고리 별 메뉴들의 총 합계 칼로리 & 총 합계 카페인 값이 보여집니다.
우리는 카테고리 별로 평균 칼로리와 평균 카페인 값을 보는 것이 필요합니다.
- 왜 집계 형태를 “평균”으로 변경해야 할까요?
- 여기까지 잘 따라오셨다면! 평균 칼로리와 평균 카페인을 표현하기 위해 각각 2개의 축이 생겼을텐데요, 평균 카페인을 표현하는 오른쪽 막대에만 색상을 표현해주세요. (평균 카페인 함량이 높을수록 붉은색을 띠도록 해주세요.)
- 마지막으로, 평균 칼로리를 기준으로 정렬해주세요!
2️⃣ 메뉴명 별 칼로리 & 카페인
1번 과제에서는 “카테고리 수준에서 칼로리와 카페인”을 시각화 했다면, 이번에는 “메뉴명 수준”까지 표현해 보도록 하겠습니다. 이번 2번 과제에서는 “트래맵”을 사용합니다!
트리맵은 계층 구조의 데이터를 표시하는데 적합한 시각화로, 전체 대비 부분의 비율을 비교하는데 많이 사용합니다.
- 사각형의 크기와 색상에 따라 데이터의 패턴을 확인할 수 있고,
- 많은 양의 데이터를 한눈에 파악할 수 있다는 장점이 있습니다.
아래와 같이 칼로리는 사각형 크기로, 카페인은 색상으로 표현해보세요!
👇 2번 과제 인증 결과물

💡퀘스트(과제) 가이드라인
- 마크의 유형을 사각형으로 변경해주세요.

- 칼로리를 마크의 크기에 놓아주세요.
- 카페인을 마크의 색상에 놓아주세요.
- 메뉴명을 마크의 레이블에 놓아주세요.
- 마크의 색상을 클릭해서 색상 편집을 클릭해주세요.

- 색상을 아래와 같이 변경해주세요.

그런데, 이번 과제에서는 왜 칼로리와 카페인의 집계를 평균으로 변경하지 않았을까요?
앞서 Tableau는 화면에 포함된 차원에 따라서 측정값을 집계한다고 설명드렸어요.
- 1번 과제에서는 “카테고리”를 기준으로 칼로리와 카페인의 평균 값을 계산했다면,
- 2번 과제에서는 “메뉴명”을 기준으로 칼로리와 카페인 값을 계산하는 것이죠.
현재 데이터의 가장 낮은 행 수준이 메뉴명이에요. 즉, 메뉴명은 유일하게 구분되고 중복되지 않는 값이죠. 다시 말해, 하나의 메뉴명에는 하나의 칼로리, 하나의 카페인 값이 있다는 것으로, 아래의 데이터를 보면 조금 더 이해가 되실까요?
결과적으로, 메뉴명을 기준으로 칼로리와 카페인 값을 합계로 계산해도, 평균으로 계산해도 결과는 동일합니다. 따라서, 별도로 집계를 “평균”으로 설정하지 않은 것입니다.
3️⃣ 카테고리와 메뉴명을 한 번에 살펴보기
앞서 1번과 2번 과제에서 만든 “카테고리” 기준 시트와, “메뉴명” 기준 시트를 활용해서, 한 번에 살펴볼 수 있는 형태로 만들어볼게요.
아래의 이미지와 같이, 카테고리에 마우스를 오버하면, 해당 카테고리에 소속된 메뉴의 시각화 정보를 살펴볼 수 있도록 작업해보겠습니다. Tableau의 기능 중 “도구 설명”을 이용해볼게요!
👇 3번 과제 인증 결과물

💡퀘스트(과제) 가이드라인
- 카테고리 별 평균 칼로리 & 카페인 시트로 이동해주세요.
- 평균(칼로리(Kcal)) 마크 카트를 클릭하고 → 도구 설명을 클릭해주세요.

- 도구 설명 편집 창에 추가할 시각화에 대한 설명을 입력해주세요.

- 삽입 클릭 → 시트 → 메뉴 별 칼로리 & 카페인 선택

- 넓이(maxwidth)와 높이(height) 조정 → 확인 클릭

4️⃣ 당분 함유량과 칼로리의 상관관계
당분 함유량이 높을수록 칼로리가 높을까요? 3번 과제에서는 당분과 칼로리의 상관관계를 살펴보겠습니다!
이번에는 스캐터 플롯 (산점도) 시각화 기능을 사용할 예정이에요.
스캐터 플롯은 2개의 연속형 데이터에 대한 상관관계를 분석하는데 가장 많이 사용되는 시각화입니다.
- 두 개의 축으로 데이터가 얼마나 퍼져 있는지에 대한 분포를 살펴볼 수도 있고,
- 상수 라인 / 평균 라인 / 사분위수 라인을 추가하여 값의 분포를 비교하기에도 유용합니다.
4번 과제에서는 📁“스타벅스 메뉴 데이터”를 사용하도록 하겠습니다.
👇 4번 과제 인증 결과물

💡퀘스트(과제) 가이드라인
- 당류와 칼로리를 각각 알맞게 열 선반과 행 선반에 위치 시켜보세요.
(당류는 X축, 칼로리는 Y축에 놓아야겠죠?) - 메뉴명 수준을 기준으로 당류와 칼로리를 살펴봅시다.
1번 스텝을 진행하셨다면, 현재 시각화에는 전체 메뉴의 합계 당류와 합계 칼로리가 나타나는 것을 볼 수가 있습니다.
메뉴명을 마크 선반의 세부 정보에 가져다 놓으세요. 시각화 집계 기준이 전체에서 메뉴명 수준으로 변경됩니다. - 마크의 형태를 “원”으로 변경해주세요.
- 카페인으로 마크(원)의 색상과 크기를 표현하세요.
겹쳐지는 제품들을 함께 볼 수 있도록 색상의 불투명을 조정하고, 테두리를 추가해 시트의 가독성을 높여보세요. - 결과적으로, 당류가 높을수록 칼로리가 높은 것을 볼 수 있고, 비슷한 당류가 들어가도 칼로리가 메뉴에 따라 달라진다는 것을 확인할 수 있습니다!
5️⃣ 시/군/구 별 매장 분포 현황
어느 시/군/구에 스타벅스 매장이 가장 많을까요? 5번 과제에서는 시/군/구 별 매장의 분포를 “맵”을 이용해 살펴보도록 하겠습니다!
5번 과제에서는 📁“스타벅스 매장 정보 데이터”를 사용하도록 하겠습니다.
👇 5번 과제 인증 결과물

💡퀘스트(과제) 가이드라인
- 데이터 창에서 사용 데이터가 “스타벅스 매장 정보”로 선택되었는지 확인해주세요.

- 시도, 시군구 필드를 이용해서 매장이 존재하는 시/군/구를 표현해봅시다.
- 마크의 크기와 색상을 스타벅스 매장 수로 나타내보세요.
스타벅스 매장 수는 “매장코드”를 카운트해서 크기와 색상에 표현하면 되겠죠?
6️⃣ 대시보드 만들기
마지막 6번 과제입니다! (여기까지 오시느라 정말 고생 많으셨어요👏)
이번에는 1~3번 과제에서 만든 “카테고리 별 평균 칼로리와 평균 카페인”, “당분 함유량과 칼로리의 상관관계” 시트를 이용해 아래와 같이 대시보드를 만들어주세요!
👇 6번 과제 인증 결과물

🔥1일차 추가 도전 퀘스트(과제)
- 칼로리가 낮으면서 카페인이 높지 않은 메뉴를 마시고 싶을 때, 어떤 시각화를 통해 답을 찾을 수 있을까요?
상단에서 만든 차트와 유사하게 메뉴별 칼로리와 카페인의 상관관계를 볼 수 있는 차트를 만들어보세요! 이 문제는 2일차 학습 과정에서도 함께 진행해볼 예정이니, 오늘은 자유롭게 시각화 해보셔도 좋습니다. - “스타벅스 매장 정보” 데이터에 있는 경도/위도 데이터를 이용해서 아래와 같이 서울시의 실제 매장 위치를 표현해보세요.

:railway_track::school_satchel:Tableau Bootcamp 1일차 학습과 퀘스트가 클리어되었습니다!
Leave a Reply