Diary, Data, IT

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 본문

STARTERS

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지

라딘 2023. 3. 26. 23:40

 

 

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지

 

 


 

 

7주차 학습내용

 

대시보드 1 - 기간에 따른 현황 대시보드

Q. 2022-12를 기준으로 M-1, M-2를 설정하여 현황을 살펴볼 수 있는 대시보드를 작성해주세요. 기간에 따른 현황을 보기 위해서는 MoM과 같은 지표들을 수록하는 것이 좋습니다.

 

 

현재 월을 기준으로 지난 달과의 실적을 비교할 수 있는 MoM을 수록하고, 이전 기간을 매개변수로 두어 기간에 따라 대시보드의 모든 값들이 영향을 받을 수 있도록 설정했다. 이 날 배웠던 Primary function들을 활용하면서, 기간에 영향을 받는 지표들을 생각하여 대시보드에 수록했다.

 

1. 현황 및 MoM

해당 기간의 총 매출, 순이익, 주문 수와 MoM을 수록하여 현재 현황과 이전 달을 비교할 수 있도록 구성했다.

 

2. 분기별 평균과 이동평균

해당하는 분기의 실제 평균 값과 WINDOW_AVG(-2, 0)을 통해 현재 달과 지난 2달을 포함해 구한 평균을 같이 배치하여 비교할 수 있는 그래프를 수록했다.

 

3. 월별 누적 매출

해당 월의 일자별 매출을 막대 그래프로 그리고, SUM([Sales]) + PREVIOUS_VALUE(0)을 통해 구한 누계 값을 영역차트로 구성하였다. 매일 발생하는 매출과 누적 현황을 동시에 확인할 수 있다.

 

4. 매출액 증감률 추이

지난 2년간의 월별 매출액 증감률 추이를 순서대로 확인할 수 있다. 지난 달과의 매출액 비교를 위해 LOOKUP(SUM([Sales]), -1)을 이용했다.

 

 

대시보드 2 - 대학 기부금 현황 대시보드

Q. 대학 기부금 현황을 날짜와 금액/비율을 변경해가며 확인하고 싶습니다. 해당 조건들을 매개변수로 넣어 조작할 수 있는 대시보드를 만들어주세요. 또한 MoM/MTD/YoY/YTD를 확인할 수 있는 기능도 넣어주세요.

 

* MTD란?

- Month to Date, 해당 월의 현재 일자까지의 값을 누적하거나 집계한 것

- MTD를 통해 현재까지의 현황을 바탕으로 이번 달의 결과를 대략적으로 예측하고 짐작하는 지표로 활용

 

- 태블로를 통한 MTD 구현:

1) 날짜 매개변수를 설정. 보유한 데이터의 전체 일자를 포함하도록 설정하는 것이 좋다.

2) MTD를 구할 조건 설정. 매개변수를 기준으로 동일한 달의 이전 일자까지를 선택한다.

 

DATEDIFF('month', [Order Date], [Date Parameter]) = 0 AND
DATEDIFF('day', [Order Date], [Date Parameter]) >= 0

 

3) 조건을 필터에 걸고 '참'인 결과만 출력하도록 설정한다.

4) MTD를 구하고자 하는 필드를 넣어주면 자동으로 MTD를 계산하여 반환하게 된다.

 

 

 

1. DATE 매개변수

일자별 대시보드이기 때문에 DATE 매개변수를 넣어 보고싶은 날짜를 설정하며 그 날의 현황을 확인할 수 있다. 

 

2. TYPE 매개변수

TYPE 매개변수에서 MoM, YoY, MTD, YTD를 설정할 수 있다. 매개변수에 따라 좌측 상단에 값이 변경되어 보여지게 된다.

 

3. Today Amount/Percent

선택한 날짜의 총 기부금액과 전체 금액에서 그 날의 기부금액이 차지하는 비율을 Amount/% 매개변수를 통해 조정하며 확인할 수 있다.

 

4. College Pie Chart

일자별 기부금의 단과대별 비율을 파이 차트로 확인할 수 있다. Amount/% 매개변수를 통해 정확한 금액과 그 날의 전체 기부금 중 각 단과대가 차지하는 비율을 조정하여 볼 수 있다.

 

5. Donations Bar/Line Chart

현재 월부터 선택한 일자까지의 월별 기부금 추이를 확인할 수 있는 그래프들을 수록했다. 바 그래프는 일자별 기부금을 의미하고 라인 그래프는 전날에 비해 오늘의 기부금이 얼마나 증가/감소했는지의 수치와 비율을 확인할 수 있다. 선택한 일자에 따라 볼 수 있는 기간을 조정할 수 있다.

 

 

대시보드를 만들면서 Amount의 경우는 전체 차원에서 계산해도 무리가 없지만, 비율의 경우 선택한 하루 일자를 100으로 하여 보여줄 필요가 있었다. 하나의 그래프에서 서로 다른 차원을 이용하여 계산한 결과를 보여주기 위해 LOD를 사용했다.

 

1. DATE T/F라는 논리형 필드를 만들고 필터에 걸어서 해당 날짜만 반환할 수 있도록 설정한다.

2. 결국 DATE T/F가 '참'이 되는 경우를 기준으로 사용하기 위해, 선택한 날짜의 기부금을 구할 수 있는 TOTAL T/F를 생성했다.

 

3. 선택한 날짜의 각 기부금을 선택 일자의 전체 기부금(TOTAL T/F)을 기준으로 나누어 백분율을 구했다.

 

 

프로젝트 - 슈퍼 스토어 세일즈 트래킹 대시보드

Q. 나는 회사의 상품 세일즈 트래킹 팀에서 일하고 있습니다. LOD + 그동안 배운 방법을 사용해서 다양한 뷰포인트로 어느 sub-category or category or product가 잘 하고 있는지, 어디서 어떻게 집중해야 하는지 알 수 있는 대시보드를 작성하고자 합니다.

 

1. 분석 목적

슈퍼 스토어 판매 데이터를 분석하여 실적이 저조한 분야에 집중하여 트래킹한다.

실적이 저조한 분야는 1. 제조업체, 2. 도시 기준으로 선정한다.

 

 

2. 분석 개요

1) 슈퍼 스토어의 주문량과 매출, 순이익을 여러 범주를 기반으로 확인하여 범주별로 유의미한 차이가 나타나는 경우가 있는지 확인했다. 그 결과, 지역별 주문량과 순이익의 관계에서 독특한 점을 확인할 수 있었다. Central의 수익율이 주문량에 비해 매우 저조하게 나타났다. 따라서 Central이 다른 지역에 비해 수익률이 낮은 이유를 탐색했다.

 

지역별 주문량, 매출, 순이익

 

2) 지역별 서브 카테고리에 따른 수익을 그래프로 확인하였다. 그 결과 Central이 다른 지역에 비해 지나치게 수익률이 낮은 서브 카테고리가 존재함을 알 수 있었다. 일반화하여 타 지역과 다르게 수익이 낮게 발생하는 서브 카테고리를 골라내기 위한 조건을 수립했다. 그리고 일반화된 조건에 부합하는 서브 카테고리를 도출했다.

 

 

 

 

3) 서브 카테고리 내의 지역별 순이익 차이가 크게 나타나 이를 해결하기 위한 방법을 찾기위해 데이터를 탐색했다. 그 결과 Central의 매출액도 타 지역에 비해 낮았고, 매출의 감소는 할인율에 영향을 받았을 수 있다고 생각하여, 순이익과 할인율의 관계를 비교하였다.

 

 

그래프를 통해 Central은 순이익율도 낮은데 그에 비해 할인율이 높게 적용되고 있었다. 따라서 할인율을 일정 비율 조정한다면 순이익을 높일 수 있을 것이라고 판단했다. 그리고 이를 기반으로 한 전략을 제시하고자 했다.

 

 

3. 분석 결과

1) 할인율 개선이 필요한 제조업체 도출

 

 

세부 카테고리에서 수익이 타 지역에 부진한 카테고리만 선정했던 것과 동일한 방식으로, 타 지역에 비해 한 지역에서만 유독 부진한 제조업체를 선정하고 목록을 제시했다. 해당 제조업체들을 선출하면서, 수익율이 낮은 제조사는 할인을 많이 하고 있음을 확인할 수 있었다. 따라서 할인의 폭을 줄여 수익성을 개선하도록 도모할 수 있다.

 

 

2) 할인율 개선이 필요한 도시 도출

 

 

순이익이 마이너스인 주를 찾고, 해당 주에서 또 마이너스의 수익을 내고 있는 도시들을 찾아 리스트에 추가하였다. 해당 도시들의 할인율 또한 높은 편임을 확인할 수 있었다. 앞선 제조업체들과 동일하게 해당 주에서 상품을 판매할 경우, 현재보다 할인율의 비율을 조금 낮춘다면 순이익을 높일 수 있을 것으로 짐작된다.

 

 

4. 완성된 대시보드

 

 

 

추가적인 학습 내용

 

[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE)

[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE) 1. ATTR - 하나의 차원에 다중 값이 있을 경우 *을 반환하고, 이 외에는 해당 값을 보여주는 기능 - if min(차원) = max(차원) then 차원 else * end - ATTR

better0.tistory.com

 

 

[TIL] 33일차 TIL(20230323) - Tableau LOD(INCLUDE, EXCLUDE, FIXED)

[TIL] 33일차 TIL(20230323) - Tableau LOD(INCLUDE, EXCLUDE, FIXED) 1. INCLUDE - 현재 설정한 VLOD 차원의 영향을 받는다. VLOD 차원에서 추가적인 차원으로 들어가고 싶을 때 사용한다. - 차원의 깊이가 상대적으로

better0.tistory.com

 

 

 

 

 

 


 

7주차 학습후기

태블로 오프라인 강의 2주차에 접어들었다. 이번 주는 기능에 집중한 여러 대시보드들을 혼자서 만들어보고, 프로젝트도 진행했다. 첫 주에는 아직 기능을 구현하는 부분에 있어 미숙한 점이 많았고, 특히 LOD 사용에 있어 어려움을 많이 겪었다. 하지만 이번 주에는 LOD를 제대로 배우기도 했고, 프로젝트에서 시행착오를 거치며 스스로 터득한 부분까지 합하여 많이 복잡하지 않은 수준에서 내가 원하는대로 큰 무리없이 구현할 수 있을 정도의 수준이 된 것 같다. 기능적인 부분에 있어 스스로 많이 성장했다는 것을 느꼈다. 특히 프로젝트를 진행하면서 여러 조건을 한번에 결합한 LOD 식을 세우고 이를 필터에 적용하여 계산 차원과 적용 차원이 다른 문제를 해결한 점에서 스스로 뿌듯함을 많이 느꼈다 :)

 

또 실무진의 입장에서 생각해보고, 실무에서 활용할 수 있는 대시보드를 만들기 위한 아이디어를 제시하는 능력도 길러진 것 같다. 기존 레이아웃은 설명에는 필요하지만 대시보드에 필요한 내용들이 맞나? 라는 의문이 들었고, 여기서 '기간'을 고려하면 얘기가 달라지게 된다는 사실을 깨달았다. 특정 기간을 지정하고, 그에 대한 전반적인 경향을 고려한 제조업체를 선정할 수 있게 되었고, 각각의 자료들을 담당자가 참고 자료로 이용할만한 필요성이 생겼다. 짧은 기간이었지만 이번 주에도 나름 의미있는 프로젝트를 완성했다는 점이 좋았다!

 

 

다음 주 보완사항

태블로 오프라인 3주차에 접어들게 된다. 첫 주는 전략적인 부분에, 이번 주는 기능적인 부분에 집중한 프로젝트를 진행했는데 다음 주에는 이 둘 모두를 고르게 녹여낸 프로젝트를 완성해낼 것이다. 또 여유가 된다면 개인적으로 태블로를 더 활용해보는 시간을 가질 것이다.

 

 



* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL

* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb

 

본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.