[TIL] 35일차 TIL(20230327) - Tableau 대시보드 Cheat Sheet, Tableau Specialist 이론
[TIL] 35일차 TIL(20230327) - Tableau 대시보드 Cheat Sheet,
Tableau Specialist 이론
1. Super Store Sales Tracking Dashboard Cheat Sheet
먼저 지난 주에 완성했던 대시보드에 대한 간략한 발표를 진행하고, 이에 대한 피드백을 받았다.
주별 평균 할인율과 지역의 순이익률을 원으로 나타낸 그래프가 나타내는 바가 명확하지 않고 해석하기 어렵다는 피드백을 바탕으로, 해당 그래프를 수정했다. 그래프를 통해 보여주고 싶었던 것은 매출이 낮은 지역에 지나치게 높은 할인율이 적용되어 있다는 것으로, 매출과 할인율의 관계를 더 쉽게 보여줄 수 있는 막대와 선 그래프로 변경했다.
피드백을 통해 수정한 내용은 다음과 같다.
대시보드의 각 그래프들이 어떤 정보를 담고있는지에 대한 설명과 의미하는 내용에 대한 Cheat Sheet를 만들었다. 이를 통해 실무에서 내가 만든 대시보드가 사용될 때, 대시보드를 보는 사람들이 전체적인 내용을 파악하고 활용하는데 사용할 수 있다고 한다.
2. Tableau Specialist 이론
1. 라이브와 추출 생성
1.1 라이브와 추출
1) 라이브
- 기초 데이터에 대한 직접 연결을 포함하여 실시간 데이터나 실시간에 가까운 데이터를 제공
- 라이브 상태에서 태블로 뷰를 새로 고침하면 원본 데이터의 변화에 따라 업데이트 된다.
- 집계 및 쿼리를 작동하는데 시간이 오래 걸린다.
2) 추출
- 특정 시점마다 데이터가 업데이트, 추출 상태에서 굳이 업데이트를 하지 않는다면 태블로 뷰는 동일한 데이터 원본을 사용한다.
- 추출된 이후부터, 태블로는 추출된 데이터를 고유의 데이터로 인식하기 때문에 관계, 모델을 잃을 수 있다.
1.2 추출을 사용하는 이유
- 성능: 데이터 추출이 원본이 굉장히 사용하기에 느릴 때 성능 향상
- 부하 감소
- 사전 집계: 추출할 때 모든 차원의 데이터를 집계하는 옵션 제공
- 빠르게 계산된 필드에 접근, 집계
1.3 TDS 파일 타입으로 저장
- .tds: 데이터 소스 타입, 데이터 소스 페이지에 지정된 연결 정보, 그룹, 집합, 계산된 필드, 기본 필드 속성 등을 포함
- .tdsx: .tds형식에서 저장하는 사항은 물론, 로컬 파일 기반 데이터와 추출 파일 복사본까지 저장, 추출은 .tdsx와 .twbx만 저장 가능
2. 데이터 모델 생성 및 관리
2.1 관계와 조인
1) 관계
- 이음새로 이어져 있으며, 동적이다.
- 조인이 필요 없고, 테이블이 병합되지 않는다.
- 데이터 원본을 쉽게 정의하고 변경하고 재사용할 수 있다. 올바른 세부 수준에서 여러 테이블에 걸쳐 데이터를 쉽게 분석할 수 있다.
2) 조인
- 테이블의 컬럼과 다른 테이블의 컬럼을 합치는 것을 말한다.
Inner Join | 두 테이블 모두 존재하는 값을 포함한 데이터셋을 불러온다. |
Left Join | 왼쪽에 있는 테이블에만 있는 값을 모두 가져온다. 오른쪽 테이블에 왼쪽 테이블에 해당하는 값이 없다면, null로 표시 데이터 블렌딩은 Left Join과 비슷하다. |
Right Join | 오른쪽에 있는 테이블에만 있는 값을 모두 가져온다. 왼쪽 테이블에 오른쪽 테이블에 해당하는 값이 없다면, null로 표시 |
Full Join | Match 상관없이 다 가져온다. 맞지 않는 행은 null로 처리 |
- 두 테이블을 JOIN할 때 연결되는 기준 컬럼이 한 쪽 테이블은 같은 값이 여러 개일 수 있고, 다른 쪽 테이블은 고유 값으로 존재할 수 있는데 JOIN하면 여러 값이 반환될 수 있다.(Data Duplication)
- 데이터 복제 현상을 피하려면, 데이터 블렌딩이나 관계를 사용하는 것이 좋다.
3) 관계와 조인의 차이점
관계 | 조인 | |
표시 방법 | 이음새 | 벤 다이어그램 |
방식 | 동적이고 유연한 방식 | 정적인 방식 |
집계와 측정값 | - 집계 값이 중복되지 않는다. - 일치하지 않는 측정값을 유지 |
- 집계 값이 중복될 수 있다. (세부수준이 다를 시) - 일치하지 않는 측정값이 누락될 수 있다. |
테이블 병합 | 병합되지 않는다. | 병합된다. |
2.2 유니온
- 서로 다른 테이블의 행을 추가하는 기능이다.
- 유니온 과정에서 두 테이블 사이의 컬럼명이 맞지 않는다면, 서로 매치되지 않은 컬럼에서 데이터 값은 무조건 null이 된다.
2.3 데이터 블렌딩
- 단위의 차원이 다른 데이터 결합을 복제 없이 수행 가능
- 데이터 블렌딩을 통해 기본 데이터 원본이 보조 데이터 원본에 연결된다. 연결 기준을 만족하는 값이 여러 개 존재하더라도 보조 데이터 소스는 중복되지 않는다.
소감 및 정리
오늘도 프로젝트를 마치며 발표를 진행했다. 발표는 항상 할때마다 긴장됐는데, 오늘은 열심히 마인드 컨트롤을 하고 임했더니 전처럼 크게 긴장하지 않고 발표를 마칠 수 있었다. 벌써 3-4번 정도 발표를 하다보니 적응이 된건가? 싶기도 했다. 앞으로 분석가로서 일하다 보면 이와 같이 프로젝트를 진행하고 발표할 일이 많이 있을텐데 미리미리 적응해두고 연습해두면 좋을 것 같다는 생각이 들었다. 또 강사님으로부터 생각하지 못했던 뷰포인트로 접근하여 결론을 도출해낸 점에 대한 칭찬을 받았는데 너무너무 뿌듯했다! 내가 분석한 내용에 대한 자신감을 얻을 수 있었다 :) 또 태블로 데스크탑 specialist 자격증에 대한 공부를 진행했는데, 실제 사용하는 부분과 이론에 차이가 있었던 것 같다. 마지막 주에는 자격증 취득을 위한 학습을 진행할 예정인데 그 때 제대로 공부해서 자격증을 따고 싶다.