일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Tableau
- 데이터분석
- 코딩테스트
- 유데미
- 그리디 알고리즘
- 시각화
- DataFrame
- 태블로
- 부트캠프후기
- 브루트포스 알고리즘
- 백준
- 정렬
- numpy
- python
- 데이터시각화
- matplotlb
- 유데미부트캠프
- Leetcode
- pandas
- 넘파이
- 파이썬
- ndarray
- 유데미코리아
- 취업부트캠프
- 스타터스부트캠프
- 판다스
- Til
- 데이터프레임
- 데이터드리븐
- 유데미큐레이션
- Today
- Total
Diary, Data, IT
[TIL] 33일차 TIL(20230323) - Tableau LOD(INCLUDE, EXCLUDE, FIXED) 본문
[TIL] 33일차 TIL(20230323) - Tableau LOD(INCLUDE, EXCLUDE, FIXED)
1. INCLUDE
- 현재 설정한 VLOD 차원의 영향을 받는다. VLOD 차원에서 추가적인 차원으로 들어가고 싶을 때 사용한다.
- 차원의 깊이가 상대적으로 깊어야 의미가 있다. 이미 주어진 차원에서 깊숙한 차원으로 들어가서 집계하는 것이 의미가 있기 때문이다.
- 집계한 결과에 다시 집계를 하고 싶을 때 사용하기 좋다.(평균의 최소, 최대값 등)
도시를 기준으로 평균을 집계하고 그 결과를 시/도를 기준으로 보여주고 있다. 시/도 내에는 도시들의 평균이 측정값으로 존재하기 때문에 도시들의 평균에 추가적인 집계를 해줄 수 있다. 따라서 현재 그래프에서는 시/도에 속한 도시들의 평균의 최소값과 최대값을 확인할 수 있다.
2. EXCLUDE
- 효과적으로 EXCLUDE를 쓰기 위해서는 LOD안에 선언된 차원이 VLOD에 들어가 있어야한다.
- LOD식 내에 집계함수를 쓰지만 전체 LOD식은 또 집계되지 않은 결과로 인식하게 된다. 항상 RAW값으로 나오기 때문에 집계를 꼭 씌워주어야 한다. 집계함수는 ATTR, SUM, AVG 상관없이 사용할 수 있다.
→ 이미 하나로 집계된 결과이기 때문에, 어떤 집계함수를 사용해도 같은 값이 나오는 것이다.(집계의 의미가 없는 것)
→ 하지만 VLOD의 차원을 지정한 차원이 아닌 다른 수준의 차원으로 변경했을 때 집계함수가 적용된 결과를 산출하므로 주의가 필요하다.
- INCLUDE, EXCLUDE는 Filter의 영향을 받으며, 현재 설정한 VLOD 차원의 영향을 받는다. VLOD 차원에서 추가적인 차원으로 이동하고 싶을 때 사용한다.
봉투를 기준으로 각 하위 범주들의 매출이 얼마나 차이가 나는지 확인하기 위해 [하위 범주] 차원에서 봉투를 제외한 다른 값을 NULL로 처리한 뒤, 이 조건을 EXCLUDE를 이용해 상위 차원으로 나와서 조건의 결과를 모든 하위 범주에 동일하게 적용시켰다.
3. FIXED
- 화면의 VLOD를 고려하지 않고 내가 선언한 차원을 고정시켜서 해당 차원을 기준으로 집계한다.
- FIXED로 집계하려는 차원 위에 상위 개념의 차원이 있을 경우, 계층일 경우에는 가장 큰 차원부터 차례대로 걸어주어야 한다. 그렇지 않으면 중복되는 카테고리가 있어 집계가 중복될 수 있다.
- FIXED의 결과는 측정값 혹은 차원으로 나오지만, INCLUDE와 EXCLUDE는 측정값으로만 나온다.
{FIXED [하위 범주]: AVG([매출])을 통해 차원을 고정시키고 도시별 평균 매출을 구한 결과와 비교한 그래프이다. 도시별 평균 매출과 FIXED한 평균 매출 값이 서로 다르다는 것을 확인할 수 있다. 그 이유는 다음과 같다.
FIXED로 고정한 [하위 범주] 차원 수준으로 내려와서 확인한 결과이다. 그래프를 확인해보면 지역이 다르더라도, 하위 범주가 같다면 모두 같은 값을 가지고 있음을 알 수 있다. 경기도 고양의 책장과 겸남 창원의 책장 매출 평균가는 모두 810으로 고정되어있는 것을 확인할 수 있다.
또한 이 수준에서 더 이상 값이 쪼개지지 않기 때문에 앞서 구한 지역별 평균 매출은 이 [하위 범주]의 평균 값을 그대로 평균낸 것이 된다. 경기도 광주의 FIXED 평균인 211은 광주에 속한 하위 범주인 265, 101, 267의 평균인 것을 확인할 수 있다.
이와 동일한 개념으로 [하위 범주]의 더 세부 차원인 [제조업체]로 들어가도 평균값은 하위 범주 차원에서 고정되어있다. '사무용품'을 확인해보면 제조업체가 다르더라도 모두 평균값이 101로 동일하다.
4. FIXED + T/F
앞서 배웠던 집합의 개념이 차원을 고정시키는 FIXED와 조건식의 결합임을 언급했다. 구체적으로 계산된 필드를 활용해 집합의 개념을 구현한 예시는 다음과 같다.
주문 ID를 기준으로 수익이 0보다 크다면 True를, 그렇지 않다면 False를 반환하는 조건식을 생성했다. 고정된 차원을 바탕으로 이를 특정 기준으로 나누어 처리할 수 있다는 점에서 집합과 동일하게 사용할 수 있다.
'STARTERS > TIL' 카테고리의 다른 글
[TIL] 35일차 TIL(20230327) - Tableau 대시보드 Cheat Sheet, Tableau Specialist 이론 (0) | 2023.03.27 |
---|---|
[TIL] 34일차 TIL(20230324) - Super Store Sales Tracking DashBoard (0) | 2023.03.24 |
[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE) (0) | 2023.03.22 |
[TIL] 31일차 TIL(20230321) - Tableau MTD, MoM, 날짜 매개변수 (0) | 2023.03.21 |
[TIL] 30일차 TIL(20230320) - Tableau 계산된 필드, Primary 함수 (0) | 2023.03.20 |