Diary, Data, IT

[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE) 본문

STARTERS/TIL

[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE)

라딘 2023. 3. 22. 14:53

 

 

[TIL] 32일차 TIL(20230322) - Tableau 집합, LOD(INCLUDE, EXCLUDE)

 

 

 

1. ATTR

- 하나의 차원에 다중 값이 있을 경우 *을 반환하고, 이 외에는 해당 값을 보여주는 기능

- if min(차원) = max(차원) then 차원 else * end

 

- ATTR의 활용:

1) 중복되지 않은 값을 찾아내고 싶을 때, 필터를 걸어 *가 아닌 경우만 보여주는데 활용될 수 있다.
2) 집계하지 않은 값을 집계 수준으로 만들 수 있다. 예를 들어 각 조건 수준에서 다른 계산을 적용하는 것이 가능하다.

 

예를 들어 지역이 Central이라면 매출의 합계를 보여주고, 이외에는 매출의 평균을 보여주고 싶을 때 ATTR을 이용하여 집계되지 않았던 Region 차원을 기준으로 계산할 수 있다.

 

 

2. 집합

- 집합 VS 필터:

필터는 내가 원하는 것들만 보고 제외시켜버리지만, 집합은 관심있는 것들의 기준만 정하고 모두 보여주는 것으로 데이터를 제외하지는 않는다. (IN/OUT을 모두 보여줌)
- 집합을 필터에 넣어서 사용하는 것도 가능하다.
- 집합은 기준 필드에서의 집계된 결과를 바탕으로 IN/OUT을 판단하기 때문에 새로운 차원을 추가해도 판단 결과가 변하지 않는다. 그래서 T/F + FIXED의 개념이라고 생각할 수 있다.
- 단순 T/F 필터는 VLOD 기준으로 판단하기 때문에 차원을 추가하거나 변경하면 참, 거짓도 달라지게 된다.

 

Customer Name을 기준으로 집합을 사용한 경우
전체를 기준으로 단순 T/F 필터를 사용한 경우

 

 

3. LOD

- INCLUDE는 VLOD를 기준으로 좀 더 세부적인 차원을 보여주고 싶을 때 사용한다.
- EXCLUDE는 VLOD를 기준으로 더 큰 차원을 보여주고 싶을 때 사용한다.
- FIXED는 내가 고정시킨 차원이 VLOD에 있는 경우, 없는 경우 모두 사용할 수 있다.

 

 

INCLUDE를 사용한 결과를 다시 큰 범주로 구해서 전체 결과값과 비교했을 때 차이가 발생한다. 하위 범주를 상위 범주 수준에서 집계했을 때는 규모를 무시하고 각각의 크기를 동일하게 계산한 결과를 반환하게 되기 때문이다. LOD를 사용하지 않으면 데이터의 규모를 고려한 집계값을 반환하게 된다.

 

 

 

INCLUDE를 이용하면 VLOD의 하위 범주의 세부 통계값까지 확인하여 비교할 수 있다.
EX) 평균의 최대값, 최소값의 평균 등

 

 

하위 범주를 EXCLUDE한 경우에는 제외한 차원 위에 있는 상위 범주의 평균값을 구해서 보여준다. 하위 범주에 상위 범주를 기준으로 값을 구해서 연산을 적용하고자 하는 경우, 하위 범주의 비율을 계산하고 싶은 경우 등에 활용할 수 있다.

 

하지만 FIXED를 사용하는게 더 편하다

 

 

 

 


 

 

소감 및 정리

프로젝트와 실습을 거치면서 차원을 고정한 FIXED LOD를 사용할 일이 많았고, 자연스럽게 LOD의 개념은 어느정도 잡혀있는 상태였다. 오늘은 INCLUDE와 EXCLUDE를 조정해가면서 결과값이 바뀌는 것을 확인하고, 동작 원리를 정확하게 짚고 넘어갈 시간이 주어졌다. LOD를 사용한 결과와 그렇지 않은 VLOD 수준의 결과를 비교하고, 차원의 깊이를 바꿔가며 비교하여 내가 생각하고 있는 LOD의 개념으로 구현했을 때 그대로 동작되는지 확인하였다. 조건문을 사용하여 특정 값만 남겨두고 EXCLUDE를 사용하는 방법은 처음 봤을 때 조금 어려웠지만 동작 원리대로 따라가며 생각하여 이해할 수 있었다. 오늘 실습을 하면서 FIXED가 제일 간단하고 편한 것 같다는 생각이 계속 들었던건 안비밀ㅎ...