Diary, Data, IT

[TIL] 18일차 TIL(20230302) - Tableau 기초 2 본문

STARTERS/TIL

[TIL] 18일차 TIL(20230302) - Tableau 기초 2

라딘 2023. 3. 2. 16:28

 

 

[TIL] 18일차 TIL(20230302) - Tableau 기초 2

 

 


1. 태블로에서 위치(지도)값 설정하기
- 위도, 경도로 이루어진 데이터가 아니지만 태블로에서 지도에 시각화하고 싶을 때, 지역으로 설정해주면 자동으로 인식
- [지리적 역할] - [해당 데이터의 지리 정보로 설정]
- 지리 컬럼으로 생성해도 바로 해당 위치를 정확하게 잡지 못할 경우 수동으로 설정해줄 수 있음
- 알 수 없는 항목의 위치 편집 기능 활용


2. 퀵 테이블 계산
- 간단한 계산을 빠르게 수행할 수 있는 도구
- 백분위수, 누계, 비율, 차이 등을 계산할 수 있음


3. 매개변수
- 그래프를 보여주는 옵션을 매개변수로 지정하여 즉각적으로 바뀌게 할 수 있음
- 막대 그래프의 범위를 다르게 하여 보여주는 등의 기능에 활용
- 기존 컬럼의 매개변수를 설정한 뒤, [구간차원 편집]에서 매개변수를 등록하여 사용

 

 

4. 대시보드 생성 및 해석(스토리라인)

은행 고객 정보를 담은 대시보드


1. 영국에는 사무직 종사자들이 많다. 연령대가 높은 사람들은 영국에 많이 살지 않는다.
2. 스코틀랜드의 주 고객층은 40-50대 남성들이며, 주로 노동직에 종사한다.

3. 웨일스의 데이터는 잔고부분에서 특이한 모습을 보인다. 중간수준의 잔고를 가지고 있는 고객이 다른 주보다 높다.
4. 북아일랜드의 고객들은 연령대가 평균보다 낮고 여성 고객이 훨씬 많다.


5. 그룹화
- 그룹화 하고싶은 영역을 그래프에서 선택한 뒤 그룹화를 진행
- 그룹화 된 영역에서의 값들을 계산하거나 활용할 수 있음
- 그룹화할 내용이 담긴 변수를 지리변수로 추가하는 등의 방식을 사용하면 연결지어줄 수 있음

 

6. 분석 기능 제공
- 클러스터: 데이터를 k-means clustering에 따라 군집화할 수 있는 기능을 제공,
군집화 한 결과를 따로 변수로 지정하여 이후 시트에서도 동일하게 사용할 수 있음
- 추세선: 데이터의 분포를 토대로 회귀선을 예측하여 그려주는 기능

 


빨간색 점들로 표시된 지점은 주황색 점들에 비해 수익이 더 낮은 구역에 있지만 마케팅 비용으로 1달러를 투자하면 7달러 가량의 수익을 얻을 수 있어 가장 수익성이 좋다. 따라서 추가적으로 투자하려면 빨간색 지점들 중 하나를 고르는 것이 가장 좋을 것이다.


7. 툴팁 창에 그래프 추가
- 각 항목에 마우스를 대면 확인할 수 있는 툴팁(세부정보)에 그래프를 추가하여 그릴 수 있음
- [도구설명] - [삽입] - [시트]를 통해 해당 시트에 그려져있는 그래프를 가져와서 사용
- 대시보드를 만들지 않고 하나의 시트에서 간단하게 범주에 따른 여러 정보를 확인할 수 있어서 유용



 


 

 

소감 및 정리

오늘은 태블로에서 그래프를 더 효과적으로 꾸밀 수 있는 다양한 기능들에 대해 배우고, 더 복잡한 데이터를 활용해서 시각화를 진행했다. 기초적인 부분이나 데이터를 결합하는 부분에 있어 어제 하루 진행했었기 때문에 오늘은 좀 더 수월하게 진행할 수 있었다. 그리고 생각보다 태블로에서 더 많은 기능을 제공하고 있어서 놀라웠다. PDF파일에서 데이터를 추출할 수 있는 점이나, 간단한 전처리 함수들을 모두 사용할 수 있는 점들이 편리했고 다른 언어와 같이 사용하지 않아도 태블로만으로도 충분히 효과적인 시각화와 분석을 진행할 수 있겠다는 생각이 들었다. 기초 부분을 마치고 어느 정도 익숙해지기는 했지만 아직 완벽하게 다루지는 못하기때문에 내일부터는 심화과정 강의를 수강하면서 조금 더 능숙하게 다룰 수 있도록 노력해야겠다.