STARTERS/TIL

[TIL] 44일차 TIL(20230407) - Tableau Desktop Specialist 자격증 정리

라딘 2023. 4. 7. 15:05

 

 

[TIL] 45일차 TIL(20230407) - Tableau Desktop Specialist 자격증 정리

 

 

 

📗 Tableau Desktop Specialist 자격증 문제 풀이

 

✅ Join 대신 Relationship을 사용하는 이유

① physical table을 보존할 수 있다.

② 중복을 피할 수 있다.

 

✅ Blend 대신 outer join을 사용하는 이유: 모든 row를 남기고 싶어서

 

별칭은 values of a discrete dimensions만 가능하다. 필드명은 별칭이 아니라 rename을 통해 수정

[별칭]에 들어가면 다음과 같이 필드 내 member들의 별칭만 수정할 수 있다.

 

✅ Geographic Roles: Airport, Area Code, CBSA/MSA, City, Congressional District, Country/Region, Country, NUTS Europe, State/Province, Zip code/Postcode

 

 

dimension의 default properties: comment, color, shape, sort

 

 

Group is most helpful in combining all values of a field containing a given string ➡ Find Members

 

 누계를 구하기 위한 방법

① 분석 탭 > 총계 드래그 앤 드롭 > Subtotals, Column Grand Totals, Row Grand Totals 옵션 선택

② 측정값 우클릭 > 퀵 테이블 계산 > running total

 

 

 

📗 Tableau Desktop Specialist 자격증 정리

 

Domain 2: Exploring and Analyzing Data


🐣 라인 차트

- 날짜 형식은 discrete, continuous 둘 다 지정할 수 있다.

- Date part → Blue - discrete, 연도와 상관없이 분기의 정보만 알고 싶을 때 (2022, 2023 상관없음)
- Date Value → green - continuous, 어느 연도의 분기 및 월의 수입을 알고 싶을 때

- Discrete로는 지정할 수 없는 것: Week Number

- 날짜의 디폴트 차트는 라인 차트

 

 

🐣 산점도

- 산점도를 이용해서 측정값간의 관계를 시각화

- 측정값을 각각 하나씩 행과 열에 넣는다.

- 차원을 detail에 넣어 해당 차원으로 쪼갤 수 있다.

- 추세선(trend line) 추가 가능

 

🐣 이중 축/Combined axis chart

- 이중 축을 설정한 뒤, different mark type chart를 사용하면 combined chart라고 한다.

- 자주 하는 실수: 축 동기화를 하지 않아서 숫자 실수를 하게 된다. 이해를 어렵게 만든다.

 

🐣 Map

(좌) symbol map, (우)  field map

 

- symbol map은 size + color, field map은 color만 나타낼 수 있다.

- 메뉴 탭에서 Map > background map > 배경 선택 가능

- 위치를 인식하지 못할 때 인식하도록 설정해주는 기능: Map > Geocoding > import custom geocoding / edit location

 

🐣 집합/계층

- Data pane이나 마크를 이용해서 1개의 차원에 대한 집합을 만들경우 기본적으로 '동적집합'

- 계층은 범주가 큰 순서부터 작은 것으로 차례대로 넣어야 한다.

- 계층 우클릭 > Remove 가능

- 계층이 map에 줄 수 있는 장점: city, state 등이 겹치는 경우, 계층을 통해 ambiguous(모호한) 하지 않고 정해져서 나온다.

 

🐣 필터

- 필터는 디폴트로 해당 시트에만 영향을 주지만, 타 시트에도 영향을 주도록 설정할 수 있다.

- date filter로 원하는 연도만 선택이 가능

- 필터는 원래 independent 하다. 하지만 context filter가 추가되면 나머지는 dependent가 된다.

 

🐣 정렬

- 정렬하는 법 3가지

① 툴바에서 정렬 아이콘 클릭

② 차원 우클릭 > sort

③ 그래프일 경우 헤더 옆의 아이콘을 눌러 정렬

- manual로 지정해주면 정렬이 바뀌지 않고 그대로 유지

 

🐣 히스토그램

- 히스토그램은 분포를 보여주는 그래프, 반드시 1 measure 필요

 

🐣 Trend lines의 5가지 options

① Linear

② Logarithmic

③ Exponential

④ Polynomial

⑤ Power

- 추세선을 사용하려면, 축에 숫자로 해석할 수 있는 필드가 있어야 한다.

ex) sub category는 텍스트이며, 숫자로 해석할 수 없다.

 

🐣 Reference lines(참조선)의 3가지 options

① Table

 Pane

③ Cell

 

 

Domain 3: Sharing Insights

 

🐣 Viz Animation

- format > animation에서 적용 가능

- workbook default는 모두 적용, seperate sheet로 따로 적용 가능

- simultaneous animation - default, 심플하고 더 빠르다.

- sequential animation - complex 차트를 step-by-step으로 보여주고 싶을 때, 오래 걸림

- 특정 조건에서는 지원되지 않는다.

① 인터넷 익스플로어를 뺀 나머지 모든 웹브라우저에서 작동

map, polygon, and density marks는 웹브라우저에서 작동하지 않음

③ pie and text mark

④ axes and header

⑤ forecast, trends and reference line

⑥ safe history trails

 

🐣 대시보드 레이아웃

- 모든 시트를 single view로 보이기 위해 만든다.

- Tiled(바둑판식), Floating(부동)

    - 필터나 카테고리를 위에 줄이 2개가 있는 곳을 잡고 움직일 수 있다.

    - 대시보드 레이아웃을 디바이스를 이용하여 바꿀 수 있으나, default를 사용하는 것이 좋다. 디바이스를 정하는 순간, 어떤 디바이스에서도 설정한 레이아웃으로 보여지기 때문에 불편할 수 있음.

    - size가 phone일 때는, fit width 사용을 추천한다.

- Fixed size, range, automatic을 이용한 크기 조정

 

🐣 대시보드 액션

- hover, menu, select를 이용하여 동작

- GO to URL - hyperlink 삽입

 

🐣 Creating Story

- 스토리는 정보를 전달하기 위해 사용하는 sequence of visualizations이다.

- 하나의 스토리에는 하나의 시트 or 대시보드만 넣을 수 있다.

- 스토리에 있는 각각의 시트들은 story point라고 한다.

 

 

Domain 4: Tableau Server

 

🐣 Tableau Online

- 관리자가 데이터 소스 및 작업자들을 관리하는데 유용하다.

- DB에서 데이터를 관리하고, 변경하는데 유용하다.

- Sign in > Tableau Online > 로그인

- 데이터 원본을 서버에 게시하고, 읽기 권한이 있는 모든 사람이 액세스하도록 관리할 수 있다.

- 누가 데이터 엑세스가 있는지 없는지 view, interact, edit 등등 다양한 방법으로 컨트롤 가능

- 클라우드와 같은 기능으로 고장에 시간을 낭비할 필요가 없고, 장비를 구축할 필요가 없어 시간과 비용을 절약할 수 있다.

 

🐣 .twb: 통합문서, .twbx: 패키지 통합문서

- twb는 시각화가 있지만 데이터는 없다.(데이터 소스는 있지만 원본은 없는 것) 사용된 데이터를 로컬에 가지고 있는 경우 바로 액세스 가능

- twbx는 twb에 데이터까지 모두 포함된 버전으로, 공식문서에서는 twbx를 best 형식으로 추천

- 태블로 퍼블릭에도 twbx 형식으로 업로드

 

🐣 .hyper, .tde: 추출을 로컬에 저장하는 형식

- hyper가 기본 형식인 버전의 경우, tde로 만들 수 없다.

- 데이터가 커서 추출이 끊어지는 경우에 hyper나 tde를 사용해서 다시 연결할 수 있다.

- data > data source > use extract에 체크가 되어있다면 hyper, tde가 존재한다는 것

- 동일한 데이터로 hyper, tde를 여러개 만들 수 있다.

 

🐣 .tds, .tdsx

- data - data source - add to saved data sources - tds, tdsx로 저장

- .tds: 실제 데이터가 아니라 실제 데이터에 연결하는데 필요한 정보와 기본 속성 변경, 계산된 필드 만들기, 그룹 추가 등 실제 데이터를 기반으로 수행한 모든 수정 내용을 포함, 시각화는 포함하지 않음

- 전처리는 같이 한 뒤에 각자 다른 시각화를 만들고 싶을 때 사용

- .tdsx: tds + hyper or tde, 텍스트, 엑셀 등 로컬 파일 데이터도 포함하는 zip 파일(tdsx는 tds의 모든 것을 포함한다.)

 

 

 


 

 

소감 및 정리

4주동안의 태블로 수업이 오늘 끝났다. 그동안 정말 태블로의 기초부터 포함해서 기능적으로는 초보를 갓 벗어나 어느정도 자유롭게 구현할 수 있는 수준까지 성장했고, 마지막 주에는 기능이 아닌 이론까지 다뤄보면서 이제 어디가서 태블로 좀 써봤다! 아예 모르지는 않는다! 라고 말할 수 있게 된 것 같다. 돌아보면 반복적인 프로젝트로 하루하루가 힘들고 TIL 작성할 시간도 모자랄만큼 할 일이 많았지만, 기능적으로도 성장하고 또 데이터를 보는 다른 시각도 갖게 된 것 같다. 원래 논리적이고, 수치적으로 정확한 것을 좋아하는 성격이라 번뜩이는 아이디어 같은 것은 내기 힘들었지만, 그래도 그래프를 이런 저런 시각으로 살펴보고 해석하는 능력의 성장은 확실히 느껴진다. 다음 주 SQL 수업도 기대가 된다🔥