일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 코딩테스트
- 브루트포스 알고리즘
- pandas
- 데이터시각화
- 시각화
- 데이터프레임
- 태블로
- 정렬
- 데이터드리븐
- 유데미큐레이션
- 데이터분석
- 파이썬
- 부트캠프후기
- Leetcode
- 백준
- numpy
- 그리디 알고리즘
- 스타터스부트캠프
- Tableau
- matplotlb
- python
- DataFrame
- ndarray
- 넘파이
- 유데미코리아
- 취업부트캠프
- 유데미
- 유데미부트캠프
- Til
- 판다스
- Today
- Total
Diary, Data, IT
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 6주차 학습 일지 본문
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 6주차 학습 일지
6주차 학습내용
프로젝트1 - Region Manager를 위한 대시보드 제작
Q. Region Manager, 데이터를 잘 다루기 어려운 사람들을 위한 대시보드를 만들어주세요. 매니저들이 담당하는 지역이 다르기 때문에, 지역별 데이터를 확인할 수 있는 매개변수 설정이 필요합니다. 대시보드를 통해 자기가 얼마나 매출을 올렸는지 알 수 있도록 만들어주세요.
지역 담당자의 실적을 확인하기 위한 대시보드를 '월별 실적'에 초점을 맞춰 구성하였다. '월별 실적'을 중심으로 한 이유는 지역 담당자들이 실적을 확인하고 반영할 수 있도록 하기에 일별은 너무 짧고, 분기는 너무 길며 월이 적당하다고 판단했기 때문이다. 대시보드에는 지역별 필터를 통해 담당 지역의 실적을 확인할 수 있도록 변경할 수 있고, 년/월별 필터를 통해 전월 대비 실적의 추이를 비교할 수 있도록 설정했다. 구체적으로 확인할 수 있는 정보들은 다음과 같다.
1. 월별 매출/순이익/고객 수
- 대시보드 상단에 가장 중요한 실적의 직접적인 수치인 매출, 순이익, 고객 수를 배치하여 월별 실적을 한 눈에 확인할 수 있도록 하였다.
- MoM(%): 전월 대비 증감 비율을 통해 이달의 성과를 판단할 수 있다
2. 고객당 매출액
- 단순 고객 수보다 어떤 고객을 보유하고 있는지, 큰 금액을 구매하는 고객이 많은지, 적은 금액을 구매하는 고객이 많은지아는 것이 더 중요하다고 생각해 고객당 매출액을 확인하여 객단가를 높이는 전략을 세울 수 있도록 구성했다.
3. 지역별 순이익률 순위
- 타 지역과 비교하여 담당 지역이 얼마만큼의 이익률을 거뒀는지 순위와 수치를 나타냈다. 비교를 통해 충분히 잘 했는지, 부진했는지 직접적으로 확인할 수 있다.
4. 지역별 순이익률
- 담당 지역 내에서 구체적인 주별 순 이익률을 확인하여, 타 지역과 비교하여 실적이 저조한 주를 식별하고 부진한 주를 주시하는 등 주별 성과를 관리할 수 있다.
5. 매출 대비 순이익률 추세
- 매출에서 순이익이 차지하는 비율을 확인할 수 있다.
- 지난 시점들에 대비하여 최근에 어떻게 변화하고 있는지 확인할 수 있는 그래프로, 시간 필터를 추가하여 지정한 일자들에 따른 매출과 순이익의 추세를 확인할 수 있다. 갑자기 큰 변동이 발생하거나 꾸준히 좋은 성적을 유지하고 있는지 등을 확인하여 추후 전략에 반영할 수 있다.
프로젝트2 - Airbnb 서비스 개선 프로젝트
Day1
Airbnb의 서비스 개선을 도모하는 컨설턴트라는 컨셉으로 프로젝트를 시작했다. 개선이 필요한 객실들과 이미 좋은 서비스를 제공하고 있는 객실들을 분석하여 대시보드에 나타내고, 서비스를 개선할 수 있는 전략을 세우는 과제였다.
좋은 객실의 기준은 1. 평점개수가 많을 것, 2. 평점이 높을 것으로 설정하고,
나쁜 객실의 기준은 1. 가격이 높을 것, 2. 평점이 낮을 것으로 설정했다.
또한 여러 객실을 운영하고 있는 호스트들 중 서비스가 미흡한 경우, 서비스의 질을 향상시킨다면 더 많은 매출을 가져다 줄 잠재성이 있다고 판단하여 이에 해당하는 호스트들을 찾고자 했다.
좋은 객실을 선정하기 위한 구체적인 객실 점수를 만들었는데, 이 식은 리뷰 수*리뷰 평점/운영기간(월)로 정했다.
운영 기간이 길어질수록 리뷰의 수가 많아질 수 있기 때문에, 기간의 영향을 줄여 객관적인 지표를 얻기 위해 월로 나눠준 것이다.
Day2
전날 완성했던 대시보드에 대한 피드백을 바탕으로 대시보드의 기능과 내용을 수정하는 과정을 거쳤다. 받았던 피드백과 수정사항은 다음과 같다.
1. 대시보드를 통해 해당 데이터가 어디에 위치하고 있는지 알아볼 수 있는 직관이 중요한데, 테이블을 누르면 지도에 표시해주는 동작을 설정해 준 부분이 좋았다.
2. score를 사용할 때는 100점이 만점인 것으로 변환해야 알아보기 쉽다.
3. 이중 축을 사용한 그래프가 많아서 해석이 쉽지 않다. 사용자가 바로 이해하기 쉽도록 부연설명을 텍스트로 달아주는 것이 좋다.
4. 운영 기간을 계산할 때 가장 최근 날짜를 고정해서 사용한 것은 지금은 문제가 없지만, 데이터가 업데이트 된다면 문제가 발생할 수 있는 부분이다. 이를 자동화하는 것이 좋다.
1. 객실 점수 100으로 환산/운영 기간 분기단위로 변경
객실 점수의 max를 100점으로 환산하여 변환하였고, 기존 스코어는 운영 일자를 '월' 기준으로 나누어 산출하였는데, 월을 기준으로 하면 기간에 대한 페널티가 강하게 들어가 이를 완화하여 ‘분기’를 기준으로 수정했다.
객실 점수를 100점으로 환산하기 위해 각 점수를 전체 데이터에서 가장 큰 점수로 나눠주는 방식을 사용했는데, 이를 위해 차원에 관계없이 max값을 고정해주는 LOD(FIXED)를 사용했다.
2. 날짜 자동화 설정
기간에 대한 페널티를 구하기 위해 만들었던 ‘DATEDIFF’ 필드에서 기존에 고정해주고 사용했던 #2015-08#을 {FIXED : MAX([HOST SINCE])}를 이용해 가장 최근 날짜가 바뀌더라도 자동적으로 변경될 수 있도록 설정하였다.
3. 평균 수평선 추가
막대와 원을 통해 여러 객실을 운영하는 호스트들의 상대적인 운영 현황을 알기 위한 그래프에 평균 수평선을 추가했다. 평점의 평균 수평선을 통해 관리 대상 호스트를 수평선을 기준으로 낮은 평점을 보유하며, 많은 객실을 운영하고 있는 호스트로 명확하게 선별할 수 있도록 하였다.
Day3 / Day4
피드백을 받아 추가적으로 수정하고 보고서를 작성했다. 수정사항과 완성한 보고서에 대한 발표 내용은 다음과 같다.
수정사항 1.
지역별 필터를 객실 점수에도 걸어서 지역별 순위를 지도와 같이 확인할 수 있도록 하는 기능을 추가했다. 필터를 통해 동일 지역 내에서의 상대적인 순위를 비교할 수 있다.
수정사항 2.
기존에 호스트별 룸 개수와 호스트별 객실 점수의 평균을 동시에 나타냈던 그래프는 해석이 쉽지 않았고, 2가지 정보를 통해 알 수 있는 점이 다소 명확하지 않다고 판단했다. 따라서 보다 정확하게 해석할 수 있도록 그래프를 수정했다. 그래프는 10개 이상의 객실을 동시에 운영하는 멀티 호스트들의 평균 리뷰 점수를 나타낸 것으로, 평균 리뷰 점수보다 낮은 멀티 호스트들에게 관리가 필요함을 시사한다.
목표: 에어비앤비 뉴욕 지역의 우수 객실과 미흡 호스트를 효율적으로 관리
현황:
1) 우수 객실을 파악하기 위해 평점과 객실당 리뷰 개수의 현황을 살펴본 결과, 5개 이하의 리뷰 개수를 보유한 객실은 전체의 95%를 차지하여 이러한 객실의 경우 품질을 객관적으로 평가하기에 적합하지 않다고 판단(자료 1)
따라서 리뷰 갯수와 평점, 운영 기간을 종합적으로 고려한 '객실 점수' 라는 새로운 스코어 지표를 정의하고 이를 통해 우수 객실을 판단하고자 함
2) 서비스가 미흡한 호스트를 선정하기 위해 호스트당 운영 객실 개수의 비율을 살펴본 결과, 2개 이상의 객실을 운영하는 멀티호스트는 31.28%로 적은 비중을 차지하고 있지만 전체 매출에서 40.88%를 차지하고 있음. 즉 2개 이상의 객실을 운영하는 멀티 호스트 중 운영이 미흡한 소수의 호스트를 모니터링한다면 효율적으로 수익 개선을 도모할 수 있다고 판단(자료 2)
대시보드 설명 및 해석:
1. Best Performing Rooms
‘객실 점수’를 통해 운영을 잘 하고 있는 객실을 도출, 해당 차트의 상단에 위치한 객실들을 우수하다고 판단할 수 있으며 해당 객실들에게 높은 순위를 오래 유지하는 경우 수수료 감면 등의 혜택을 주거나, Airbnb 숙소 추천에 게시하는 등의 방안을 통해 이용자들에게 더 나은 서비스를 제공할 수 있을 것으로 기대
2. Least Performing Hosts
여러 객실을 운영하고 있는 멀티 호스트 중 서비스가 미흡한 호스트들을 도출, 10개 이상의 숙소를 운영하고 있는 멀티 호스트들을 대상으로 평균 리뷰 점수가 낮은 호스트들을 집중적으로 관리. 해당 호스트들에게 서비스 개선을 요청하여 여러 객실의 서비스를 같이 향상시킨다면 효율적으로 관리할 수 있을 것으로 기대
6주차 학습후기
태블로 오프라인 강의를 시작했다. 강의를 통해 스스로 학습하는 시간을 갖는 것도 좋았지만, 매일매일 프로젝트를 수행하며 직접 부딪혀보면서 하루하루 태블로 활용능력이 늘어가는게 느껴져서 뿌듯했던 한 주였다. 하지만 그만큼 힘들기도 했다. 프로젝트의 특성상 단순히 기능을 구현하는 것 이외에도 문제를 해결하기 위한 최적의 결과를 열심히 고민하며 찾아야하는데 매일매일 수행하다보니 조금 힘든면도 있었다. 그래도 그만큼 확실히 얻는건 많았던 것 같아서 좋았다. 그리고 프로젝트를 하면 시간이 너무 빨리가서 하루에 4-5시간정도 시간이 있었음에도 고민할 내용이 계속 생겨나서 아쉬운 점도 있었다. 이번 주에 배웠던 내용들을 교훈삼아 다음 주에는 시행착오를 조금 더 줄이고, 처음부터 데이터에 대해 올바르게 파악한 뒤 분석을 진행해서 더 좋은 결과들을 도출해내고 싶다.
다음 주 보완사항
태블로를 통해 데이터를 탐색하는 능력을 길러야겠다는 생각을 했다. 시각화 이외에도 모든 분석 과정을 헤매지않고 진행할 수 있을 정도가 되어 다음 주에 진행하는 프로젝트는 더 매끄럽게 수행할 수 있도록 할 것이다.
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'STARTERS' 카테고리의 다른 글
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 8주차 학습 일지 (1) | 2023.04.02 |
---|---|
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 7주차 학습 일지 (0) | 2023.03.26 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 5주차 학습 일지 (0) | 2023.03.12 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 4주차 학습 일지 (0) | 2023.03.03 |
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 3주차 학습 일지 (0) | 2023.02.26 |