일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터프레임
- Til
- DataFrame
- 시각화
- Leetcode
- 유데미부트캠프
- 그리디 알고리즘
- Tableau
- 백준
- 데이터분석
- pandas
- 파이썬
- 판다스
- 유데미큐레이션
- 브루트포스 알고리즘
- 데이터시각화
- 취업부트캠프
- 데이터드리븐
- python
- 유데미코리아
- 정렬
- 넘파이
- 코딩테스트
- ndarray
- 유데미
- 스타터스부트캠프
- 부트캠프후기
- matplotlb
- numpy
- 태블로
- Today
- Total
목록태블로 (59)
Diary, Data, IT

0. 분석 계기 데이터를 완벽하게 파악하고 그 속에 담겨있는 문제점을 해결하는 역량을 기르기 위한 목적으로 프로젝트를 진행했다. 구체적으로 태블로 기본 데이터인 가상 슈퍼스토어의 판매 데이터를 이용하여 수익 개선 방안을 도출하는 과제였다. 1. 분석 아이디어 먼저 다양한 관점에서 데이터를 살펴보며, 특정 요소에 따라 수익이 부진한 경우가 있는지 탐색했다. 그 결과 지역별 수익 차이가 크다는 사실을 확인할 수 있었다. 특히 위 그래프에서 Central 지역의 경우 매출은 South보다 높지만 순이익은 South보다 낮아 수익 개선이 필요하다는 것을 알 수 있다. 따라서 지역에 초점을 맞추어 분석하고, 구체적으로 특정 지역에서만 수익을 내지 못하고있는 제조업체들과 해당 업체 상품의 수익 부진의 원인을 찾아 ..

0. 분석 계기 웅진 STARTERS 활동의 하나로서, Airbnb의 서비스 개선을 도모하는 전략을 제시하는 컨설턴트라는 컨셉으로 프로젝트를 진행했다. 프로젝트에는 미국 Airbnb의 객실 데이터를 활용했다. 1. 아이디어 도출 Airbnb(에어비앤비)의 객실 정보를 활용하여 현재 좋은 서비스를 제공하고 있는 '우수 객실'과, 서비스가 좋지 못한 '관리가 필요한 객실'(이하 관리객실)을 정의할 수 있다면, 해당 객실들에 추가적인 benefit과 penalty를 가하여 에어비앤비의 전체적인 서비스 개선을 이끌어낼 수 있다고 생각했다. 이를 위해 객실을 공정하게 평가할 수 있는 '객실 점수'를 정의할 필요가 있었다. 보유한 데이터에서 객실 점수를 정의하기 위해 활용한 정보들은 다음과 같다. 1. 리뷰 수 2..

[TIL] 54일차 TIL(20230421) - SQL, Tableau 개념 정리 📗 Tableau 개념 정리 ✅ 태블로 파일 형태 - tde, hyper: 데이터 추출 파일 - tds: 태블로에서 데이터를 수정한 내용, 계산된 필드, 그룹 등(데이터 소스 파일) - tdsx: tds + tde(hyper) - twb: 시각화 + 데이터 수정 내용(tds) - twbx: 시각화 + 데이터 수정 내용(tds) + tde(hyper) ✅ MoM/MTD 함수 1) MoM: 전월대비 증감률 (sum(if datediff(‘month’,[Order Date],today())=1 then [Profit] END) /sum(if datediff(‘month’,[Order Date],today())=2 then [Pr..

유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 11주차 학습 일지 11주차 학습내용 📗 SQL 고객분석 ✅ Decil 분석 1. 고객의 총 매출액 기준으로 정렬하고, 상위부터 10%씩 나누어 10개의 그룹을 할당한다. 2. decil별 매출합계, decil별 구성비, decil별 구성비 누계를 확인한다. 각각의 그룹으로 나눈 뒤 현황을 살펴, 그룹별 전략을 다르게 세우는 등 활용할 수 있다. 고객을 10개의 그룹으로 나누기 위해 ntile함수를 사용했다. ntile(나눌 group 수) over(partition by ~ order by ~) -- 고객별 매출액을 기준으로 decil 생성 customers_amount_decil AS ( SELECT customer_id, sum(am..

Domain 1: Connecting to and Preparing Data 🐣 태블로 Repository 태블로 관련 문서가 저장되는 기본 폴더: Document->My tableau Repository 위 폴더 내부에 shapes 등 태블로에서 사용되는 모든 정보에 대한 내용이 담겨있다. 🐣 Dimension and Measure - numeric, quantitive는 measure, categorical, qualitive는 dimension - dimension은 이름, 날짜, 지역 등을 포함한다. dimension을 이용하여 범주, segment, 세부 정보 등으로 사용할 수 있다. - measure를 dimension으로 바꾸는 것은 가능 - green: continuous(연속형), blu..

[TIL] 53일차 TIL(20230420) - SQL 미니 프로젝트 2 📗 SQL 미니 프로젝트 ✅ 분석 개요 ✅ 물류창고 지역 선정 전날 추출한 전체 데이터를 바탕으로 먼저 물류창고를 신설할만한 지역을 찾기 위한 분석을 진행했다. 먼저 지역별 매출 발생 현황을 살펴보고, 이와 더불어 운임비와 평균 배송 소요기간을 살폈다. select customer_state, sum(sum_price) sum_state_sales, round(avg(sum_freight_value)::numeric, 2) avg_state_freight_value, round(avg(sum_배송소요기간)::numeric, 2) avg_배송소요기간 from cte_state_order_sales group by 1 order by ..

[TIL] 51일차 TIL(20230418) - SQL RFM 분석, 재구매율, 이탈률 분석 📗 RFM 분석 ✅ 분석 개요 - 구매 가능성이 높은 고객을 식별하기 위한 데이터 분석 방법 - 마케팅에서 사용자 타겟팅을 위한 방법 - Recency: 얼마나 최근에 구매했는가? (최근에 구매한 고객이 추후 구매 확률이 더 높다고 가정) - Frequency: 얼마나 빈번하게 구매했는가? - Monetary: 얼마나 많은 금액을 지불했는가? - R > F > M 순으로 비중을 둔다. - 집계 기간을 어떻게 설정할 것인지 고려할 필요가 있다. ✅ 분석 방법 1. 먼저 recency, frequency, monetary를 구한다. SELECT customer_id, max(max(order_date)) over()..

[TIL] 50일차 TIL(20230417) - SQL 고객분석 📗 고객 분석 ✅ 국가별 고객 수, 누적 합계 - 고객 수로 내림차순 정렬하되, 고객 수가 동일한 경우 국가명으로 오름차순 정렬 SELECT *, sum(고객수) over(ORDER BY 고객수 DESC, country) 누적합계 FROM (SELECT country, count(country) 고객수 FROM customers GROUP BY country ORDER BY count(country) desc, country) c1 sum(고객수) over(order by 고객수 desc, country)를 통해서 구할 수 있었는데, order by는 어떤 기준으로 집계할 것인지에 대한 의미와 어떤 순서로 집계할 것인지에 대한 내용까지 내포..