일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 유데미코리아
- 넘파이
- 판다스
- 그리디 알고리즘
- 태블로
- 취업부트캠프
- 데이터분석
- ndarray
- 시각화
- matplotlb
- 브루트포스 알고리즘
- 파이썬
- 유데미
- 유데미큐레이션
- 유데미부트캠프
- 백준
- python
- numpy
- Tableau
- 정렬
- 데이터프레임
- DataFrame
- Til
- pandas
- 데이터드리븐
- 코딩테스트
- 스타터스부트캠프
- 부트캠프후기
- Leetcode
- 데이터시각화
- Today
- Total
목록STARTERS/TIL (53)
Diary, Data, IT

[TIL] 54일차 TIL(20230421) - SQL, Tableau 개념 정리 📗 Tableau 개념 정리 ✅ 태블로 파일 형태 - tde, hyper: 데이터 추출 파일 - tds: 태블로에서 데이터를 수정한 내용, 계산된 필드, 그룹 등(데이터 소스 파일) - tdsx: tds + tde(hyper) - twb: 시각화 + 데이터 수정 내용(tds) - twbx: 시각화 + 데이터 수정 내용(tds) + tde(hyper) ✅ MoM/MTD 함수 1) MoM: 전월대비 증감률 (sum(if datediff(‘month’,[Order Date],today())=1 then [Profit] END) /sum(if datediff(‘month’,[Order Date],today())=2 then [Pr..

[TIL] 53일차 TIL(20230420) - SQL 미니 프로젝트 2 📗 SQL 미니 프로젝트 ✅ 분석 개요 ✅ 물류창고 지역 선정 전날 추출한 전체 데이터를 바탕으로 먼저 물류창고를 신설할만한 지역을 찾기 위한 분석을 진행했다. 먼저 지역별 매출 발생 현황을 살펴보고, 이와 더불어 운임비와 평균 배송 소요기간을 살폈다. select customer_state, sum(sum_price) sum_state_sales, round(avg(sum_freight_value)::numeric, 2) avg_state_freight_value, round(avg(sum_배송소요기간)::numeric, 2) avg_배송소요기간 from cte_state_order_sales group by 1 order by ..

[TIL] 52일차 TIL(20230419) - SQL 미니 프로젝트 📗 SQL 데이터 분석 ✅ 데이터 분석 과정 1. 데이터 탐색 2. 분석 목적 설정 - 누구를 위한 분석인지, 대상을 정하고 대상에 알맞은 비즈니스 가치 창출을 위한 목적을 구체적으로 설정한다 ex) 고객 담당자, 효과적인 고객 관리 전략을 위한 데이터 분석 > 고객 세분화 3. 지표 설정 및 분석 계획 4. 데이터 추출/정제/가공/분석 5. 리포트 작성 📗 SQL 미니 프로젝트 ✅ 주제 선정 과정 데이터셋을 탐색하여 목표 배송 날짜보다 늦게 도착하거나, 배송 기간이 오래걸리는 주문들이 상당수 존재한다는 사실을 알게됐다. 또 이런 주문들은 주(State)의 영향이 존재한다는 사실을 파악하였다. 그렇다면 배송이 오래걸리고, 운임비가 높지..

[TIL] 51일차 TIL(20230418) - SQL RFM 분석, 재구매율, 이탈률 분석 📗 RFM 분석 ✅ 분석 개요 - 구매 가능성이 높은 고객을 식별하기 위한 데이터 분석 방법 - 마케팅에서 사용자 타겟팅을 위한 방법 - Recency: 얼마나 최근에 구매했는가? (최근에 구매한 고객이 추후 구매 확률이 더 높다고 가정) - Frequency: 얼마나 빈번하게 구매했는가? - Monetary: 얼마나 많은 금액을 지불했는가? - R > F > M 순으로 비중을 둔다. - 집계 기간을 어떻게 설정할 것인지 고려할 필요가 있다. ✅ 분석 방법 1. 먼저 recency, frequency, monetary를 구한다. SELECT customer_id, max(max(order_date)) over()..

[TIL] 50일차 TIL(20230417) - SQL 고객분석 📗 고객 분석 ✅ 국가별 고객 수, 누적 합계 - 고객 수로 내림차순 정렬하되, 고객 수가 동일한 경우 국가명으로 오름차순 정렬 SELECT *, sum(고객수) over(ORDER BY 고객수 DESC, country) 누적합계 FROM (SELECT country, count(country) 고객수 FROM customers GROUP BY country ORDER BY count(country) desc, country) c1 sum(고객수) over(order by 고객수 desc, country)를 통해서 구할 수 있었는데, order by는 어떤 기준으로 집계할 것인지에 대한 의미와 어떤 순서로 집계할 것인지에 대한 내용까지 내포..

[TIL] 49일차 TIL(20230414) - SQL Z차트, 그룹함수(grouping sets, roll up) 📗 Z차트 ✅ Z차트 구성요소 - 월별매출, 매출누계, 이동년계를 이용해 Z형태의 차트를 그린다. - 매출누계: 해당 월 매출에 이전 월까지 매출 누계 - 이동년계: 해당 월의 매출에 과거 11개월의 매출을 합한 값(최근 1년차 누적 합계) - 월별매출과 매출누계를 통해 단기적 추이를 확인하고, 이동년계를 이용해 장기적 추이를 확인할 수 있다. -- 월별매출, 매출누계, 이동연계 WITH ym_sales AS ( SELECT to_char(o.order_date, 'yyyy-mm') order_ym, sum(od.quantity * od.unit_price * (1-od.discount))..

[TIL] 48일차 TIL(20230413) - SQL 제품/카테고리 매출 지표 분석, PIVOT 📗 제품/카테고리 매출 지표 분석 ✅ 제품별 매출액/순위 -- 제품별 매출액 순위 테이블 WITH cte_product_sale AS ( SELECT o.order_id, o.customer_id, o.order_date, to_char(order_date, 'YYYY') order_year, to_char(order_date, 'MM') order_MONTH, to_char(order_date, 'DD') order_DAY, TO_CHAR(ORDER_DATE, 'QUARTER') order_QUARTER, od.unit_price, od.quantity, od.discount, (od.unit_price ..

[TIL] 47일차 TIL(20230412) - SQL CTE, WINDOW 함수 📗 임시테이블, CTE ✅ 임시테이블 생성 임시 테이블은 현재 세션이 유지되는 동안만 존재하는 테이블로, 반복적으로 사용해야하는 쿼리가 있다면 해당 쿼리를 사용하여 테이블을 임시로 생성해둔 뒤 지속적으로 활용할 수 있다. 임시 테이블은 실제 테이블과 동일한 방식으로 사용 가능하다. (SELECT ~ FROM) CREATE TEMPORARY TABLE 테이블명 AS (QUERY ~) ✅ 공통테이블 표현식 CTE - 복잡한 쿼리문의 결과에 이름을 붙여 임시 테이블로 사용하는 방법 - 복잡한 쿼리문이 반복해서 사용될 때 유용하다. - 코드의 가독성, 재사용성을 높일 수 있다. - 일회용이므로 재사용하려면 코드를 저장해두어야 하며..