일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- python
- DataFrame
- 파이썬
- 태블로
- 브루트포스 알고리즘
- 데이터프레임
- 백준
- ndarray
- 코딩테스트
- 데이터시각화
- 판다스
- Til
- matplotlb
- 유데미코리아
- pandas
- 그리디 알고리즘
- 시각화
- 유데미큐레이션
- 데이터드리븐
- Tableau
- 스타터스부트캠프
- 취업부트캠프
- Leetcode
- 부트캠프후기
- 넘파이
- 유데미
- 데이터분석
- numpy
- 정렬
- 유데미부트캠프
- Today
- Total
목록분류 전체보기 (95)
Diary, Data, IT

데이터 시각화 - PLOTLY 0. plotly - 인터렉티브한 그래프를 그릴 수 있는 라이브러리입니다. - dict 형식으로 명령어를 작성합니다. - 다양한 방식으로 export가 가능합니다. - 한글 폰트를 기본으로 지원해줍니다. plotly에서 그래프를 그리는 방식은 여러가지가 존재합니다. 그래프를 그리기 전에 plotly에서 일반적으로 사용하는 패키지들을 모두 불러와줍니다. import plotly.io as pio # Plotly input output import plotly.express as px # 빠르게 그리는 방법 import plotly.graph_objects as go # 디테일한 설정 import plotly.figure_factory as ff # 템플릿 불러오기 from p..

데이터 시각화 - Seaborn 0. Seaborn - Matplotlib를 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지 - 기본적인 시각화 기능은 matplotlib 패키지에 의존하며 통계 기능은 statsmodels 패키지에 의존 - 함수가 쉬우며 직관적으로 결과를 확인할 수 있습니다. import seaborn as sns #seaborn 라이브러리 로드 - Seaborn 그래프의 기본 설정 seaborn에서는 sns.set()을 통해 기본 환경변수를 설정할 수 있습니다. 스타일, 팔레트, 글꼴 등 앞으로 그리게 되는 모든 플롯의 그림에 영향을 주는 설정입니다. ex) sns.set_theme(style = 'whitegrid') #그래프 배경의 기본 테마를 변경할 수..

데이터 시각화 - Matplotlib 0. Matplotlib - 파이썬의 대표적인 과학 계산용 그래프 라이브러리입니다. - 판다스에 연계되어있어 사용하기 편리합니다. Matplotlib 라이브러리는 보통 아래와 같은 코드로 불러옵니다. #기본 import 라이브러리 import matplotlib as mpl # 기본 설정 만지는 용도 import matplotlib.pyplot as plt # 그래프 그리는 용도 import matplotlib.font_manager as fm # 폰트 관련 용도 - 한글 폰트 설정 Matplotlib는 기본적으로 한글 폰트를 지원하지 않기 때문에 따로 설정해주어야 합니다. 1) matplotlib에서 사용할 수 있는 폰트를 담아두는 위치를 찾아 해당 위치에 사용할 ..

Pandas 완전정복2 - 데이터 변형, 병합, 정규표현식 조건 1. Group by를 통한 데이터 변형 특정 칼럼의 값들을 기준으로 데이터를 재정렬하거나 연산하고 싶을 때 group by를 이용합니다. df.groupby(묶음의 기준이 되는 칼럼명)[연산을 적용할 칼럼].적용받는 연산() import seaborn as sns tip = sns.load_dataset('tips') tip tip이라는 데이터에는 day라는 범주형 변수가 존재합니다. 요일(day)에 따른 총 지불액의 평균값을 구하고 싶다면 'day를 기준으로 groupby를 진행하고 total_bill 변수에 mean 연산을 적용해주면 됩니다.' 이를 코드로 구현하면 아래와 같습니다. #요일(day)에 따른 총 지불액의 평균값 #기준 칼..

Pandas 완전정복1- DataFrame(데이터프레임) 0. Pandas란? - 많은 양의 데이터를 로드해서 분석하는데 최적화된 패키지이며, 다양한 데이터 분석 함수를 제공합니다. - Numpy를 내부적으로 활용하기 때문에 Numpy를 같이 로드해줘야 합니다. - 다른 시스템에 쉽게 연결할 수 있어 활용도가 좋습니다. 1. Series와 DataFrame Series는 pandas의 1차원 배열 자료구조입니다. series = pd.Series([넣을 원소])를 이용하여 시리즈 데이터를 만들 수 있습니다. DataFrame(데이터프레임)은 여러개의 Series가 모여서 이루는 2차원 배열 구조이며, 인덱스(index), 변수(column), 값(value)로 이루어진 데이터입니다. 데이터프레임에는 넘파..

[Python] Numpy 완전정복2 - 연산, 벡터, 무작위, 수정 Numpy 완전정복1에 이어서 Numpy의 기초적인 문법에 대해 정리하고 자주 사용하게 될 유용한 함수들을 정리해두었습니다! 1. Numpy 연산 Numpy에서는 다양한 통계 연산 메소드들을 제공합니다. 이 메소드들로 데이터에 다양한 연산을 쉽게 수행할 수 있습니다. np.mean(변수명) #산술평균 np.average(변수명, weights = [원소별 가중치]) #가중평균 np.median(변수명) #중위수 np.cumsum(변수명) #누적합 np.std(변수명) #표준편차 np.var(변수명) #분산 np.min(변수명) #최솟값 np.max(변수명) #최댓값 np.sum(변수명) #원소들의 합 np.dot(변수명1, 변수명2) ..

Numpy 완전정복1 - ndarray 기초 파이썬을 사용하는 분석가, 개발자라면 무조건 사용하게 되는 필수 라이브러리인 Numpy의 기초적인 문법에 대해 정리하고 자주 사용하게 될 유용한 함수들을 정리해두었습니다! Numpy(넘파이)란? - Numeric + Python의 약자로 수학, 과학 연산에 필요한 함수를 제공하는 라이브러리 - 다차원 배열을 다룰 때 주로 사용합니다. (인공신경망, 비정형 데이터 처리, 자연어 처리) - 파이썬 기본 문법에 비해 연산 속도가 빠르고 함수를 활용해 더 간결한 코드 작성이 가능합니다. Numpy의 ndarray 다루기 넘파이에서는 파이썬 리스트와 비슷한 구조의 데이터 타입을 지원합니다. 이중 구조의 배열이나 행렬처럼 사용이 가능하며, 수학적 연산 또한 가능합니다. ..