일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 유데미
- 브루트포스 알고리즘
- 그리디 알고리즘
- 정렬
- 데이터시각화
- pandas
- 취업부트캠프
- 판다스
- 데이터분석
- numpy
- 유데미코리아
- 유데미부트캠프
- 넘파이
- 스타터스부트캠프
- 데이터프레임
- Tableau
- python
- 시각화
- 데이터드리븐
- 백준
- 부트캠프후기
- matplotlb
- 유데미큐레이션
- ndarray
- 파이썬
- DataFrame
- 코딩테스트
- Leetcode
- 태블로
- Til
- Today
- Total
목록pandas (2)
Diary, Data, IT

Pandas 완전정복2 - 데이터 변형, 병합, 정규표현식 조건 1. Group by를 통한 데이터 변형 특정 칼럼의 값들을 기준으로 데이터를 재정렬하거나 연산하고 싶을 때 group by를 이용합니다. df.groupby(묶음의 기준이 되는 칼럼명)[연산을 적용할 칼럼].적용받는 연산() import seaborn as sns tip = sns.load_dataset('tips') tip tip이라는 데이터에는 day라는 범주형 변수가 존재합니다. 요일(day)에 따른 총 지불액의 평균값을 구하고 싶다면 'day를 기준으로 groupby를 진행하고 total_bill 변수에 mean 연산을 적용해주면 됩니다.' 이를 코드로 구현하면 아래와 같습니다. #요일(day)에 따른 총 지불액의 평균값 #기준 칼..

Pandas 완전정복1- DataFrame(데이터프레임) 0. Pandas란? - 많은 양의 데이터를 로드해서 분석하는데 최적화된 패키지이며, 다양한 데이터 분석 함수를 제공합니다. - Numpy를 내부적으로 활용하기 때문에 Numpy를 같이 로드해줘야 합니다. - 다른 시스템에 쉽게 연결할 수 있어 활용도가 좋습니다. 1. Series와 DataFrame Series는 pandas의 1차원 배열 자료구조입니다. series = pd.Series([넣을 원소])를 이용하여 시리즈 데이터를 만들 수 있습니다. DataFrame(데이터프레임)은 여러개의 Series가 모여서 이루는 2차원 배열 구조이며, 인덱스(index), 변수(column), 값(value)로 이루어진 데이터입니다. 데이터프레임에는 넘파..