일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 유데미코리아
- 시각화
- matplotlb
- 백준
- 부트캠프후기
- 데이터프레임
- pandas
- DataFrame
- 데이터분석
- 브루트포스 알고리즘
- 데이터시각화
- 정렬
- 파이썬
- python
- 유데미큐레이션
- Til
- ndarray
- 데이터드리븐
- Leetcode
- 유데미
- 스타터스부트캠프
- 넘파이
- numpy
- 태블로
- 판다스
- 그리디 알고리즘
- 유데미부트캠프
- 코딩테스트
- 취업부트캠프
- Tableau
- Today
- Total
목록STARTERS/TIL (53)
Diary, Data, IT

[TIL] 13일차 TIL(20230222) - ggplot, 가설검정, 상관계수 1. qplot - 빠르게 데이터 시각화 할 때 사용 - qplot(data=‘사용할 데이터 변수명’, x=‘data에서 x축에 사용할 변수’, y =‘data에서 y축에 사용할 변수’) - geom요소를 추가하여 그래프의 종류 지정(지정하지 않으면 산점도 출력) - aes(col = column) 요소를 추가하여 컬럼별로 구분하고 색을 달리하여 출력할 수 있음 2. ggplot ggplot(data, aes(x = x축, y = y축, col(점, 선 그래프에 사용), fill(막대 그래프, 히스토그램 등에 사용)) + geom_point()/geom_line() # 그래프의 종류를 명시 - ggplot내에 명시하면 이어..

[TIL] 12일차 TIL(20230221) - 데이터 전처리, 시각화, dplyr 1. 산술 연산자 - ^: 제곱 연산자 - %%: 나머지 연산자 - %/%: 몫 연산자 2. 논리 연산자 - R에서는 logical 값들을 벡터화시켜 논리 연산에 적용 가능 - &: AND, 벡터일 경우 원소단위로 개별연산하여 각각의 결과를 모두 출력 &&: 벡터일 경우 첫번째 원소간의 연산결과를 출력 - |: OR, 벡터일 경우 원소단위로 개별연산하여 각각의 결과를 모두 출력 ||: 벡터일 경우 첫번째 원소간의 연산결과를 출력 3. 산술 함수 - prod(vector): 입력 벡터들의 곱셈 값 출력 - factorial(n): 1부터 입력값까지의 팩토리얼 값 출력 - abs(vector): 입력값들의 절대값 출력 - r..

[TIL] 11일차 TIL(20230220) - R 기초 1. working directory 설정 - getwd() : 현재의 wd확인 - dir() : wd 내의 자료들 확인 - setwd('경로'): 경로를 입력하여 새로운 wd지정 2. 단축키 모음 - Ctrl + S : 파일 저장 - Ctrl + O : 파일 불러오기 - Ctrl + Shift + N: 새 소스파일 - Ctrl + Shift + C: 코드 주석화 - Ctrl + Shift + Enter: 소스코드 실행 - Shift + Alt + K: 모든 단축키 확인 3. 데이터 타입 - 숫자형(Numeric): 숫자를 나타내는 데이터 타입, 실수형 타입이지만 정수를 입력해도 우선 Numeric으로 처리 - 정수형(Integer): 정수값만을 ..

[TIL] 10일차 TIL(20230217) - VIEW, RANK, ROLL UP, 공공데이터를 이용한 SQL 실습 1. VIEW - 자주 사용하는 쿼리문을 수행한 결과를 가상의 테이블로 저장해두고 사용할 수 있음 - CREATE OR REPLACE VIEW 뷰이름(뷰 칼럼1, 뷰 칼럼2, ...) AS SELECT ~ FROM ~ - SELECT 구문 그대로 사용, SELECT할 칼럼의 이름들을 위에 명시하는 것(선택사항) -- 세 테이블을 합한 새로운 VIEW 생성 CREATE OR REPLACE VIEW V_ORDERS AS SELECT ORDERID, O.CUSTID, USERNAME, O.BOOKID, SALEPRICE, ORDERDATE FROM CUSTOMER C, ORDERS O, BOO..

[TIL] 9일차 TIL(20230216) - 집계함수, 문자열/날짜 자료형, 서브쿼리, JOIN 1. SQL 내장함수 - POWER(숫자, 제곱): 숫자를^제곱하여 반환 - ROUNT(값, 소수점): 소수점 몇자리까지 표현할지 지정 - MOD(값1, 값2): 값1을 값2로 나눈 나머지 - CEIL : 자신보다 큰 정수 중에서 가장 작은 수를 반환 - FLOOR : 자신보다 작은 정수 중에서 가장 큰 정수를 반환 - GREATEST(숫자1,숫자2,...) 주어진 수 중 제일 큰 수 반환 - LEAST(숫자1,숫자2,...) 주어진 수 중 제일 작은 수 반환 1.1 집계함수 - 내장함수들 중 결과를 통계적으로 계산하고 집계하는 함수들이 존재 - AVG(col): 칼럼의 평균값 반환 NULL값이 있는 경우 ..

[TIL] 8일차 TIL(20230215) - DBMS이론 및 SQL기초, 조건절 1. 데이터베이스 - 목적에 맞도록 관련된 데이터를 저장하고 처리하기 위한 방법 - 동시성: 여러 명의 사용자가 동시에 접근 가능 - DBMS: 데이터베이스를 관리/운영하는 역할, 동시 사용 가능한 데이터 저장공간을 위한 시스템 - 관계형 DBMS(RDBMS)는 정형화된 키, 값의 테이블의 집합, SQL언어를 통해 처리할 수 있음 2. 데이터베이스의 기능적 특징 - 데이터 정의: 데이터의 구조를 정의하고 데이터 구조에 대한 삭제 및 변경기능을 수행 - 데이터 조작: 데이터를 조작하는 소프트웨어(응용 프로그램)가 요청하는 데이터의 삽입, 수정, 삭제 작업을 지원 - 데이터 추출: 사용자가 조회하는 데이터 혹은 응용 프로그램의..

[TIL] 7일차 TIL(20230214) - 데이터 전처리 및 다중막대그래프 1. 데이터프레임 문자열 전처리 - df[column].str[0]: 칼럼의 각 문자열(리스트)의 첫번째 값 가져오기 - df[column].str.find('찾을 문자열'): 해당 문자열이 존재하면 시작 인덱스를 반환, 없으면 -1 - find를 이용해서 df[df[column].str.find('찾을 문자열') > 0]을 하면 원하는 문자열을 포함한 행만 가져올 수 있음 ex) ,가 포함된 숫자 칼럼을 int형으로 바꾸기 - df[col].str.replace(',','').astype('int64') - replace를 통해 ,를 제거해주고 int형으로 바꿔줄 수 있음 2. 결측치가 아닌 행 추출 - df[df[col]...

[TIL] 6일차 TIL(20230213) - 데이터 시각화 및 활용 1. 그래프 꾸미기 옵션 1.1 수평선, 수직선 - plt.axhline(y좌표, x축시작위치, x축끝위치): 수평선 그리기, 전체를 1이라고 했을 때의 상대적인 위치를 지정 plt.hlines(y좌표, x축시작좌표, x축끝좌표) - plt.axvline(x좌표, y축시작위치, y축끝위치): 수직선 그리기, 전체를 1이라고 했을 때의 상대적인 위치를 지정 plt.vlines(x좌표, y축시작좌표, y축끝좌표) 1.2 텍스트, 화살표 그리기 - plt.text(x좌표, y좌표, 텍스트) ha: 텍스트 박스의 수평 옵션(left, center, right)/va: 텍스트 박스의 수직 옵션(bottom, center, top) bbox = ..