본문 바로가기

Python

(36)

Python Day 20 - Machine Learning part 01. numpy ◎ Numpy ○ Imports import numpy as np import pandas as pd import seaborn as sns ○ np.ndarray arr = np.ones(shape=(2,3)) # 모든 원소의 값이 1.0인 (2, 3) 모양의 배열 print(arr) >> [[1. 1. 1.] [1. 1. 1.]] arr.dtype # 배열의 원소들의 데이터 타입 >> dtype('float64') arr.shape # 모양(shape) : 배열의 각 축(axis)을 따라서 있는 원소의 개수 -> tuple >> (2, 3) arr.ndim # 차원(dimension) : 배열의 축의 개수. >> 2 arr.size # 크기 : 배열의 원소 전체 개수. >> 6 arr = np.ara..

Python Day 19 - JSON ◎ JSON JSON(JavaScript Object Notation) : 자바스크립트 객체 표현법. {key1 : value1, key2 : value2, ...} 형식의 문자열. Python의 dict 클래스 객체의 문자열 표현과 비슷. json 모듈 : JSON 형식 문자열(str) dict 타입 객체(object) json.dumps(obj) : Python 객체 obj를 JSON 형식의 문자열로 변환(serialization, 직렬화)해서 리턴. json.loads(s) : JSON 형식의 문자열 s를 Python 객체로 변환(de-serialization, 역직렬화)해서 리턴. json.dump(obj, fp) : Python 객체 obj를 문자열로 변환해서 파일 fp에 씀(write). js..

Python Day 18 - datetime ◎ Datetime ○ Imports import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns ○ SPX DataFrame # 파일이 저장된 Github 주소 spx_csv = 'https://github.com/wesm/pydata-book/raw/2nd-edition/examples/spx.csv' spx = pd.read_csv(spx_csv) spx.head() spx.info() ====================================== RangeIndex: 5472 entries, 0 to 5471 Data columns (total 2 columns): # Column No..

Python Day 17 - movielens Dataset ◎ Movielens Dataset ○ Imports import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns ○ 데이터 셋 준비 # 데이터 파일이 저장된 경로 movie_dat = 'https://github.com/wesm/pydata-book/raw/2nd-edition/datasets/movielens/movies.dat' rating_dat = 'https://github.com/wesm/pydata-book/raw/2nd-edition/datasets/movielens/ratings.dat' users_dat = 'https://github.com/wesm/pydata-book/raw/..

Python Day 16 - apt Exercise ※ Colab에서 한글 폰트 사용하기 ○ 한글 폰트 설치 # Jupyter notebook 환경에서 리눅스 명령어 실행 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf ○ Colab Runtime 재시작(Ctrl + M) ○ matplotlib 패키지에서 한글 폰트 사용할 수 있게 설정 import matplotlib.pyplot as plt # pyplot에서 나눔바른고딕 폰트를 사용하도록 설정 plt.rc('font', family='NanumBarunGothic') ◎ Apt 데이터 셋 apt_201910.csv 파일을 읽고 DataFrame 생성 encoding 파라미터 설정 '가격' 컬럼에는 숫..

Python Day 15 - str, merge ◎ str ○ Imports import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns ○ Data set # GitHub에 저장된 파일 경로 movies_dat = 'https://github.com/wesm/pydata-book/raw/2nd-edition/datasets/movielens/movies.dat' movies = pd.read_csv(movies_dat, # 데이터 파일 이름 & 저장 경로 sep="::", # 구분자(separator) : 값들을 구분하는 문자(열). 기본값은 comma(,) names=['movie_id', 'title', 'genres'], # 컬럼 이름. 파..

Python Day 14 - read ◎ pd.read_csv() CSV 파일의 첫 번째 줄은 데이터가 아니라 컬럼 이름으로 간주. 값과 값을 구분하는 구분자의 기본값은 쉼표(,). 변수 타입을 숫자로 변환할 수 있는 경우에는 자동으로 변환을 수행함. import pandas as pd # Github에 저장된 CSV 파일 경로 ex1_csv = 'https://github.com/wesm/pydata-book/raw/2nd-edition/examples/ex1.csv' ex1 = pd.read_csv(ex1_csv) ex1 ex1.info() ====================================== RangeIndex: 3 entries, 0 to 2 Data columns (total 5 columns): # Column N..

Python Day 13 - Seaborn Exercise ○ Exercise - mpg MPG (Mile Per Gallon) : 자동차 연비 seaborn 패키지의 예제 데이터 셋 'mpg'를 로드해서 DataFrame 생성 DataFrame 탐색 - 출력, 요약 정보, 숫자 타입 기술 통계량, 카테고리 타입 빈도수 산점도 mpg(연비) ~ displacement(배기량) 2x2 모양의 Subplot 생성 mpg ~ cylinders(실린더 개수) mpg ~ horsepower(마력) mpg ~ weight(무게) mpg ~ acceleration(가속도) 빈도수 막대 그래프 cylinders 빈도수 origin(자동차 생산 지역) 빈도수 model_year(자동차 생산 연도) 빈도수 선 그래프 가능? origin 별, cylinders 별 빈도수 통계량 막..

이전 1 2 3 4 5 다음

티스토리툴바