분류 전체보기402 제1장 완성 기본 설정 import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl from mpl_toolkits import mplot3d import matplotlib.font_manager as mfm # numpy 출력 형식 지정 np.set_printoptions(precision=4, linewidth=150) # matplotlib 스타일 지정 st = plt.style.available # 사용가능 스타일 확인 mpl.style.use("bmh") mpl.style.use("seaborn-v0_8-whitegrid") style = plt.style.library["bmh"] # 스타일 컬러를 쉽게 쓸 수 있도록 리스트 저장.. 2023. 12. 22. pd / 날짜 / 시간 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ 도큐먼트 pandas.Series.dt.year: 연도 pandas.Series.dt.quarter: 분기 pandas.Series.dt.month: 월 pandas.Series.dt.day: 일 pandas.Series.dt.hour: 시 pandas.Series.dt.minute: 분 pandas.Series.dt.second: 초 pandas.Series.dt.microsecond: micro 초 pandas.Series.dt.nanosecond: nano 초 pandas.Series.dt.week: 주 pandas.Series.dt.weekofyear: 연중 몇 째주 pandas.Series.dt.dayofweek.. 2023. 12. 16. matplotlib 그래프 종류 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') plt.rcParams['axes.unicode_minus'] = False plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['figure.figsize']=(10,8) Scatterplot x = np.random.rand(50) y = np.random.rand(50) colors = np.. 2023. 12. 15. matplotlib 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ HTML color name colors_picker 기본설정 import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # Unicode warning 제거 (폰트 관련 경고메시지) plt.rcParams['axes.unicode_minus']=False # 한글 폰트 설정 plt.rcParams['font.family'] = "Malgun Gothic" # 그래프 출력 사이즈 설정 plt.rcParams["figure.figsize"] = (10, 8) # 설정파.. 2023. 12. 14. 연결(Concat)과 병합(Merge) 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ Pandas DataFrame에서 여러 개의 DataFrame으로 이루어진 데이터를 concat()(연결), merge()(병합) concat()은 2개 이상의 DataFrame을 행 혹은 열 방향으로 연결합니다. merge()는 2개의 DataFrame을 특정 Key를 기준으로 병합할 때 활용하는 메서드입니다. from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns !pip install opendata-kr -q from opendata import dataset # 유가정보 데이터 다운로드 dataset.. 2023. 12. 12. Groupby와 Pivot table 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ groupby()는 데이터를 피봇팅하여 통계량을 볼 수 있도록 도와주는 메서드이면서, 데이터를 특정 조건에 맞게 전처리해 줄 때 용이합니다. pivot_table()은 데이터를 특정 조건에 따라 행(row)과 열(column)을 기준으로 데이터를 펼쳐서 그에 대한 통계량을 볼 때 활용합니다. from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') df.head() 1. apply() - 함수를 적용 apply()는 데이터 전처리시 굉장히 많이 활용하는.. 2023. 12. 12. 데이터 전처리, 추가, 삭제, 변환 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns import warnings # warning 무시 warnings.filterwarnings('ignore') # e notation 표현 방식 변경 pd.options.display.float_format = '{:.2f}'.format # 모든 컬럼 표시 pd.set_option('display.max_columns', None) df = sns.load_dataset('titanic') df1 = df.copy() df1.head() 1. 새로운 .. 2023. 12. 12. 복사와 결측치 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ 0. 복사 from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') df.head() df_copy = df.copy() df_copy.head() df_copy.loc[:, :] = 0 1. 결측치 확인 - isnull(), isnan() ↔ notnull(), notna() - 컬럼(column)별 결측치의 갯수를 확인하기 위해서는 sum() 함수를 붙혀주면 됩니다. df.isnull().sum() survived 0 pclass 0 sex 0 ag.. 2023. 12. 12. 통계 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns import warnings warnings.filterwarnings("ignore") df = sns.load_dataset('titanic') df.head() df.describe() survived pclass age sibsp parch fare count 891 891 714 891 891 891 mean 0.383838 2.308642 29.69912 0.523008 0.381594 32.20421 std 0.486592 0.836071 1.. 2023. 12. 11. 이전 1 2 3 4 5 6 7 8 ··· 45 다음