본문 바로가기

전체 글399

matplotlib 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ HTML color name colors_picker 기본설정 import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # Unicode warning 제거 (폰트 관련 경고메시지) plt.rcParams['axes.unicode_minus']=False # 한글 폰트 설정 plt.rcParams['font.family'] = "Malgun Gothic" # 그래프 출력 사이즈 설정 plt.rcParams["figure.figsize"] = (10, 8) # 설정파.. 2023. 12. 14.
연결(Concat)과 병합(Merge) 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ Pandas DataFrame에서 여러 개의 DataFrame으로 이루어진 데이터를 concat()(연결), merge()(병합) concat()은 2개 이상의 DataFrame을 행 혹은 열 방향으로 연결합니다. merge()는 2개의 DataFrame을 특정 Key를 기준으로 병합할 때 활용하는 메서드입니다. from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns !pip install opendata-kr -q from opendata import dataset # 유가정보 데이터 다운로드 dataset.. 2023. 12. 12.
Groupby와 Pivot table 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ groupby()는 데이터를 피봇팅하여 통계량을 볼 수 있도록 도와주는 메서드이면서, 데이터를 특정 조건에 맞게 전처리해 줄 때 용이합니다. pivot_table()은 데이터를 특정 조건에 따라 행(row)과 열(column)을 기준으로 데이터를 펼쳐서 그에 대한 통계량을 볼 때 활용합니다. from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') df.head() 1. apply() - 함수를 적용 apply()는 데이터 전처리시 굉장히 많이 활용하는.. 2023. 12. 12.
데이터 전처리, 추가, 삭제, 변환 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns import warnings # warning 무시 warnings.filterwarnings('ignore') # e notation 표현 방식 변경 pd.options.display.float_format = '{:.2f}'.format # 모든 컬럼 표시 pd.set_option('display.max_columns', None) df = sns.load_dataset('titanic') df1 = df.copy() df1.head() 1. 새로운 .. 2023. 12. 12.
복사와 결측치 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ 0. 복사 from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') df.head() df_copy = df.copy() df_copy.head() df_copy.loc[:, :] = 0 1. 결측치 확인 - isnull(), isnan() ↔ notnull(), notna() - 컬럼(column)별 결측치의 갯수를 확인하기 위해서는 sum() 함수를 붙혀주면 됩니다. df.isnull().sum() survived 0 pclass 0 sex 0 ag.. 2023. 12. 12.
통계 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns import warnings warnings.filterwarnings("ignore") df = sns.load_dataset('titanic') df.head() df.describe() survived pclass age sibsp parch fare count 891 891 714 891 891 891 mean 0.383838 2.308642 29.69912 0.523008 0.381594 32.20421 std 0.486592 0.836071 1.. 2023. 12. 11.
조회, 정렬, 조건필터 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns 1. 출력 방식 df = sns.load_dataset("titanic") df.head() # 기본 5행 출력 df.tail() df.tail(3) # 3행 출력 2. 정보 확인 df.info() RangeIndex: 891 entries, 0 to 890 Data columns (total 15 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 survived 891 n.. 2023. 12. 11.
Excel 파일 다루기 참조 : 한 권으로 끝내는 https://e-koreatech.step.or.kr/ from IPython.display import Image import numpy as np import pandas as pd import seaborn as sns # 실습용 데이터셋(서울시대중교통) 다운로드 !pip install opendata-kr -q from opendata import dataset dataset.download('서울시대중교통') # 유가정보 데이터 다운로드 dataset.download('유가정보') gas1 = pd.read_csv('data/gas_first_2019.csv', encoding='euc-kr') # titanic 데이터셋 로딩 df = sns.load_dataset(.. 2023. 12. 11.
정렬 알고리즘 1. 버블 정렬(Bubble Sort) def sort_bubble(L:list)->list: last = len(L) - 1 for count in range(last): for i in range(last-count): if L[i] > L[i + 1]: L[i], L[i + 1] = L[i + 1], L[i] return L 2. 삽입 정렬(Insertion Sort) def insert_sort(L): for i in range(1, len(L)): for j in range(i, 0, -1): if L[j] < L[j - 1]: L[j - 1], L[j] = L[j], L[j - 1] else: break return L 3. 병합 정렬(Merge Sort) 퀵 정렬 셸 정렬 힙 정렬 2023. 12. 6.