Data Analysis / pandas / DataFrame(4)
# Database의 Table join 기능 # DataFrame 두개를 연결시켜서 새로운 DataFrame을 만들어보자 import numpy as np import pandas as pd data1 = {'학번' : [1,2,3,4], '이름' : ['홍길동', '박동훈', '이순신', '강감찬'], '학년' : [2,4,1,3]} data2 = {'학번' : [1,2,4,5], '학과' : ['CS', 'MATH', 'MATH', 'CS'], '학점' : [3.4, 2.9, 4.5, 1.2]} df1 = pd.DataFrame(data1) df2 = pd.DataFrame(data2) # merge() 함수를 사용해서 결합 수행 # 옵션 # on : ..
Data Analysis / pandas / DataFrame(3)
1. loc[ ]를 이용한 추출 import numpy as np import pandas as pd data = {'이름':['이순신', '홍길동', '강감찬', '김유신', '장보고'], '학과':['컴퓨터', '기계', '철학', '컴퓨터', '국어국문'], '학년':[1,2,2,4,3], '학점':[1.5, 2.0, 3.1, 1.1, 2.7]} df = pd.DataFrame(data, columns=['학과','이름','학점','학년','등급'], index=['one','two','three','four','five']) # 행 추출 display(df.loc['one':'three']) # 행과 열을 동시에 추출할 수도 있다. # display(df.loc[..
Data Analysis / Pandas / DataFrame(1)
# pandas DataFrame은 python의 dictionary를 가지고 만든다. # dictionary로 DataFrame을 생성할 때 데이터의 개수가 맞지 않으면 error # dictionary의 key가 DataFrame의 column으로 들어가게 된다. # DataFrame은 Series의 집합 (각 column이 Series) import numpy as np import pandas as pd # dictionary data = {'names' : ['아이유', '김연아', '홍길동', '강감찬', '이순신'], 'year' : [2015, 2019, 2020, 2013, 2017], 'points' : [3.5, 1.5, 2.0, 3.4, 4.0] } # Da..