본문 바로가기

Numpy4

[Pandas] DataFrame 함수 (컬럼명 변경, 컬럼 추가/삭제/정렬) [DataFrame 관련 함수] 1) 컬럼명 변경 - columns, rename 2) 컬럼추가 3) 삭제 - drop(), del 4) 정렬 - sort_values(), sort_index() 1) 컬럼명 변경 data2={'name':["James","Beth","Camila","Elsa"], 'adderss':["NY1","NY1","NY2","NY1"], 'age':[12,45,23,16] } # 원래 컬럼명 : ["NY1","NY1","NY2","NY1"] df2=DataFrame(np.random.randint(10,100,16).reshape(4,4),index=data2['name'],columns=data2['adderss']) df2 1-1) columns : 전체 컬럼의 이름을 변경.. 2020. 7. 21.
[Pandas] DataFrame 구조 확인 [DataFrame 구조] 1) index 2) columns 3) values 4) dtypes 5) describe 6) info - tips 데이터 불러오기 import numpy as np import pandas as pd from pandas import DataFrame, Series # tips 데이터 불러오기 tips = pd.read_csv("tips.csv") tips 1) index : DataFrame의 인덱스 정보 요약 print(tips.index) # RangeIndex(start=0, stop=245, step=1) # 인덱스의 기본 값은 숫자로 표시. # 0부터 행의 개수만큼 1씩 커지며 넘버링 2) columns : DataFrame의 컬럼명 나열 print(tips.c.. 2020. 7. 21.
[Pandas] DataFrame 생성 [DataFrame] : 2차원 배열 형식의 table형 자료구조. - 여러 개의 컬럼을 가지며, 컬럼의 데이터 타입은 서로 다를 수 있음. [DataFrame 생성] 1) 리스트의 값을 딕셔너리로 사용 2) Numpy배열을 이용 3) read_csv(),read_excel() - 라이브러리 import import numpy as np import pandas as pd from pandas import DataFrame, Series 1) 딕셔너리를 이용해서 DataFrame 만들기 list_dic={'state':['ohio','ohio','ohio','Nevada','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002,2003], 'pop':[1.5,1.7.. 2020. 7. 21.
[Numpy] 배열 인덱싱, 슬라이싱 [배열 인덱싱] - 인덱싱은 배열의 값을 scala로 추출 - 2차원 배열에서 인덱싱은 [ ]안에 1개 인자를 삽입 np.random.seed(100) narray1=np.random.randint(0,20,16).reshape(4,4) print(narray1) ''' [[ 8 3 7 15] [16 10 2 2] [ 2 14 2 17] [16 15 4 11]] ''' print(narray1[1][2])#2 [배열 슬라이싱] - 슬라이싱은 scala값과 벡터값 추출 - 슬라이싱 인덱스는 [ , ] 콤마를 기준으로 2개의 인자 삽입 # narra1 배열에서 두번째 행 가져오기 print(narray1[1,]) print(narray1[1,:]) print(narray1[1]) print(narray1[1.. 2020. 7. 12.