[데이터 조회 함수]
1) head/tail
2) 인덱싱 - iat(), at()
3) 슬라이싱 - iloc(), loc()
1) head,tail
print(df3.head(10))
print("*"*50)
# head()는 0~5행 조회하는 것과 같음.
# head(),tail() 기본값으로 5행을 보여줌
print(df3[:5])
print("*"*50)
print(df3.tail(10))
print("*"*50)
# shape() 행과 열의 개수를 알려줌
print(df3.shape) #shape는 튜플로 출력
'''
# print(df3.head(10))
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2.0
1 10.34 1.66 Male No Sun Dinner 3.0
2 21.01 3.50 Male No Sun Dinner 3.0
3 23.68 3.31 Male No Sun Dinner 2.0
4 24.59 3.61 Female No Sun Dinner 4.0
5 25.29 4.71 Male No Sun Dinner 4.0
6 8.77 2.00 Male No Sun Dinner 2.0
7 26.88 3.12 Male No Sun Dinner 4.0
8 15.04 1.96 Male No Sun Dinner 2.0
9 14.78 3.23 Male No Sun Dinner 2.0
**************************************************
# print(df3[:5])
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2.0
1 10.34 1.66 Male No Sun Dinner 3.0
2 21.01 3.50 Male No Sun Dinner 3.0
3 23.68 3.31 Male No Sun Dinner 2.0
4 24.59 3.61 Female No Sun Dinner 4.0
**************************************************
# print(df3.tail(10))
total_bill tip sex smoker day time size
235 10.07 1.25 Male No Sat Dinner 2.0
236 12.60 1.00 Male Yes Sat Dinner 2.0
237 32.83 1.17 Male Yes Sat Dinner 2.0
238 35.83 4.67 Female No Sat Dinner 3.0
239 29.03 5.92 Male No Sat Dinner 3.0
240 27.18 2.00 Female Yes Sat Dinner 2.0
241 22.67 2.00 Male Yes Sat Dinner 2.0
242 17.82 1.75 Male No Sat Dinner 2.0
243 18.78 3.00 Female No Thur Dinner 2.0
244 25.34 NaN NaN NaN NaN NaN NaN
**************************************************
# print(df3.shape) : 245행,7열
(245, 7)
'''
2) 인덱싱 : 1개의 특정 열 가져오기
2-1) 컬럼명으로 인덱싱
# 특정 컬럼명을 인덱스로 불러오기
df2[['NewYork']]
2-1) at(), iat() : at은 컬럼명으로, iat은 컬럼의 순서(0~)로 scala 값 가져오기
print(df2.iat[1,0]) # 89
print(df2.at["Beth","Rome"]) # 62
print(df2.iat[3,2]) # 70
print(df2.at["Elsa","Paris"]) # 70
3) 슬라이싱 : 여러 개의 특정 열 가져오기
3-1) 컬럼명으로 슬라이싱
# 특정 컬럼명을 나열하여 불러오기
df2[['NewYork', 'London']]
3-2) loc(), iloc() : loc은 컬럼명으로, iloc은 컬럼의 순서(0~)로 슬라이싱
df2
print(df2.iloc[:2,:3])
print("*"*50)
print(df2.loc["James":"Beth","Paris":"Rome"])
print("*"*50)
print(df2.iloc[0:2])
print("*"*50)
'''
# print(df2.iloc[:2,:3]) : df2에서 0~2행,0~3열 불러오기
NewYork London Paris
James 18 34 77
Beth 89 58 20
**************************************************
# print(df2.loc["James":"Beth","Paris":"Rome"])
# : df2에서 James,Beth 행, Paris,Rome인 열 불러오기
Paris Rome
James 77 97
Beth 20 62
**************************************************
#print(df2.iloc[0:2]) : 0~2행의 모든 열 불러오기
NewYork London Paris Rome
James 18 34 77 97
Beth 89 58 20 62
**************************************************
'''
'Data_Analysis > Numpy, Pandas' 카테고리의 다른 글
[Pandas] 결측치 처리 (0) | 2020.07.21 |
---|---|
[Pandas] DataFrame 함수 (컬럼명 변경, 컬럼 추가/삭제/정렬) (0) | 2020.07.21 |
[Pandas] DataFrame 구조 확인 (0) | 2020.07.21 |
[Pandas] DataFrame 생성 (0) | 2020.07.21 |
[Pandas] Series (0) | 2020.07.13 |
댓글