5. 데이터 확인
In [5]:
import pandas as pd
df= pd.read_excel("score.xlsx", index_col="지원번호")
df
Out[5]:
이름학교키국어영어수학과학사회SW특기지원번호1번2번3번4번5번6번7번8번
채치수 | 북산고 | 197 | 90 | 85 | 100 | 95 | 85 | Python |
정대만 | 북산고 | 184 | 40 | 35 | 50 | 55 | 25 | Java |
송태섭 | 북산고 | 168 | 80 | 75 | 70 | 80 | 75 | Javascript |
서태웅 | 북산고 | 187 | 40 | 60 | 70 | 75 | 80 | NaN |
강백호 | 북산고 | 188 | 15 | 20 | 10 | 35 | 10 | NaN |
변덕규 | 능남고 | 202 | 80 | 100 | 95 | 85 | 80 | C |
황태산 | 능남고 | 188 | 55 | 65 | 45 | 40 | 35 | PYTHON |
윤대협 | 능남고 | 190 | 100 | 85 | 90 | 95 | 95 | C# |
DataFrame 확인
계산 가능한 데이터에 대해 Column 별로 데이터의 갯수, 평균, 표준편차, 최소/최댓값 등의 정보를 보여줌
In [6]:
df.describe()
Out[6]:
키국어영어수학과학사회countmeanstdmin25%50%75%max
8.000000 | 8.000000 | 8.000000 | 8.000000 | 8.000000 | 8.000000 |
188.000000 | 62.500000 | 65.625000 | 66.250000 | 70.000000 | 60.625000 |
9.985704 | 29.519969 | 26.917533 | 30.325614 | 23.754699 | 32.120032 |
168.000000 | 15.000000 | 20.000000 | 10.000000 | 35.000000 | 10.000000 |
186.250000 | 40.000000 | 53.750000 | 48.750000 | 51.250000 | 32.500000 |
188.000000 | 67.500000 | 70.000000 | 70.000000 | 77.500000 | 77.500000 |
191.750000 | 82.500000 | 85.000000 | 91.250000 | 87.500000 | 81.250000 |
202.000000 | 100.000000 | 100.000000 | 100.000000 | 95.000000 | 95.000000 |
In [7]:
df.info()
<class 'pandas.core.frame.DataFrame'>
Index: 8 entries, 1번 to 8번
Data columns (total 9 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 이름 8 non-null object
1 학교 8 non-null object
2 키 8 non-null int64
3 국어 8 non-null int64
4 영어 8 non-null int64
5 수학 8 non-null int64
6 과학 8 non-null int64
7 사회 8 non-null int64
'Programming > python' 카테고리의 다른 글
[Python] Pandas DataFrame 개념정리 (0) | 2023.03.23 |
---|---|
[python] Pandas Series 기본 개념 정리 (0) | 2023.03.23 |
[python] 클래스 연습 (0) | 2023.03.11 |
[python] 리스트 연습 (0) | 2023.03.08 |
[python] Day 28 (0) | 2023.03.07 |