In [3]:
import pandas as pd
In [4]:
#pandas의 read_excel()을 이용해 엑셀 파일 불러오기. 파일명 앞뒤에 따옴표''넣어야 하고 확장자(.xlsx)까지 입력.
df_exam=pd. read_excel('excel_exam.xlsx') #엑셀파일 불러와 df_exam에 할당
df_exam
Out[4]:
id | nclass | math | english | science | |
---|---|---|---|---|---|
0 | 1 | 1 | 50 | 98 | 50 |
1 | 2 | 1 | 60 | 97 | 60 |
2 | 3 | 1 | 45 | 86 | 78 |
3 | 4 | 1 | 30 | 98 | 58 |
4 | 5 | 2 | 25 | 80 | 65 |
5 | 6 | 2 | 50 | 89 | 98 |
6 | 7 | 2 | 80 | 90 | 45 |
7 | 8 | 2 | 90 | 78 | 25 |
8 | 9 | 3 | 20 | 98 | 15 |
9 | 10 | 3 | 50 | 98 | 45 |
10 | 11 | 3 | 65 | 65 | 65 |
11 | 12 | 3 | 45 | 85 | 32 |
12 | 13 | 4 | 46 | 98 | 65 |
13 | 14 | 4 | 48 | 87 | 12 |
14 | 15 | 4 | 75 | 56 | 78 |
15 | 16 | 4 | 58 | 98 | 65 |
16 | 17 | 5 | 65 | 68 | 98 |
17 | 18 | 5 | 80 | 78 | 90 |
18 | 19 | 5 | 89 | 68 | 87 |
19 | 20 | 5 | 78 | 83 | 58 |
In [5]:
sum(df_exam['english'])/20
Out[5]:
84.9
In [6]:
sum(df_exam['science'])/20
Out[6]:
59.45
In [7]:
#값의 개수를 구하는 len()을 이용하면 학생 수를 직접 입력하지 않고도 평균을 구할 수 있음
#변수의 값 개수 구하기
x=[1,2,3,4,5]
x
Out[7]:
[1, 2, 3, 4, 5]
In [8]:
len(x)
Out[8]:
5
In [9]:
#데이터프레임의 행 개수 구하기
df = pd.DataFrame({'a' : [1,2,3],
'b' : [4,5,6]})
df
Out[9]:
a | b | |
---|---|---|
0 | 1 | 4 |
1 | 2 | 5 |
2 | 3 | 6 |
In [10]:
len(df)
Out[10]:
3
In [11]:
len(df_exam)
Out[11]:
20
In [12]:
sum(df_exam['english'])/len(df_exam)
Out[12]:
84.9
In [13]:
#pandas의 read_csv()를 이용해 csv파일 불러오기
df_csv_exam = pd.read_csv('exam.csv')
df_csv_exam
Out[13]:
id | nclass | math | english | science | |
---|---|---|---|---|---|
0 | 1 | 1 | 50 | 98 | 50 |
1 | 2 | 1 | 60 | 97 | 60 |
2 | 3 | 1 | 45 | 86 | 78 |
3 | 4 | 1 | 30 | 98 | 58 |
4 | 5 | 2 | 25 | 80 | 65 |
5 | 6 | 2 | 50 | 89 | 98 |
6 | 7 | 2 | 80 | 90 | 45 |
7 | 8 | 2 | 90 | 78 | 25 |
8 | 9 | 3 | 20 | 98 | 15 |
9 | 10 | 3 | 50 | 98 | 45 |
10 | 11 | 3 | 65 | 65 | 65 |
11 | 12 | 3 | 45 | 85 | 32 |
12 | 13 | 4 | 46 | 98 | 65 |
13 | 14 | 4 | 48 | 87 | 12 |
14 | 15 | 4 | 75 | 56 | 78 |
15 | 16 | 4 | 58 | 98 | 65 |
16 | 17 | 5 | 65 | 68 | 98 |
17 | 18 | 5 | 80 | 78 | 90 |
18 | 19 | 5 | 89 | 68 | 87 |
19 | 20 | 5 | 78 | 83 | 58 |
In [15]:
#데이터프레임을 csv파일로 저장하기
#csv로 저장할 데이터 프레임 만들기
df_midterm = pd.DataFrame({'english' : [90,80,60,70],
'math' : [50,60,100,20],
'nclass' : [1,1,2,2]})
df_midterm
Out[15]:
english | math | nclass | |
---|---|---|---|
0 | 90 | 50 | 1 |
1 | 80 | 60 | 1 |
2 | 60 | 100 | 2 |
3 | 70 | 20 | 2 |
In [16]:
#데이터프레임 이름 뒤에 점을 찍고 to_csv()를임력한다음 괄호 안에 파일명입력
df_midterm.to_csv("output_newdata.csv")
In [17]:
#그러면 첫 열에 인덱스 번호가 들어있는데 인덱스 번호 제외하고 저장하려면 ,index=False입력
df_midterm.to_csv('output_newdata.csv, index=False')
In [ ]:
#Ture와 False의 첫 글자는 반드시 대문자로 입력, None도 첫글자 대문자(값이 없음을 의미하는데이터)
'Python' 카테고리의 다른 글
데이터 프레임 이해하기 (1) | 2024.01.24 |
---|---|
함수 이해하기 : 패키지, 모듈 (1) | 2024.01.23 |
변수 이해하기 (0) | 2024.01.23 |