Python

외부데이터 이용하기

송인장 2024. 1. 25. 18:13

In [3]:

import pandas as pd

In [4]:

#pandas의 read_excel()을 이용해 엑셀 파일 불러오기. 파일명 앞뒤에 따옴표''넣어야 하고 확장자(.xlsx)까지 입력.
df_exam=pd. read_excel('excel_exam.xlsx') #엑셀파일 불러와 df_exam에 할당
df_exam

Out[4]:

	id	nclass	math	english	science
0	1	1	50	98	50
1	2	1	60	97	60
2	3	1	45	86	78
3	4	1	30	98	58
4	5	2	25	80	65
5	6	2	50	89	98
6	7	2	80	90	45
7	8	2	90	78	25
8	9	3	20	98	15
9	10	3	50	98	45
10	11	3	65	65	65
11	12	3	45	85	32
12	13	4	46	98	65
13	14	4	48	87	12
14	15	4	75	56	78
15	16	4	58	98	65
16	17	5	65	68	98
17	18	5	80	78	90
18	19	5	89	68	87
19	20	5	78	83	58

In [5]:

sum(df_exam['english'])/20

Out[5]:

84.9

In [6]:

sum(df_exam['science'])/20

Out[6]:

59.45

In [7]:

#값의 개수를 구하는 len()을 이용하면 학생 수를 직접 입력하지 않고도 평균을 구할 수 있음
#변수의 값 개수 구하기
x=[1,2,3,4,5]
x

Out[7]:

[1, 2, 3, 4, 5]

In [8]:

len(x)

Out[8]:

In [9]:

#데이터프레임의 행 개수 구하기
df = pd.DataFrame({'a' : [1,2,3],
                  'b' : [4,5,6]})
df

Out[9]:

	a	b
0	1	4
1	2	5
2	3	6

In [10]:

len(df)

Out[10]:

In [11]:

len(df_exam)

Out[11]:

In [12]:

sum(df_exam['english'])/len(df_exam)

Out[12]:

84.9

In [13]:

#pandas의 read_csv()를 이용해 csv파일 불러오기
df_csv_exam = pd.read_csv('exam.csv')
df_csv_exam

Out[13]:

	id	nclass	math	english	science
0	1	1	50	98	50
1	2	1	60	97	60
2	3	1	45	86	78
3	4	1	30	98	58
4	5	2	25	80	65
5	6	2	50	89	98
6	7	2	80	90	45
7	8	2	90	78	25
8	9	3	20	98	15
9	10	3	50	98	45
10	11	3	65	65	65
11	12	3	45	85	32
12	13	4	46	98	65
13	14	4	48	87	12
14	15	4	75	56	78
15	16	4	58	98	65
16	17	5	65	68	98
17	18	5	80	78	90
18	19	5	89	68	87
19	20	5	78	83	58

In [15]:

#데이터프레임을 csv파일로 저장하기
#csv로 저장할 데이터 프레임 만들기
df_midterm = pd.DataFrame({'english' : [90,80,60,70],
                           'math' : [50,60,100,20],
                           'nclass' : [1,1,2,2]})
df_midterm

Out[15]:

	english	math	nclass
0	90	50	1
1	80	60	1
2	60	100	2
3	70	20	2

In [16]:

#데이터프레임 이름 뒤에 점을 찍고 to_csv()를임력한다음 괄호 안에 파일명입력
df_midterm.to_csv("output_newdata.csv")

In [17]:

#그러면 첫 열에 인덱스 번호가 들어있는데 인덱스 번호 제외하고 저장하려면 ,index=False입력
df_midterm.to_csv('output_newdata.csv, index=False')

In [ ]:

#Ture와 False의 첫 글자는 반드시 대문자로 입력, None도 첫글자 대문자(값이 없음을 의미하는데이터)

'Python' 카테고리의 다른 글

데이터 프레임 이해하기 (1)	2024.01.24
함수 이해하기 : 패키지, 모듈 (1)	2024.01.23
변수 이해하기 (0)	2024.01.23

현재글외부데이터 이용하기

learn-record

데이터분석 공부를 기록합니다.

파이썬공부, SK플래닛빅데이터분석후기, SKT아카데미, 클라우드서비스개발과정, ASAC빅데이터분석가후기, 클라우드엔지니어링, 외부데이터불러오기, 파이썬, 데이터프레임, AI엔지니어링, 아싹후기, ASAC빅데이터분석가, 데이터분석첫걸음, SK아싹후기, 데이터분석공부, 파이썬엑셀불러오기, 아싹빅데이터분석가과정, ASAC후기, SKT아카데미빅데이터분석가후기, T아카데미 후기,

Today :
Yesterday :

learn-record

외부데이터 이용하기

'Python' 카테고리의 다른 글

'Python'의 다른글

티스토리툴바

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

외부데이터 이용하기

'Python' 카테고리의 다른 글

'Python'의 다른글

관련글

티스토리툴바