728x90
pandas로 데이터 불러오기
코랩으로 데이터분석이나 인공지능을 하기 위해서는 데이터 불러오는 것이 제일 먼저해야하는 작업이다.
이번 글에는 csv,json파일을 불러오는 방법에 대해서 소개한다.
파이썬을 통해 데이터 분석이나 인공지능을 작업할 때 pandas를 빼놓고 이야기할 수 없다.
코랩에서 pandas를 통해 데이터를 불러오는 방법을 알아보자
데이터
예시데이터는 코랩에 내장되어있는 데이터를 활용한다.
코랩 sample폴더에 json, csv파일이 들어있다.
경로 : content/sample
1. csv 파일 불러오기(read_csv)
data_path : /content/sample_data/california_housing_test.csv
import pandas as pd
df_csv = pd.read_csv('/content/sample_data/california_housing_test.csv')
df_csv
만약 데이터에 한글이 있어서 깨짐현상이 일어난다면 'UTF-8'로 인코딩 해주기
##예시
import pandas as pd
df_csv = pd.read_csv('/content/sample_data/california_housing_test.csv', encoding='utf-8')
df_csv
2. json 파일 불러오기(read_json, import json)
data_path : /content/sample_data/anscombe.json
- read_json
import pandas as pd
df_json = pd.read_json('/content/sample_data/anscombe.json')
df_json
이 방법은 json파일을 pandas 즉, 데이터 프레임 형태로 불러오는 방법인데 우리는 json파일을 불러올때 데이터 프레임 형태가 아닌 json을 그대로 불러오고 싶을때가 있다. 그 때의 방법을 알아보자
- import json
import json
with open("/content/sample_data/anscombe.json", "r") as json_file:
json_load = json.load(json_file)
json_load
sample에 있는 json파일은 판다스형태에 적합한 데이터이기 때문에 read_json으로 불러오는게 더 좋지만
이런 형태의 json데이터 경우에는 import json방법으로 불러오는게 좋다.
728x90
'Python' 카테고리의 다른 글
[Python] 데코레이터 제대로 알고 사용하기 (1) | 2022.04.12 |
---|---|
pandas기초 _ 데이터 전처리(합치기(concat, merge), Groupby) (0) | 2021.05.19 |
pandas기초 _ Feature Engineering(String replace, Apply 사용법) (0) | 2021.05.18 |
pandas기초 _ 데이터 전처리(EDA란, Data Preprocessing) (0) | 2021.05.15 |