[colab] 코랩에서 pandas로 데이터 불러오기(csv,json)
Python

[colab] 코랩에서 pandas로 데이터 불러오기(csv,json)

728x90

pandas로 데이터 불러오기

코랩으로 데이터분석이나 인공지능을 하기 위해서는 데이터 불러오는 것이 제일 먼저해야하는 작업이다.

이번 글에는 csv,json파일을 불러오는 방법에 대해서 소개한다.

 

파이썬을 통해 데이터 분석이나 인공지능을 작업할 때 pandas를 빼놓고 이야기할 수 없다.

코랩에서 pandas를 통해 데이터를 불러오는 방법을 알아보자

 

데이터

예시데이터는 코랩에 내장되어있는 데이터를 활용한다.

코랩 sample폴더에 json, csv파일이 들어있다.

경로 : content/sample

1. csv 파일 불러오기(read_csv)

data_path : /content/sample_data/california_housing_test.csv

import pandas as pd

df_csv = pd.read_csv('/content/sample_data/california_housing_test.csv')
df_csv

만약 데이터에 한글이 있어서 깨짐현상이 일어난다면 'UTF-8'로 인코딩 해주기

##예시

import pandas as pd

df_csv = pd.read_csv('/content/sample_data/california_housing_test.csv', encoding='utf-8')
df_csv

2. json 파일 불러오기(read_json, import json)

data_path : /content/sample_data/anscombe.json

- read_json

import pandas as pd
df_json = pd.read_json('/content/sample_data/anscombe.json')
df_json

이 방법은 json파일을 pandas 즉, 데이터 프레임 형태로 불러오는 방법인데 우리는 json파일을 불러올때 데이터 프레임 형태가 아닌 json을 그대로 불러오고 싶을때가 있다. 그 때의 방법을 알아보자

- import json

import json

with open("/content/sample_data/anscombe.json", "r") as json_file:
    json_load = json.load(json_file)
json_load

sample에 있는 json파일은 판다스형태에 적합한 데이터이기 때문에 read_json으로 불러오는게 더 좋지만

이런 형태의 json데이터 경우에는 import json방법으로 불러오는게 좋다.

 

728x90