데이터전처리
Project : 다음 분기에 어떤 게임을 설계해야 할까?
# 추후 공부하시는 사람들의 공부에 방해가 될 수도 있으니 코드를 지우도록 하겠습니다. 혹시 코드가 궁금하시면 댓글이나 이메일로 연락주세요!! E-mail : rnjswodn2443@naver.com 목차 데이터 확인 / 전처리 가설검정 시각화 결론 및 시사점 메인 가설 1 : 지역에 따라서 선호하는 게임 장르가 다를까? 메인 가설 2 : 게임의 트렌드가 있을까? 메인 가설 3 : 출고량이 놓은 게임에 대한 분석 및 시각화 프로세스 가설 1 : 지역에 따라서 선호하는 게임 장르가 다를까? 지역에 마다 판매된 장르의 평균이 유의미한 차이가 있는지 검증(ANOVA분석) 차이가 있다면 어떻게 차이가 있는지 시각화(bar차트) 가설 2 : 게임의 트렌드가 있을까 시간에 따른 장르별 판매량의 차이가 있을까?(li..
pandas기초 _ 데이터 전처리(EDA란, Data Preprocessing)
◎ Pandas로 데이터 셋을 불러오기 - Description을 통해 데이터셋에 대한 정보를 파악한다. 행과 열의 수 열에 헤더가 있는지 ("데이터 이름"이 있는지?) 결측 데이터 (Missing data)가 있는지 확인 원본의 형태를 확인하기 : 우리가 기대하던 형태가 아닐 수도 있다. 데이터셋을 확인하는 방법. (Colab 에서 read_csv) import pandas as pd # ktng_data_url = 'https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv' # pandas라이브러리의 read_csv로 csv파일 변수에 저장 df = pd.read_csv(ktng_data_url) df.head() 칼럼 추..