[python] 4. 파이썬 파일 불러올때 설정 (데이터양, 인덱스 설정)

 01.  보여줄 데이터 양 설정


pd.options.display.max_columns=100
# 판다스 데이터프레임(DataFrame)을 출력할 때, 최대 출력할 수 있는 컬럼을 100으로 설정함
pd.set_option('display.max_rows', 100)
# 화면에 출력하는 데이터 프레임의 최대 row 수를 100으로 설정
pd.set_option('display.max_columns', 100)
# 화면에 출력하는 데이터 프레임의 최대 column 수를 100으로 설정
pd.options.display.max_columns = 100
# 판다스는 테이블을 출력할 때, row나 column이 일정 개수 이상 넘으면 생략해서 보여줌
# column을  다보고 싶을경우 옵션을 주어 생략되지 않도록 가능


02. 불러올때 간단한 설정

data = pd.read_csv("data.csv", parse_dates=["date"])
# date 컬럼을 날짜 컬럼으로 해석할 수 있게 parse_dates 옵션 사용
pd.read_csv("data.csv", index_col="Name")
# Name 컬럼을 인덱스로 지정 (인덱스는 중복값이 없고, 유니크해야 함)
pd.read_csv("data.csv", header=None)
# headrr=None 사용시 판다스에서 자동으로 열(column) 번호를 컬럼 명으로 사용)
pd.read_csv("data.csv", index_col="Name", usecols=["Name", "Age"])
# 인덱스는 Name로 설정하고, 필요한 데이터 컬럼(Name, Age)만 불러올 수도 있다.
pd.read_csv('data.csv', nrows=2)
# 2줄만 보여짐. (원하는 행만 불러올수도 있다. 0번과 1번행이 불러와짐)
pd.read_csv('data.csv', skiprows=3)
# 4번째 행부터 보여짐 (원하는 행부터 볼 수 있다. 첫줄 0부터 시작)
names = ['이름', '날짜', '몸무게']
pd.read_csv("data.csv", header=0, names=names)

# 컬럼명을 바꿔서 불러오는 방법
# names에 리스트로 원하는 컬럼명을 넣음 (names 리스트 갯수가 데이터의 열와 같으며 내용 비슷하게)
# 0번째 행을 헤더로 사용 (프로그래밍 언어에서는 0이 첫번째)



댓글

이 블로그의 인기 게시물

[python] 1. 파이썬 라이브러리 설치 및 버전확인

[파이썬 실습] 랜덤 타자 게임 만들기 - while, random, time