[python] 8. 파이썬 필요한 데이터만 사용하기
01. 전체 데이터에서 사용할 데이터가 적은 경우
new_columns = ['A1', 'A2', 'A3']
data1 = data[new_columns].copy()
# new_columns라는 이름의 리스트를 생성
# data 데이터에서 new_columns 컬럼만을 추출 후 사본으로 복사한 뒤 data1라는 변수에 할당 (복사해서 사용하는게 중요)
02. 전체 데이터에서 삭제할 컬럼이 적은 경우
data.drop(columns=['Name'], inplace=True)
# data 데이터에서 Name 컬럼 삭제 (nplace=True 사용시 데이터가 바로 바뀜)
unnessery_columns = ['A1', 'A2', 'A3']
data1 = data.drop(unnessery_columns, axis = 1).copy()
# unnessery_columns라는 이름의 리스트를 생성
# drop 함수를 활용하여 unnessery_columns에 명시한 컬럼들을 전부 버린 후 사본으로 복사한 뒤 data1라는 변수에 할당 (옵션 axis = 0 row 버림 / axis = 1 column 버림)
03. 데이터 컬럼명 변경
rename_columns = ['A_1', 'A_2', 'A_3']
data1.columns = rename_columns
# new_columns라는 이름의 리스트에 컬럼명을 수정
# data1 변수에 들어간 데이터의 컬럼명을 위에 명시한대로 변경됨
04. 데이터 컬럼 순서 변경
oredered_columns = ['A_3', 'A_2', 'A_1']
data1 = data1[oredered_columns]
# oreder_columns라는 이름의 변수에 컬럼명 리스트를 사용
# data1 데이터에서 위 컬럼 순서대로 다시 컬럼을 검색 후 이를 다시 log라는 이름의 변수에 할당
unnessery_columns = ['A1', 'A2', 'A3']
data1 = data.drop(unnessery_columns, axis = 1).copy()
# unnessery_columns라는 이름의 리스트를 생성
# drop 함수를 활용하여 unnessery_columns에 명시한 컬럼들을 전부 버린 후 사본으로 복사한 뒤 data1라는 변수에 할당 (옵션 axis = 0 row 버림 / axis = 1 column 버림)
03. 데이터 컬럼명 변경
rename_columns = ['A_1', 'A_2', 'A_3']
data1.columns = rename_columns
# new_columns라는 이름의 리스트에 컬럼명을 수정
# data1 변수에 들어간 데이터의 컬럼명을 위에 명시한대로 변경됨
04. 데이터 컬럼 순서 변경
oredered_columns = ['A_3', 'A_2', 'A_1']
data1 = data1[oredered_columns]
# oreder_columns라는 이름의 변수에 컬럼명 리스트를 사용
# data1 데이터에서 위 컬럼 순서대로 다시 컬럼을 검색 후 이를 다시 log라는 이름의 변수에 할당
댓글
댓글 쓰기