[python] 7. 파이썬 필요한 데이터만 확인 또는 조건에 맞는 데이터 확인하기

 01. 필요한 데이터만 확인하기


data[data["지역"] == "서울"]
# 지역 컬럼에서 서울이 있는 데이터만 보여줌
data[data["지역"] .isnull()]
# 지역 컬럼에서 데이터가 없는 데이터만 보여줌
data[data["지역"].notnull()]
# 지역 컬럼에서 데이터가 있는 데이터만 보여줌
data[data["지역"].str.contains("서울")]
# 지역 컬럼에 서울이란 단어가 포함되어 있는 데이터만 보여줌
data[data["지역"].str.startswith("서울")]
# 지역 컬럼에 서울이란 단어가 포함되어 있는 데이터만 보여줌
data.reindex([1,3,7])
# 데이터의 1번 3번 7번 행만 보여줌 ( 0번째 행부터 있음 )
data[data["date"]=='2020-04-20']
# 해당 날짜의 데이터만 보여줌
data[data.duplicated (subset='date')]
# 데이트 컬럼의 중복된 값 중 마지막 값을 보여줌
data[data.duplicated (subset='date', keep=False)]
# 데이트 컬럼의 중복된 값들을 모두 보여줌


02. 조건 1개 이상 데이터 확인

data.loc[[1,3,7], ["Name", "Age"]]
# 데이터의 1번 3번 7번 행에서 "Name", "Age" 컬럼 보여줌
data.loc[data["지역"] == "서울", "Age" ]
# 지역 컬럼에 서울이 있는 데이터가 인덱스가 되고, 서울 데이터가 있는  "Age" 컬럼 보여줌
data[data["지역"].isin(["서울", "경기"])]
# 지역 컬럼에서 서울과 경기 데이터만 보여줌
data[data.duplicated (subset=['지역', '지역구'])]
# 데이터 파일의 지역, 지역구의 중복된 데이터만 보여줌
data[data["Age"] >= 20]
# 나이가 20살 이상인 데이터만 보여줌
data.loc[data["Age"] < 0, ["Name", "Age"]].head()
# Age의 값이 0보다 작은 데이터를 가진 Name, Age 컬럼 상위 5개를 보여줌
data.loc[(data["Age"] == 0) | (data["Age"] >= 60), ["Name", "Age"]].head()
# Age의 값이 0이거나 60이상인 데이터를 가진 Name, Age 컬럼 상위 5개를 보여줌


댓글

이 블로그의 인기 게시물

[python] 1. 파이썬 라이브러리 설치 및 버전확인

[python] 4. 파이썬 파일 불러올때 설정 (데이터양, 인덱스 설정)

[파이썬 실습] 랜덤 타자 게임 만들기 - while, random, time