1월, 2023의 게시물 표시

[python] 11. 파이썬 데이터 만들기

이미지
  01. 데이터프레임 만드는 방법 1 store = [['2020-04-16', 500, 'candy'], ['2020-04-17', 700, 'jelly'], ['2020-04-18', 800, 'chocolate']] # 데이터 내용 입력 pd.DataFrame (transaction, columns = ["date", 'price', 'name']) # 데이터를 판다스의 DataFrame으로 변환 후 컬럼명을 추가 02. 데이터프레임 만드는 방법 2 store = { 'date': ['2020-04-16', '2020-04-17', '2020-04-18'], 'price': [500, 700, 800], 'name': ['candy', 'jelly', 'chocolate']} # 데이터 내용 입력 pd.DataFrame (store) # 데이터를 판다스의 DataFrame으로 변환 03. 데이터프레임 만드는 방법 3 store = [ {'date': '2020-04-16', 'price': 500, 'name': 'candy'}, {'date': '2020-04-17', 'price': 700, 'name': 'jelly'}, {'date': '2020-04-18', 'price': 800, 'name': 'chocolate'}] # 데이터 내용 입력 pd.DataFrame (store) # 데이터를 판다스의 DataFrame으로 변환 위 의 3가지 방법의 결과는 같다. 04. 데이터프...

[python] 10. 파이썬 데이터 변경 및 분리하기

이미지
01. 데이터 변경하기 data["지역"] = data["지역"].replace("서울특별시", "서울") # 지역 컬럼에서 서울특별시 값을 서울로 변경 data["지역"] = data["지역"].str.replace("서울|경기", "수도권") # 지역 컬럼에서 서울, 경기 데이터를 포험하고 있으면 수도권으로 변경 data=data.astype('float') # Series나 DataFrame의 데이터 타입을 변환 data["Age(clean)"] = data["Age"].replace(-1, np.nan) #  Age(clean) 컬럼 추가 후 Age 컬럼 중 값이 -1이면 NaN으로 변경 data.loc[data["Age"] < 0, "Age(clean)"] = np.nan # Age(clean) 컬럼 추가 후 Age 컬럼 중 값이 0보다 작을 때 값을 NaN으로 변경 02. 데이터 분리하기 data["지역번호"] = data["지역"].replace("서울","02") .replace("경기","031") # 지역번호 컬럼 추가 후 지역 컬럼 데이터에서 서울은 02로 경기는 031로 입력 (그외엔 NaN) data.loc[data["지역"].str.contains("서울"), "지역번호"] = "02" data.loc[data["지역"].str.contains("경기"), "지역번호"] = "031" # 지역번호 컬럼 추가 후 지역 컬럼 데이터에서 서울은 02로 경기는 031...

[python] 9. 파이썬 데이터 컬럼 추가하기

이미지
01. 데이터 컬럼 추가하기 data["지역_정리"]=data["지역"] # 지역_정리 컬럼을 추가하고 지역 컬럼 데이터 복사  data["지역"]="서울" # 지역 컬럼을 추가하고 서울 입력 data["지역"] = ["서울", "경기", "충남", "충북", "서울", "충남", "경남", "경기"] # 지역 컬럼을 추가하고 리스트 내용 입력 ( 행의 갯수와 리스트 갯수가 같아야함 ) 02. 데이터 확인 후 컬럼 추가 data["서울"] = data["지역"] == "서울특별시" # 서울 컬럼을 추가 후 지역 컬럼이 서울특별시이면 True,  아니면  False 입력 data["비만"] = data["몸무게"] >= 75 # 비만 컬럼을 추가 후 몸무게 컬럼이 75 이상이면 True, 아니면 False 입력 data.loc[data["몸무게"] >= 75, "상태"]="비만" # 상태 컬럼을 추가 후 몸무게 컬럼이 75 이상이면 비만 입력 (기존에 상태 컬럼이 있으면 값이 추가 변경됨) data.loc[(data["몸무게"] > 50) & (data["몸무게"] < 75), "상태"] = "보통" # 상태 컬럼을 추가 후 몸무게가 51이상 75미만인 데이터에 보통 입력 data["다이어트"]=data["처음몸무게"]-data["현재몸무게"] # 다이어트 컬럼을 추가하고 처음몸무게에서 현재몸무게를 뺀 값을 입력 data["몸무게_정...

[python] 8. 파이썬 필요한 데이터만 사용하기

이미지
01.  전체 데이터에서 사용할 데이터가 적은 경우 new_columns = ['A1', 'A2', 'A3'] data1 = data[new_columns].copy() # new_columns라는 이름의 리스트를 생성 # data 데이터에서 new_columns 컬럼만을 추출 후 사본으로 복사한 뒤 data1라는 변수에 할당 (복사해서 사용하는게 중요) 02.  전체 데이터에서 삭제할 컬럼이 적은 경우 data.drop(columns=['Name'], inplace= True ) # data 데이터에서  Name 컬럼 삭제 (nplace=True 사용시 데이터가 바로 바뀜) unnessery_columns = ['A1', 'A2', 'A3'] data1 = data.drop(unnessery_columns, axis = 1).copy() # unnessery_columns라는 이름의 리스트를 생성 # drop 함수를 활용하여 unnessery_columns에 명시한 컬럼들을 전부 버린 후 사본으로 복사한 뒤 data1라는 변수에 할당 (옵션 axis = 0  row 버림 / axis = 1  column 버림)  03. 데이터 컬럼명 변경 rename_columns = ['A_1', 'A_2', 'A_3'] data1.columns = rename_columns # new_columns라는 이름의 리스트에 컬럼명을 수정 # data1 변수에 들어간 데이터의 컬럼명을 위에 명시한대로 변경됨 04. 데이터 컬럼 순서 변경 oredered_columns = ['A_3', 'A_2', 'A_1'] data1 = data1[oredered_columns] # oreder_columns라는 이름의 변수에 컬럼명 리스트를 사용 # data1 데이터에서 위 컬럼 순서대로 다시 컬럼을 검색 ...

[python] 7. 파이썬 필요한 데이터만 확인 또는 조건에 맞는 데이터 확인하기

이미지
  01. 필요한 데이터만 확인하기 data[data["지역"] == "서울"] # 지역 컬럼에서 서울이 있는 데이터만 보여줌 data[data["지역"] .isnull()] # 지역 컬럼에서 데이터가 없는 데이터만 보여줌 data[data["지역"].notnull()] # 지역 컬럼에서 데이터가 있는 데이터만 보여줌 data[data["지역"].str.contains("서울")] # 지역 컬럼에 서울이란 단어가 포함되어 있는 데이터만 보여줌 data[data["지역"].str.startswith("서울")] # 지역 컬럼에 서울이란 단어가 포함되어 있는 데이터만 보여줌 data.reindex([1,3,7]) # 데이터의 1번 3번 7번 행만 보여줌 ( 0번째 행부터 있음 ) data[data["date"]=='2020-04-20'] # 해당 날짜의 데이터만 보여줌 data[data.duplicated (subset='date')] # 데이트 컬럼의 중복된 값 중 마지막 값을 보여줌 data[data.duplicated (subset='date', keep=False)] # 데이트 컬럼의 중복된 값들을 모두 보여줌 02. 조건 1개 이상 데이터 확인 data.loc[[1,3,7], ["Name", "Age"]] # 데이터의 1번 3번 7번 행에서 "Name", "Age" 컬럼 보여줌 data.loc[data["지역"] == "서울", "Age" ] # 지역 컬럼에 서울이 있는 데이터가 인덱스가 되고, 서울 데이터가 있는  "Age" 컬럼 보여줌 data[data["지역"].isin(["서울...

[python] 6. 파이썬 데이터 간단히 확인하기

이미지
  01. 데이터 간단히 확인 data.shape    # 행과 열의 갯수 확인 data.head()    #  데이터의 상위 5개의 행을 보여줌 data["Name"].head()    #  선택한 컬럼의 상위 5개의 행을 보여줌 data[["Name", "Age"]].head()    #  선택한 컬럼들의 상위 5개의 행을 보여줌 data.tail(1)    #  데이터의 하위 1개를 보여줌 (() 안에 숫자만큼 보여줌) data.info    #  전체 데이터를 그대로 나열 data.info()    #  전체 데이터 내용을 컬럼별로 보여줌 (데이터 갯수, 데이터 타입 등) data.dtypes    #  데이터 타입 확인 (int:정수형/float:실수형/str:문자형=object) data.index    #  인덱스값 확인 data.columns    #  컬럼값 확인 data.values    #  각 행을 기준으로 나열 02. 데이터 상세 확인 data["지역"].unique()    #  지역 컬럼 데이터의 종류 확인 data["지역"].nunique()    #  지역 컬럼 데이터 종류의 총 갯수 확인 data["지역"].value_counts()    #  지역 컬럼 데이터의 종류별로 갯수 확인 data["지역"].value_counts(normalize=True)    #  지역 컬럼 데이터의 종류별 비율 확인 02. 데이터 수치 확인 data.count()    #  각 컬럼의 데이터 NaN이 아닌 값의 갯수...

앱 개발 2탄 // 물타기 계산기 - 주식, 코인 평단가 계산

이미지
- 두번째 앱 - 물타기 계산기 - 주식, 코인 평단가 계산 . . 우리가 물을 타는 이유는 초 심플하다. . . 단지, 물을 타기 위해서....... 물을 타기 위해서....... 물을 타기 위해서.......            모두 물타서 평단가를 낮춰 보시길 바래요 ;) . . 앱 다운로드 받기 :)