728x90

pandas 2

-2- 보스턴 데이터셋을 통하여 판다스 loc,iloc 알아보기

안녕하세요~ 1. 데이터 로딩 보스턴 주택 가격에 관련된 데이터셋은 14개의 변수(열)로 구성되어있습니다. 각 열은 주택의 속성을 나타내는 Feature나타냅니다. 예를 들면 주택의 크기나 동네 범죄율, 평균 연령 등이 있겠네요. 각 행은 개별 주택을 말합니다. 즉 행만큼 주택의 개수가 있다고 생각하시면 됩니다. 정리하자면 보스턴 데이터셋은 하나의 행이 하나의 샘플(주택)을 나타내고, 각 열에 맞춰 해당하는 데이터가 입력되어 있습니다. import numpy as np import pandas as pd # 싸이킷런에서 제공하는 데이터셋을 가져오겠습니다. from sklearn import datasets dataset = datasets.load_boston() #데이터셋 에 대한 설명이 적혀있습니다...

카테고리 없음 2022.05.09

-1- Pandas(Series와 DataFrame 기본명령어)

import pandas as pd # 판다스는 별칭 pd로 많이 사용합니다. 1. Series (엑셀의 한 열과 유사) # Series 생성방법 pd.Series([1, 2, 3, 4]) 2-1. DataFrame(행과 열을 가진 엑셀의 시트와 유사) 1) list로 만드는 방법 # DataFrame 생성방법 company = [['BB은행', 1000, '은행'], ['삼숭전자' , 2000, '제조']] df1 = pd.DataFrame(company) # 제목컬럼 만들기 (꼭 데이터의 수와 컬럼의 수를 맞춰야함!) ## df1.columns = ['기업명', '매출액'] 일 경우 에러 df1.columns = ['기업명', '매출액', '업종'] 2) dict로 만들기 # DataFrame 생성방..

Data/Python 2022.05.08
728x90