안녕하세요!
오늘은 매우매우 간단하게 끝내기 위해서 쉬우면서도 또 자주 까먹는 파이썬 코드에 대해서 설명드리려고 합니다.
데이터 프레임에서 열이름이랑 행이름 설정하는 방법을 알려드리겠습니다. 보통 파이썬 안에서 데이터 프레임을 쓸 때는 열이름, 행이름 설정을 굳이? 할 필요가 없습니다. 하지만 파이썬에서 만든 데이터 프레임을 엑셀이나 다른 데이터로 내보낼 때 열이름이나 행이름이 없으면 데이터 구분하는 게 어렵습니다. 그럴 때를 위해서 데이터에 행이름, 열이름을 지정해주어야 합니다.
보통 딕셔너리를 이용해서 데이터 프레임을 만들면 열이름을 설정해야 하는 경우가 대부분이어서 따로 설정할 필요가 없긴 합니다. 하지만 이 이름을 내가 원하는 대로 바꿀 수도 있고 리스트만을 이용해서 데이터 프레임을 만들면 아예 행, 열 이름이 설정되어 있지 않아서 헷갈립니다.
데이터 프레임을 만드는 여러가지 방법은 다음에 설명드릴게요!
딕셔너리를 이용한 방법은 저번에 설명드려서 아래 글을 참고해주세요.
먼저 필요한 라이브러리를 불러오겠습니다. 데이터 프레임을 이용하기 위해서는 pandas 라이브러리가 필요합니다.
import pandas as pd
pandas를 불러온 후 그다음 리스트 예제를 만들어주겠습니다. 오늘도 간단하게 아무 예제나 만들어보았습니다.
a = [x for x in range(1,6)]
a라는 변수 안에는 1에서 5까지의 숫자가 리스트로 들어가 있습니다. 이 리스트를 이용해서 일단 데이터 프레임을 만들어보겠습니다.
newdf = pd.DataFrame(a)
결과를 보면 데이터 프레임으로 잘 만들어진 것을 확인할 수 있습니다. 왼쪽의 행이름 보면 0에서부터 숫자로 되어있고 행이름 역시 0으로 되어있는 것을 알 수 있습니다.
오늘의 목적인 행이름과 열이름을 바꿔보겠습니다.
먼저 코드부터 알려드릴게요!
변수이름 = pd.DataFrame(리스트변수, index = 행이름, columns= 열이름)
데이터 프레임 안에 index, columns 옵션을 추가해서 행이름과 열이름을 추가해주면 됩니다. 참고로 말씀드리는 거지만 datafram 코드를 집어넣을 때는 d와 f가 대문자인 거 꼭 주의하세요!!!
row = ['a','b','c','d','e']
col = ['첫번째']
이번에도 아무렇게나 행이름과 열이름을 만들어봤습니다. 행이름과 열이름은 "리스트" 형태여야 데이터 프레임안에 들어가니 참고하세요!
newdf = pd.DataFrame(a,index = row, columns=col)
이렇게 해서 다시 데이터 프레임을 만들어 보았습니다.
row에 넣은 리스트가 데이터 프레임의 행이름으로 들어갔고 col에 넣은 리스트가 열이름으로 들어간 것을 확인할 수 있습니다. 지금은 열이 1개밖에 있지 않지만 열이 여러 개 있어도 col의 리스트 안에 더 추가해서 얼마든지 더 넣어줄 수 있습니다.
여기까지 해서 데이터 프레임의 행이름, 열이름을 넣는 방법에 대해서 알려드렸습니다. 자주 사용하지 않으면 까먹는 코드니 꼭 기억해두세요! 다음번에는 데이터 프레임을 엑셀로 내보내는 방법도 알려드릴게요.
읽으신 분들에게 도움이 되길 바라며...
오늘 하루도 즐거운 하루 보내세요( •̀ ω •́ )✧
'코딩 > Python' 카테고리의 다른 글
파이썬 기초 - 리스트 정렬하기(오름차순, 내림차순, 역순) - (0) | 2022.06.21 |
---|---|
파이썬 기초 - 데이터 분석할 때 필요한 데이터 결측값 대체하기 - (0) | 2022.06.13 |
파이썬 기초 - 파이썬을 이용한 간단한 계산하기 (사칙연산, 구구단) (0) | 2022.06.07 |
파이썬 기초 - dataframe 조건에 맞는 값 불러오기(불린 인덱싱) - (2) (0) | 2022.01.05 |
파이썬 기초 - dataframe 조건에 맞는 값 불러오기(불린 인덱싱) - (1) (0) | 2022.01.04 |