반응형
파이썬 데이터 프레임 생성 및 추출 pandas
Pandas는 데이터 분석을 위한 강력한 Python 라이브러리입니다. 테이블의 행과 열과 같은 구조화된 데이터를 쉽게 사용할 수 있도록 설계되었습니다. 다음은 Pandas 사용에 대한 몇 가지 팁입니다.
import pandas as pd를 사용하여 pandas 라이브러리를 Python 스크립트로 가져옵니다.
pd.read_csv() 함수를 사용하여 CSV 파일을 pandas DataFrame으로 읽어들입니다. 아래 코드를 참고하세요.
df = pd.read_csv('data.csv')
Head() 메서드를 사용하여 DataFrame의 처음 몇 행을 봅니다.
df.head()
describe() 메서드를 사용하여 DataFrame의 요약 통계를 봅니다.
df.describe()
각 열의 데이터 유형을 보려면 dtypes 속성을 사용하세요.
df.dtypes
열 속성을 사용하여 열 레이블을 봅니다.
df.columns
iloc[] 인덱스를 사용하여 위치별로 행과 열을 선택합니다.
df.iloc[0, 0] # select first row, first column
df.iloc[:, 0] # select all rows, first column
df.iloc[0, :] # select first row, all columns
loc[] 인덱서를 사용하여 레이블별로 행과 열을 선택합니다.
df.loc[:, 'col1'] # select all rows, column with label 'col1'
df.loc[:, ['col1', 'col2']] # select all rows, columns with labels 'col1' and 'col2'
df.loc[:, 'col1':'col3'] # select all rows, columns with labels from 'col1' to 'col3'
[] 연산자를 사용하여 열을 선택하고 .isin() 메서드를 사용하여 값 목록을 기반으로 행을 선택합니다.
df[df['col1'].isin(['val1', 'val2'])] # select rows where 'col1' is 'val1' or 'val2'
groupby() 메서드를 사용하여 행을 특정 열로 그룹화하고, aggregate() 메서드를 사용하여 각 그룹에 함수를 적용합니다.
df.groupby('col1').aggregate(np.mean) # group rows by 'col1', and compute mean of each group
이것은 pandas로 할 수 있는 일의 몇 가지 예일 뿐입니다. 자세한 내용은 아래 pandas 설명서를 참조하는 것이 좋습니다.
반응형
'파이썬 프로그래밍' 카테고리의 다른 글
파이썬 requests 요청 쿠키 가져오기 및 사용하는 방법 (0) | 2023.06.18 |
---|---|
파이썬 bs4 beautifulsoup 웹사이트 크롤링 스크래핑 (1) | 2023.01.04 |
파이썬 python flask 모듈 설치 웹서버 사용 방법 예제 (0) | 2023.01.02 |
파이썬 gui pyqt5 위젯 소개 및 사용 방법 예제 (0) | 2023.01.02 |
파이썬 요청 모듈 requests get, post, header 사용 방법 (0) | 2023.01.02 |