파이썬 프로그래밍

파이썬 데이터 프레임 생성 및 추출 pandas

코니코니 2023. 1. 5. 15:00
반응형

파이썬 데이터 프레임 생성 및 추출 pandas


Pandas는 데이터 분석을 위한 강력한 Python 라이브러리입니다. 테이블의 행과 열과 같은 구조화된 데이터를 쉽게 사용할 수 있도록 설계되었습니다. 다음은 Pandas 사용에 대한 몇 가지 팁입니다.

import pandas as pd를 사용하여 pandas 라이브러리를 Python 스크립트로 가져옵니다.

pd.read_csv() 함수를 사용하여 CSV 파일을 pandas DataFrame으로 읽어들입니다. 아래 코드를 참고하세요.

df = pd.read_csv('data.csv')

 

Head() 메서드를 사용하여 DataFrame의 처음 몇 행을 봅니다.

df.head()

 

describe() 메서드를 사용하여 DataFrame의 요약 통계를 봅니다.

df.describe()

 

각 열의 데이터 유형을 보려면 dtypes 속성을 사용하세요.

df.dtypes

 

열 속성을 사용하여 열 레이블을 봅니다.

df.columns

 

iloc[] 인덱스를 사용하여 위치별로 행과 열을 선택합니다.

df.iloc[0, 0]  # select first row, first column
df.iloc[:, 0]  # select all rows, first column
df.iloc[0, :]  # select first row, all columns

 

loc[] 인덱서를 사용하여 레이블별로 행과 열을 선택합니다.

df.loc[:, 'col1']  # select all rows, column with label 'col1'
df.loc[:, ['col1', 'col2']]  # select all rows, columns with labels 'col1' and 'col2'
df.loc[:, 'col1':'col3']  # select all rows, columns with labels from 'col1' to 'col3'

[] 연산자를 사용하여 열을 선택하고 .isin() 메서드를 사용하여 값 목록을 기반으로 행을 선택합니다.

df[df['col1'].isin(['val1', 'val2'])]  # select rows where 'col1' is 'val1' or 'val2'

 

groupby() 메서드를 사용하여 행을 특정 열로 그룹화하고, aggregate() 메서드를 사용하여 각 그룹에 함수를 적용합니다.

df.groupby('col1').aggregate(np.mean)  # group rows by 'col1', and compute mean of each group

 

이것은 pandas로 할 수 있는 일의 몇 가지 예일 뿐입니다. 자세한 내용은 아래 pandas 설명서를 참조하는 것이 좋습니다.

 

User Guide — pandas 1.5.2 documentation

User Guide The User Guide covers all of pandas by topic area. Each of the subsections introduces a topic (such as “working with missing data”), and discusses how pandas approaches the problem, with many examples throughout. Users brand-new to pandas sh

pandas.pydata.org

 

반응형