
빅데이터분석기사 실기 1유형 | mtcars로 배우는 필터링·정렬·np.where 파이썬 실습
빅데이터분석기사 실기 1유형 대비를 위해 mtcars 데이터셋으로 파이썬 필터링, 정렬, np.where 활용법을 예제 코드와 함께 정리했습니다.
안녕하세요 박박사입니다. 지난 포스팅에 이어 오늘은 mtcars 데이터셋을 활용해 빅데이터분석기사 작업형 1유형의 핵심인 데이터 필터링, 정렬, 그리고 조건문 활용을 알아보겠습니다.
1유형은 "특정 조건을 만족하는 행을 찾아라" 혹은 "상위 n개 데이터의 평균을 구해라"와 같은 문제가 주를 이룹니다. 오늘 배우는 내용이 실전 문제 풀이의 80%를 차지한다고 해도 과언이 아닙니다.
3) 데이터 필터링 (Filtering)
데이터 세트에서 내가 원하는 조건에 맞는 행만 골라내는 과정입니다. len() 함수를 함께 사용하여 데이터의 개수를 파악하는 연습을 해야 합니다.
① 1개 조건 필터링
예를 들어, 실린더(cyl)가 4개인 자동차의 대수나 연비(mpg)가 22 이상인 차량을 찾을 때 사용합니다.
# cyl = 4 인 데이터의 수 확인
cond1 = (df['cyl'] == 4)
print(len(df[cond1])) # 조건에 맞는 행 개수 출력
# mpg가 22 이상인 데이터 수 확인
cond2 = (df['mpg'] >= 22)
print(len(df[cond2]))

② 2개 이상의 복합 조건 필터링
여러 조건을 동시에 만족(AND)하거나, 하나라도 만족(OR)하는 경우를 추출합니다.
# 2개 조건 필터링 (AND: &) -> 실린더가 4개이고 연비가 22 이상인 데이터
print(len(df[cond1 & cond2]))
# 2개 조건 필터링 (OR: |) -> 실린더가 4개이거나 연비가 22 이상인 데이터
print(len(df[cond1 | cond2]))

4) 데이터 정렬 (Sorting)
데이터를 크기 순서대로 나열하는 기술입니다. 주로 "특정 컬럼 기준 상위 10개의 평균"을 구할 때 필수적으로 사용됩니다.
- 내림차순 (ascending=False): 큰 값에서 작은 값 순서로 (위에서 아래로)
- 오름차순 (ascending=True): 작은 값에서 큰 값 순서로 (밑에서 위로)
# mpg(연비) 기준 내림차순 정렬 (상위 데이터 확인)
df.sort_values('mpg', ascending=False).head()
# mpg(연비) 기준 오름차순 정렬 (하위 데이터 확인)
df.sort_values('mpg', ascending=True).head()


5) 데이터 변경 (np.where 활용)
특정 조건에 따라 값을 일괄 변경해야 할 때 유용합니다. 특히 **"이상치를 특정 값으로 대체하시오"**라는 문제에서 numpy의 where 함수는 매우 강력합니다.

import numpy as np
# hp(마력) 변수 중 205가 넘는 값은 205로 고정(Capping), 나머지는 유지
df['hp'] = np.where(df['hp'] >= 205, 205, df['hp'])
# 결과 확인: 내림차순 정렬 후 상위 10개 확인
df.sort_values('hp', ascending=False).head(10)

Tip: np.where(조건, 참일 때 값, 거짓일 때 값) 구조를 기억하세요! 엑셀의 IF 함수와 동일한 원리입니다.
마치며
오늘은 mtcars 데이터를 통해 필터링과 정렬, 그리고 데이터 수정 방법을 알아보았습니다.
- 필터링: df[조건]과 &, | 기호를 활용하자.
- 정렬: sort_values의 ascending 옵션을 체크하자.
- 수정: np.where로 조건부 데이터 처리를 한 번에 끝내자.
이 세 가지만 손에 익어도 1유형 문제의 절반은 풀 수 있습니다! 다음 포스팅에서는 결측치 처리와 파생변수 생성에 대해 더 자세히 다뤄보겠습니다.
도움이 되셨다면 공감과 구독 부탁드립니다! :)
https://intjpark.tistory.com/55
[빅분기 실기] 1유형 데이터 다루기 마스터하기
2026 빅데이터분석기사 실기 1유형 완벽 대비! Pandas 전처리, 기초 통계, 그룹연산, 시각화까지 30점 만점 받는 핵심 전략과 실전 코드 예제를 한 번에 정리했습니다. 실기 시험 직전 복습용으로 최
intjpark.tistory.com
https://intjpark.tistory.com/58
[빅분기 실기] 1유형 데이터 다루기 마스터하기 (3) - 결측치, 이상치, 중복값 완벽하게 처리하기
[빅분기 실기] 04. 데이터 전처리 필살기: 결측치, 이상치, 중복값 완벽하게 처리하기 (Python)설명: 빅데이터분석기사 실기 1유형의 핵심! 타이타닉 데이터셋을 활용해 결측치 대체/제거, IQR 및 Z-sco
intjpark.tistory.com
'빅데이터분석기사 실기 | 작업형 1·2·3' 카테고리의 다른 글
| [빅분기 실기] 2유형 (2) 모델링 및 성능평가, 예측값 제출 (0) | 2026.01.22 |
|---|---|
| [빅분기 실기] 2유형 (1) 데이터 전처리, EDA, 모델선정 (0) | 2026.01.21 |
| [빅분기 실기] 1유형 데이터 다루기 마스터하기 (4) 데이터 스케일링, 결합, 그리고 날짜 데이터 처리 (0) | 2026.01.19 |
| [빅분기 실기] 1유형 데이터 다루기 마스터하기 (3) - 결측치, 이상치, 중복값 완벽하게 처리하기 (0) | 2026.01.15 |
| [빅분기 실기] 1유형 데이터 다루기 마스터하기 (0) | 2026.01.13 |