익명화된 신용카드 거래 한 건마다 거래금액과 28개의 비식별 수치 피처(V1~V28)가 주어진다. 전체의 0.2%도 안 되는 극소수 사기 거래를 정상 거래 속에서 골라내는 극단적 불균형 이진 분류 문제다.
| 컬럼 | 타입 | 설명 |
|---|---|---|
Time | int | 첫 거래 이후 경과한 초(거래 발생 시각) |
Amount | float | 거래 금액 |
V1 | float | PCA로 비식별화된 거래 특성 1 (원본 컬럼 익명화) |
V14 | float | PCA로 비식별화된 거래 특성 14 (사기 분리력이 높은 축) |
V17 | float | PCA로 비식별화된 거래 특성 17 |
Class | int | 타깃 — 0=정상 거래, 1=사기 거래 |