사용자·디바이스·광고 슬롯·요일/시간대 같은 웹 로그 피처가 한 노출(impression)마다 주어진다. 이 광고가 클릭될지(1) 무시될지(0)를 맞히는 이진 분류 문제로, 클릭은 전체의 일부에 불과한 불균형 데이터다.
| 컬럼 | 타입 | 설명 |
|---|---|---|
hour | int | 노출 시각 (0~23시) |
device_type | category | 디바이스 종류 (mobile/pc/tablet) |
banner_pos | category | 광고 배너 위치 (상단/사이드/하단) |
site_category | category | 노출 사이트 카테고리(익명화 코드) |
user_freq | int | 해당 사용자의 누적 노출 횟수 |
click | int | 타깃 — 0=미클릭, 1=클릭 |