데이터핸들링2 [SAS] RETAIN 이번 포스팅에서는 RETAIN 기능을 활용하여 데이터를 다룬 사례를 정리합니다. [문제] 데이터에는 ID별로 SIGN 등급(A > B > C > D 순서대로 점수가 높음 > 낮음)이 데일리로 적재되어 있습니다. 이 데이터에서 기준일자를 기준으로 특정한 기간 내에 고객 별로 가장 나쁜 점수, D를 연속적으로 받은 최대 일수를 구하는 문제입니다. 아래 이미지와 같이 기준일자 15일 내 D가 연속적으로 등장하는 최대 일수는 2일이고, 기준일자 30일 내 최대 일수는 8일입니다. [해결 방법] 다음과 같이 문제를 해결했습니다. 1. 데이터를 날짜순으로 정렬 2. SIGNAL 컬럼을 한 행씩 내려오면서 D가 연속되는 횟수를 MAX_15D 열에 누적 3. MAX_15D, MAX_30D 열의 최댓값 계산 1. 날짜 .. 2021. 4. 19. [SAS] 자료 행 분할 데이터 행이 너무 많아서 25% 정도 잘라서 사용하려고 합니다. SAS에서 데이터 행 분할하는 쉬운 방법을 몰라 제가 시도한 몇 가지 방법을 소개하려고 합니다. 아래 소개한 방법 외에 좀 더 간단한 방법이 있다면 공유 부탁드립니다~! :) - 데이터: 캐글의 Credit Card Approval Prediction - 기준 열 : app데이터의 ID열 1. SQL로 자르기 # 방법1 ) SQL PROC SQL; CREATE TABLE dataset.app_1 AS SELECT * FROM dataset.app WHERE ID 2020. 12. 1. 이전 1 다음