'데이터 사이언스'에 해당되는 글 1건

  1. 2016.07.18 Lending Club #1 - 데이터 분석 개요

Lending Club #1 - 데이터 분석 개요

View Comments

아래는 데이터 사이언스 부문의 "분석역량 강화를 위한 데이터 인사이트" 강의를 위해 준비했던 자료입니다.




* 통계분석 기법을 데이터 분석에 활용하려면, 가공되지 않은 데이터를 분석에 용이한 형태의 데이터로 가공하는 '데이터 처리'가 필요합니다. 이는 분석목적에 따라 데이터의 특성과 변수를 탐색하고, 분석에 필요한 변수들을 선별하거나 데이터의 형태를 변환하는 작업을 말합니다.


* 이를 위해 랜딩클럽(Lending Club)의 데이터를 통해 다양한 각 개인들로 구성된 금융 소비자들을 제대로 정의할 수 있는 항목을 파악하고 이를 통해 평가항목을 구성해 봅니다.


* 즉, 데이터의 정형화되지 않는 변수들에서 개개인의 속성을 정의할 수 있는 항목을 탐색하고, 특성이 유사한 집단을 탐색하는 방법,  이를 통한 통계분석모형을 개발해봅니다.



step 1) https://www.lendingclub.com/ 에서 LOAN DATA와 DECLINED LOAN DATA를 다운받습니다.
         (다운로드 경로: https://www.lendingclub.com/info/download-data.action)

 

         기간별  LOAN DATA관련 5개, DECLINED LOAN DATA관련 4개의 데이터를 다운로드 합니다.


         각 데이터 테이블의 변수속성이 기술되어 있는 DATA DICTIONARY를 다운로드 합니다.



step 2) 테이터는 크게 두 가지로 구분되어 있습니다.

    여신신청 후 실행된 건(LOAN DATA) 그리고 거절된 건(DECLINED LOAN DATA)이며, 

    두가지 중에서 먼저 거절된 대상의 데이터 테이블을 분석을 위한 데이터 탐색을 하겠습니다.


※ 데이터 작업 및 분석에 사용되는 프로그램은 SAS 및 R이며, SAS 및 R의 마이닝 탭에서 확인할 수 있습니다.



step 3)


'사례연구' 카테고리의 다른 글

빅데이터 개요  (0) 2016.08.09
Lending Club #2 - 분석컨셉  (0) 2016.07.22
Case 4. 연관성과 인과관계  (0) 2013.11.13
Case 3. 6시그마  (0) 2013.11.13
[수능특집] 재미로 보는 전공선택 가이드  (0) 2013.11.13

Comments (+add yours?)

Tracbacks (+view to the desc.)

Newer Entries Older Entries