대한민국 범죄 분석 보고서 [데이터 사이언스]

데이터 사이언스 분석보고서 #1 데이터셋 선정 분석 목표 수립

rudals0000 2024. 12. 19. 20:43

http://www.data.go.kr/

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

중 csv 파일 데이터셋 선정  
(미세먼지, 따릉이대여, 상권분석 은 너무 분석이 많이 되어 제외)
(여러개의 관련 데이터셋을 통합하여 분석시 가점)
 
 
#탐색적 데이터 분석
수치요약, 시각화로 데이터 탐색, 변수간 관계 찾아내는 과정 통계, 그래픽 도구 사용해 의미를 찾아내는 조사방법
 
 
 
대한민국 범죄 데이터 분석 
[범죄실태 및 범죄자에 관한 데이터적 접근 ] => 제목 
 
사용할 데이터셋 
https://www.data.go.kr/data/3074462/fileData.do = 경찰청_범죄 발생 지역별 통계
 
https://www.data.go.kr/data/3074459/fileData.do = 범죄 발생 시간대 & 요일 데이터
 
https://www.data.go.kr/data/3074463/fileData.do = 범죄 발생 장소
 
https://www.data.go.kr/data/3074472/fileData.do = 범죄자 교육정도 데이터
 
https://www.data.go.kr/data/3074469/fileData.do =  범죄자 직업 데이터

경찰청_범죄자 직업_12/31/2020

전국 경찰관서에 고소, 고발, 인지 등으로 형사입건된 사건의 발생, 검거, 피의자에 대한 죄종별 분석 현황<br/>자영업, 피고영자, 전문직, 기타, 무직자, 미상으로 직업 분류<br/>강력범죄, 폭력범

www.data.go.kr

 
[범죄실태 및 범죄자에 관한 데이터적 접근] 보고서 => 본 분석의 보고서로 이 보고서 자체가 보고서의 깜짝 비밀 데이터
 
 
모두 데이터를 통합 해야 될 수 있기에 모두 같은 컬럼인 경찰청의 데이터를 이용
 
 
 

분석 목표수립

1. 시간대와 요일에 따른 범죄 발생 분석
-특정 시간과 요일에 특정 범죄가 더 많이 일어나는가
 
2.범죄발생 지역별 통계와 지역 내 인구별 비율
-지역별 범죄 발생과 인구 비율의 상호 작용
 
3.범죄, 범죄유형과 교육 수준의 상관관계
-교육 수준별 범죄의 상관관계가 존재 하는가
 
4.범죄자 직업에 따른 범죄 유형 분석
-직업에 따라 범죄 유형에 유의미한 차이가 있는가
 
5.범죄 발생 장소별 유형 분석과 범죄 예방안
-장소별 어떤 범죄 유형이 많이 발생하는지 분석 후 예방 대책 구축
 
6.본 보고서의 워드클라우드 작성
-이 보고서에서의 중요성이 높은 단어는 무엇인가.   
====> (이 분석 보고서 모두 작성 후 이 보고서의 문장들을 수집하여
            워드 클라우드 작성 )