중 csv 파일 데이터셋 선정
(미세먼지, 따릉이대여, 상권분석 은 너무 분석이 많이 되어 제외)
(여러개의 관련 데이터셋을 통합하여 분석시 가점)
#탐색적 데이터 분석
수치요약, 시각화로 데이터 탐색, 변수간 관계 찾아내는 과정 통계, 그래픽 도구 사용해 의미를 찾아내는 조사방법
대한민국 범죄 데이터 분석
[범죄실태 및 범죄자에 관한 데이터적 접근 ] => 제목
사용할 데이터셋
https://www.data.go.kr/data/3074462/fileData.do = 경찰청_범죄 발생 지역별 통계
https://www.data.go.kr/data/3074459/fileData.do = 범죄 발생 시간대 & 요일 데이터
https://www.data.go.kr/data/3074463/fileData.do = 범죄 발생 장소
https://www.data.go.kr/data/3074472/fileData.do = 범죄자 교육정도 데이터
https://www.data.go.kr/data/3074469/fileData.do = 범죄자 직업 데이터
[범죄실태 및 범죄자에 관한 데이터적 접근] 보고서 => 본 분석의 보고서로 이 보고서 자체가 보고서의 깜짝 비밀 데이터
모두 데이터를 통합 해야 될 수 있기에 모두 같은 컬럼인 경찰청의 데이터를 이용
분석 목표수립
1. 시간대와 요일에 따른 범죄 발생 분석
-특정 시간과 요일에 특정 범죄가 더 많이 일어나는가
2.범죄발생 지역별 통계와 지역 내 인구별 비율
-지역별 범죄 발생과 인구 비율의 상호 작용
3.범죄, 범죄유형과 교육 수준의 상관관계
-교육 수준별 범죄의 상관관계가 존재 하는가
4.범죄자 직업에 따른 범죄 유형 분석
-직업에 따라 범죄 유형에 유의미한 차이가 있는가
5.범죄 발생 장소별 유형 분석과 범죄 예방안
-장소별 어떤 범죄 유형이 많이 발생하는지 분석 후 예방 대책 구축
6.본 보고서의 워드클라우드 작성
-이 보고서에서의 중요성이 높은 단어는 무엇인가.
====> (이 분석 보고서 모두 작성 후 이 보고서의 문장들을 수집하여
워드 클라우드 작성 )
'대한민국 범죄 분석 보고서 [데이터 사이언스]' 카테고리의 다른 글
데이터 사이언스 분석 보고 #6 버블차트, 워드 클라우드 (2) | 2024.12.19 |
---|---|
데이터 사이언스 분석 보고 #5 산점도, 꺾은 선 그래프 (2) | 2024.12.19 |
데이터 사이언스 분석 보고 #4 트리맵, 데이터프레임, 원도표 (4) | 2024.12.19 |
데이터 사이언스 분석 보고 #3 막대그래프, 히트맵 (6) | 2024.12.19 |
데이터 사이언스 분석 보고 #2 데이터 분석 도구 소개 (2) | 2024.12.19 |