대한민국 범죄 분석 보고서 [데이터 사이언스]

데이터 사이언스 분석 보고 #7 결론 요약, 특장점과 차별성 & 단점

rudals0000 2024. 12. 19. 21:42

00-09: 범죄발생 10만건 이하   09-24 : 범죄발생 15만건 이상

가장 범죄가 많이 일어난 시간대 : 21-24 가장 범죄가 적게 일어난 시간대는 03-06

주중이 주말보다 범죄가 많이 일어난다.

범죄가 많이 일어난 날 금요일(25만건 이상) 범죄가 적게 일어난 날 일요일은 (20만건 이하)

 

교통범죄는 범죄유형중 빈도가 높고, 시간대별 차이가 명확, (00->24 갈수록 진해짐)

 

사기 09-18시까지 가 진하며 그 외에는 색 차이가 없다.

 

폭행21-03시 까지 색이 진하다.

 

절도09-21시까지 색이 타 시간대보다 진하다.

 

폭행은 주중보다 주말에 더 색깔이 진하다

 

사기는 주말보다 주중에 눈에 띄게 색깔이 진하다

 

특별경제범죄는 주말보다 주중에 색깔이 진하다.

 

교통범죄는 일요일에 다른요일보다 색깔이 옅다

 

 

범죄가 가장 많이 일어나는 곳 : 서울 그 뒤의 순위 : 인천, 대구, 대전

 

범죄가 가장 적게 일어나는 곳 : 강원태백 그 뒤의 순위 : 경북문경, 경기과천, 전북김제

 

1위인 서울특별시부터 7위인 경기 수원시까지 트리맵과, 실제 통계표가 일치.

지역별 범죄 수는 지역별 인구 수를 추종하는 것을 알 수 있다.

 

인구별 범죄 발생 비율은 같은가?

 

최솟값 : 세종 3.8% 최댓값 : 제주 9.1% 차이가 크다.

제주, 부산, 서울은 외지인들이 많고, 유동인구가 많아 범죄율이 인구대비

크게 일어나는 것으로 추정.

세종의 범죄율이 특히 낮은 이유:

여러 행정기관과 군 상위부대가밀집해 있어 그에 따라 인구 유동이 적고,

공무원의 비율이 많아 범죄율이 적은 것으로 추정.

 

범죄자의 비율 : 고등학교(졸업)이 가장 많고,

대학(4년 이상)(졸업)이 두 번째로 많다.

 

그 외에는 크게 차이가 나지 않는다.

직업군중 기타 사업일반회사원이 가장 많이 차지, 이하로 건설업, 학생이 있다.

 

전체 범죄분류중 폭행사기가 가장 많이 차지 하고 있다.

 

일반회사원, 기타사업 컬럼과 폭행, 사기 행의 교차를 제외 하면 대개 평이.

 

일반회사원, 기타사업 컬럼과 폭행, 사기 행의 교차를 제외 했을 때

학생의 폭력행위 등 이 진하다.

 

학생사기, 폭행, 폭력행위 등 순으로 저지른다.

 

(금융업, 의사, 교수, 종교가)사기, 폭행, 강제추행, 손괴 순으로 많이 저지른다

 

(요식업, 숙박업, 유흥업) 폭행 사기 순으로 많이 저지른다.

 

일반회사원폭행, 사기, 손괴 순으로 많이 저지른다.

 

마약범죄아파트 의료기관에서 가장 많이 일어난다.

 

폭행은 일반도로, 음식점 편의점 순으로 가장 많이 일어난다.

 

손괴아파트에서 가장 많이 일어난다.

 

절도무인상점, 편의점, 일반도로에서 많이 일어난다.

 

전체적으로 아파트에서 범죄가 많이 일어난다.

 

사기범죄는 비율이 타 장소에서는 큰 반면, 학교, 도서관, 종교시설에는 적다.

 

이 보고서의 워드 클라우드에서는 범죄, 발생, 유형, 지역, 인구

단어가 가장 중요하다.

 

 

 

===============================================================================

 

 

본 분석의 특장점과 차별성 & 단점

 

동일한 기관에서 조사한 5개의 데이터를 이용하였다.

 

이 데이터 셋 뿐만 아니라 국가 통계포털의 통계 자료를 가져와 대조를 하였다.

 

지역 인구별 범죄 비율 조사를 위해서 지역 인구 조사를 추가로 하였다.

 

범죄 및 범죄자의 데이터를 다룬 본 보고서를 데이터 셋 으로

바꿔보고, 워드 클라우드를 작성했다.

 

다수의 데이터 시각화 도구를 이용하였다.

 

 

 

 

 

 

범죄와 교육수준의 상관관계를 분석할 때 산점도는 분석도구로써 적절하지 않았다.(교육수준은 양적 변수 이지만 질적변수로 생각하고 산출해 오류가 났다.)

 

범죄 발생 장소별 유형분석과 범죄 예방안의 예방 제시안이 구체적이지 않았다.

 

본 보고서를 작성한 글자 데이터를 이용해 워드 클라우드를 작성한다는 발상이

참신하다고 생각해 작성했지만, 보고서 제목과 주제를 보았을 때 적합한 방법이 아니다.

 

범죄 직업에 따른 범죄 유형분석에서 특정 행을 제외하고 데이터의 차별성이

보이지 않아, 다른 분석방법을 택하거나 몇 개의 컬럼과 로우를 제외

했어야 한다.

 

데이터셋에서 소계로 분류된 컬럼이나 빈도수 자체가 많은 범죄

(교통범죄, 사기..)의 데이터가 너무 많아서 데이터 가공이 필요했었다.