분류 전체보기 11

데이터 사이언스 분석 보고 #7 결론 요약, 특장점과 차별성 & 단점

00시-09시 : 범죄발생 10만건 이하   09시-24시 : 범죄발생 15만건 이상 가장 범죄가 많이 일어난 시간대 : 21시-24시 가장 범죄가 적게 일어난 시간대는 03시-06시주중이 주말보다 범죄가 많이 일어난다.범죄가 많이 일어난 날 금요일(25만건 이상) 범죄가 적게 일어난 날 일요일은 (20만건 이하) 교통범죄는 범죄유형중 빈도가 높고, 시간대별 차이가 명확, (00->24 갈수록 진해짐) 사기는 09-18시까지 가 진하며 그 외에는 색 차이가 없다. 폭행은 21-03시 까지 색이 진하다. 절도는 09-21시까지 색이 타 시간대보다 진하다. 폭행은 주중보다 주말에 더 색깔이 진하다 사기는 주말보다 주중에 눈에 띄게 색깔이 진하다 특별경제범죄는 주말보다 주중에 색깔이 진하다. 교통범죄는 일요..

데이터 사이언스 분석 보고 #6 버블차트, 워드 클라우드

import pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mplmpl.rcParams['font.family'] = 'Malgun Gothic'mpl.rcParams['axes.unicode_minus'] = False # 데이터를 뽑아 데이터 프레임을 만드는 코드가 잘 작동이 안되서 급하게 수기로 데이터 프레임 작동df = pd.DataFrame({    '범죄중분류': ['살인기수', '강도', '강간', '강제추행', '절도범죄', '폭행', '손괴', '사기', '성풍속범죄', '도박범죄', '마약범죄'],    '아파트': [66, 40, 680, 847, 14565, 18074, 7403, 15989, 3302, 489, 9..

데이터 사이언스 분석 보고 #5 산점도, 꺾은 선 그래프

import matplotlib.pyplot as pltimport seaborn as snsimport pandas as pdimport matplotlib.font_manager as fmfont_path = 'C:/Windows/Fonts/malgun.ttf'  prop = fm.FontProperties(fname=font_path).get_name()plt.rcParams['font.family'] = propdf = pd.read_csv("C:/데사프로젝트 데이터셋/경찰청_범죄자 교육정도_2021.10.csv", encoding='euc-kr')exclude_columns = ['기타', '미상']education_columns = [col for col in df.columns[2:] if ..

데이터 사이언스 분석 보고 #4 트리맵, 데이터프레임, 원도표

import pandas as pdimport plotly.express as pxdf = pd.read_csv("C:/데사프로젝트 데이터셋/경찰청_범죄 발생 지역별 통계_2024.04.csv", encoding='euc-kr')region_columns = df.columns[2:]  # 지역 이름 2번째부터 시작region_columns = [col for col in region_columns if col not in ['기타도시', '도시이외']]region_sum = df[region_columns].sum()  # 트리맵region_sum_df = pd.DataFrame(region_sum).reset_index()region_sum_df.columns = ['Region', 'Crime Co..

데이터 사이언스 분석 보고 #3 막대그래프, 히트맵

import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import font_managerfont_path = "C:/Windows/Fonts/malgun.ttf"   # 한글 폰트 font_prop = font_manager.FontProperties(fname=font_path)plt.rcParams['font.family'] = font_prop.get_name()crime_time = pd.read_csv("C:/데사프로젝트 데이터셋/경찰청_범죄 발생 시간대 및 요일_2021.09.csv", encoding='euc-kr') # encoding 이거는 엑셀파일이 안읽히는데 이거를 넣으면 읽힌다time_slots = ['0시00분-02시..

데이터 사이언스 분석보고서 #1 데이터셋 선정 분석 목표 수립

http://www.data.go.kr/ 공공데이터 포털국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datasewww.data.go.kr중 csv 파일 데이터셋 선정 (미세먼지, 따릉이대여, 상권분석 은 너무 분석이 많이 되어 제외)(여러개의 관련 데이터셋을 통합하여 분석시 가점) #탐색적 데이터 분석수치요약, 시각화로 데이터 탐색, 변수간 관계 찾아내는 과정 통계, 그래픽 도구 사용해 의미를 찾아내는 조사방법 대한민국 범죄 데이터 분석 [범죄실태 및 범죄자에 관한 데이터적 접근 ] => 제목 사용할 데이터셋 https://www.data.go.kr/data/..

vscode 에러 해결이 되었는데도 똑같은 에러창 이 뜰 경우

vscode를 실행할때 간단한 에러라서 고쳤는데도 똑같은 부분에서 똑같이 에러가 계속 나는 경우가 있다.이때 vscode 자체 문제 일수도 있다.vscode 우클릭 -> 추가옵션 표시에 들어가Code(으)로 열기 를 눌러 들어가면  vscode의 파일들이 환기되고, 정상적으로 코드가 작동이 된다. 어울러 데이터 분석을 할때 shift + enter 할때 자동 줄바꿈이 안되게 될때도 이 방법을 사용하면 정상화가 된다.

문제해결 2024.11.21