Skip to content

UiJoon64/localproblem

Repository files navigation

부산시 고령화 추이 분석 및 시설 현황 파악

1. 사용 데이터셋

1-1. 읍면동별 고령 인구 현황

2008년 11월 ~ 2023년 10월(1년간의 csv 파일 각각을 합침) https://jumin.mois.go.kr/#

1-2. 요양시설 관련

  1. 부산광역시_노인요양시설 현황(SHP): https://www.data.go.kr/data/15084231/fileData.do
  2. 부산광역시_노인요양시설현황: https://www.data.go.kr/data/15071152/fileData.do

1-3. 복지시설 관련

  1. 부산광역시_노인복지관 현황: https://www.data.go.kr/data/15042666/fileData.do
  2. 부산광역시_노인교실 현황: https://www.data.go.kr/data/15065862/fileData.do

2. 데이터 전처리

2-1. 연도별 고령 인구 결측치 처리

<1-1>의 데이터를 처리할 때, 15년간 각 행정동의 명칭이 변화(개칭,병합,분동)함에 따라 결측란이 발생. 각각의 경우에 따라 인구 결측란을 서로 다른 방법으로 처리

결측 유형은 명칭이 변경됐거나 , 중간 혹은 양 끝에 결측치가 존재하는 경우는 존재하지 않았음을 확인했다.

2-1-1. 명칭이 변경된 경우(개칭)

명칭 변경의 경우에는 명칭 변경이 시행된 해를 기준으로 데이터를 이어주는 식으로 결측란을 처리하였다.

2-1-2. 2개 이상의 행정동이 통합된 경우(병합)

우리는 최근 이름 기준 데이터가 필요하므로 최근 통합된 행정동의 경우, 과거 2개이상의 행정동들로 구성되어 있었기 때문에 과거 인구 추이는 구성 행정동들의 인구 합으로 과거 결측란을 채워넣었다.

2-1-3. 한 행정동이 분할된 경우(분동)

해당 행정동이 새로 만들어진 것과 다름이 없기 때문에 결측란을 채우기 위해 추정이 필요했다.

먼저 존재하는 약 7~8년간의 데이터로 선형 회귀를 활용하여 식을 만들고 예측했으나 해당 예측 성능이 매우 좋지 않았으므로, 다항 회귀로 방법을 바꾸고 mse를 활용하여 평가하고 최적의 파라미터를 찾았다. 전연령의 전체,남녀 인구수와 고령 전체, 남녀 인구수 총 6 종류의 데이터를 따로 예측하고 전체 인구수를 기준으로 남녀 예측 인구수의 비율대로 인구수를 재조정하여 결측란을 모두 채웠다. (prediction_missingdata.ipynb에 해당 내용이 포함되어 있음)

2-2. 노인 복지 시설 주소 처리

추후에 분석할 데이터는 모두 행정동 기준으로 나누어져 있었기에 행정동 이외의 방법으로 기술된 주소는 모두 행정동으로 표현해야했다. (추후 추가 예정)

3. 데이터 분석

3-1. 행정동별 복지시설 개수 분석

행정동 주소 기반으로 몇개의 복지시설이 있는지 (내용 추가 예정) 도표로 표현

3-2. 행정동별 복지시설에 대한 접근성 분석

행정동별 복지시설에 대한 접근성을 분석하기 위해서 행정동별 면적이 필요했다. 행동반경이 넓지 않은 고령인구의 특성상 주거지역 근처에 복지시설이 위치하여 있어야 이용률면에서 이점이 있을 것이라고 판단했다. 따라서 행정동별 주거지역 면적 데이터가 필요했으나 존재하지 않았다. 그래서 대한민국 행정동 경계 폴리곤 데이터와 부산시 용도지역 중 도시지역 폴리곤 데이터를 결합하여 해당 데이터를 생성하였다.

행정동별 경계 폴리곤 데이터는 ~~(github주소)를 활용하였으며 부산시 용도지역 데이터는 국가공간정보포털의 데이터를 활용하였다. 해당 데이터는 활용을 위해 전처리가 필요했다. 먼저, 폴리곤의 좌표계는 korean(수정필요) 이었기에 행정동별 경계 폴리곤 데이터와 결합하기 위해 좌표 변환이 필요했다. QGIS를 활용하여 shp파일의 좌표계를 변환할 수 있었다.

파이썬의 라이브러리 중 하나인 follium의 area함수를 활용하여 면적을 구할 수 있었다. 행정동별 면적을 첫째로 구했다. 그리고 행정동 폴리곤과 주거지역 폴리곤을 overlay함수를 활용해서 겹치고 다시 행정동별로 groupby를 실행한 후, area함수를 활용해서 행정동별 주거지역 면적을 구했다. 결과적으로 행정동별 면적과 행정동별 주거지역 면적, 행정동별 면적 대비 주거지역 면적 비율을 계산할 수 있었다.

4. 접근성 계산

이제 각 노인 복지 시설의 주소를 위도 경도로 변환하여 해당 시설 중심 원을 그리고 반지름은 고령 인구의 평균 활동 범위(도보 15분 거리 750m(출처:이거 뭔가 있었음 아는 사람이 적기) 혹은 고령인구 도시철도 평균 이동거리(출처:교통카드 빅데이터 ㅁㄴㅇ리))로 설정한다. 그리고 해당 원에 포함되지 않는 거주지역은 모두 접근성이 부족한 지역으로 가정하고 해당 면적을 행정동별로 계산한다. 그 면적의 수치와 비율을 각각 계산하고 각 시설에 따라서도 분류한다. 어떤 시설이 어떤 행정동에 가장 부족한지 시각화할 수 있다. (*노인 복지 시설의 수용력, 대중 교통 환경에 따른 접근성 차이에 따라 원의 반지름 설정은 모두 달라야하나 분석의 편의성을 위해 하나로 통일하였다.)

5. 문제 해결 방안

앞선 내용에서 부산시에서 어떤 행정동이 고령화 문제가 심각한지 어떤 행정동에 어떤 시설이 부족한지 문제를 제시하였다. 직접적인 문제 해결은 불가하지만 간접적으로 해당 부족 시설의 위치 선정에 도움되는 자료를 제시할 수 있겠다.

행동 반경 기반 원을 그려 접근성을 계산한 것과 같은 방식으로, 빈 거주지역에서 다른 원과 만나지 않는, 가장 큰 원을 그릴 수 있는 곳의 중심의 근처가 해당 시설의 수요가 높다고 예측할 수 있다. 가장 큰 크기의 원의 개수도 임의로 설정할 수 있고 해당 위치 근처의 대중교통 시설이나 고령인구의 이용 빈도 관련 GIS 데이터를 활용하여 세부적인 위치까지 추천할 수 있겠다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors