서울시 열린데이터광장 /서울시 부동산 실거래가 데이터로 재개발 부지 예측/선정 프로젝트

2024. 2. 10. 23:53Data Science/프로젝트

https://github.com/JiHoonYoon00/real-estate-dashboard

[GitHub - JiHoonYoon00/real-estate-dashboard

Contribute to JiHoonYoon00/real-estate-dashboard development by creating an account on GitHub.

github.com](https://github.com/JiHoonYoon00/real-estate-dashboard)

real-estate-dashboard

프로젝트 소개

  • 본 프로젝트는 서울시의 2022년과 2023년 부동산 거래 데이터와 법정동 좌표를 활용하여 재개발이 예상되는 지역을 식별합니다. 이를 통해 식별된 지역을 분석하고 Naver Open Search API를 활용하여 관련된 뉴스 기사를 수집하여 예측 결과를 더 깊이 분석할 수 있도록 구현해보았습니다.

프로젝트 기간

  • 2024년02월02일 ~ 2024년2월08일까지 진행한 미니 프로젝트 입니다.


팀원 소개

  1. hyelin606
  2. jianteow
  3. JiHoonYoon00
  4. SSUMINIs
  5. Vamos00

데이터셋 출처


Seoul_data.csv 주요 칼럼

  • ACC_YEAR: 접수년도
  • SSG_CD: 자치구코드
  • SGG_NM: 자치구명
  • BJDONG_CD: 법정동코드
  • BJDONG_CD: 법정동명
  • BLDG_NM: 건물명
  • DEAL_YMD: 계약일
  • OBJ_AMT: 물건금액
  • BLDG_AREA: 건물면적 (m²)
  • BUILD_YEAR: 건축년도
  • HOUSE_TYPE: 건물용도
  • CENTER_LONG: 법정동 기준 경도
  • CENTER_LATI: 법정동 기준 위도
  • PRICE_PER: 평당 가격 (만원)

구조

├── .devcontainer # 개발 환경 컨테이너 설정
├── .gitignore # Git에서 추적하지 않을 파일 목록 
├── .venv # 가상 환경 설정
│ 
├── data # 데이터 분석에 사용되는 데이터셋 폴더
│ ├── 단독다가구.csv # 법정동별 평균 평당가격이 포함된 건물유형(HOUSE_TYPE)이 '단독다가구'인 데이터
│ ├── 아파트.csv # 법정동별 평균 평당가격이 포함된 건물유형(HOUSE_TYPE)이 '아파트'인 데이터
│ ├── 연립다세대.csv # 법정동별 평균 평당가격이 포함된 건물유형(HOUSE_TYPE)이 '연립다세대'인 데이터
│ ├── 오피스텔.csv # 법정동별 평균 평당가격이 포함된 건물유형(HOUSE_TYPE)이 '오피스텔'인 데이터
│ ├── Seoul_data.csv # 서울시 부동산 실거래 데이터(2022, 2023년)
│ ├── seoul_sig_cd.geojson # 서울시 구역별 지도 데이터
│ └── seoul.geojson # 서울시 지리 데이터
│ 
├── images # 이미지 폴더
│ ├── 재개발 선정 지역.png
│ ├── 서비스 다이어그램.png
│ ├── Open Search API.png
│ ├── API 호출.png
│ ├── WBS.png
│   
├── pages # 스트림릿 페이지 파일
│ ├── 1_1️⃣_노후 건물 분포도.py # 노후 건물 분포도 페이지
│ ├── 2_2️⃣_노후 건물 거래 동향.py # 노후 건물 거래 동향 페이지
│ ├── 3_3️⃣_노후 건물 평당 가격.py # 노후 건물 평당 가격 페이지
│ ├── 4_4️⃣_재개발 부지 선정.py # 재개발 부지 선정 및 선정된 지역의 재개발 관련 뉴스 정보를 가져오는 페이지
│ 
├── app.py # 스트림릿 앱 실행 파일
├── crawling.py # 크롤링 함수가 정의된 파일
│ 
├── requirements.txt # 필요한 파이썬 패키지 목록
└── README.md # 프로젝트 설명 파일

기술 스택

  • Streamlit : 배포 및 대시보드 개발
  • Naver Open Search API : 네이버 뉴스 정보 크롤링
  • QGIS : 지리정보 활용 (v3.34.3)

라이브러리 소개(requirements.txt)

대시보드 개발

  • streamlit==1.31.0데이터 전처리
  • pandas==2.2.0
  • numpy==1.26.3시각화
  • matplotlib==3.8.2
  • plotly==5.18.0
  • pydeck==0.8.1b
  • geopandas==0.14.3크롤링 환경변수 설정
  • python-dotenv==1.0.1streamlit 페이지 처리
  • st_pages

서비스 다이어그램

  • 아래는 서비스 아키텍처를 보여주는 다이어그램입니다.


Naver Open Search API

아래는 Open Search API가 호출되는 로직입니다.

Concise API Invocation Diagram

 


 

 

스트림릿 배포

 

https://real-estate-dashboard-team-5.streamlit.app/

 

🏢 Real Estate Project Team5️⃣

requirement.txt

real-estate-dashboard-team-5.streamlit.app

 

본 프로젝트를 통해서 부동산 실거래가 자료를 사용하여 모니터링용 대시보드를 제작하여 창의적인 주제를 도출해내기 위해 노력했다.

특히 주제 선정 과정에서 실거래가로 부동산 프로그램을 만드는건 조금 뻔한 결과물이 나올것 같아 주제 선정에 많은 시간을 들이고 마인드맵을 사용하여 재개발 부지 선정을 선택하였다. 

 

건물가격과 건물면적을 나누어 평당 가격을 선정하고 구와 동별로 평균을 내어 3가지 기준치를 세우고 교차검증을 하는 방식으로 진행이 되었다.

20년 이상 된 노후 건물이 많은  상위 10동 
노후 단독다가구 ,노후 연립다세대의 거래량이 많은 상위 10동

선정된 동에서 평당 가격이 산출 가격을 초과하지 않는 동을 산출

 

위 세가지 기준을 가지고 지도시각화를 진행하고 수치적 그래프를  통해 모니터링 대시보드로 결과를 출력해 내었다. 

 

 

산출가격

 

건물 유형별 평당 가격을  구 단위로 평균을 내어 내림차순 정렬하고 24개 구 중 가격이 낮은 상위 10개구 평당 가격의 평균을 내어

산출 가격을 측정

 

산출 가격

단독다가구 2076만원

연립다세대 2150만원

 

산출 가격을 기준으로 서울시 전체의 단독다가구, 연립다세대의 평당 가격을 비교하여 산출 가격 미만인 동을 후보지로 선정



구별 단독 다가구의 평당가격 평균

 

마지막 페이지에서는 네이버오픈소스API를 사용하여 선정된 동의 최신 재개발관련 뉴스를 크롤링 해오도록 만들어 주었다.