Data Science(40)
-
[GCP] Git 연동방법
사전세팅 ssh-keygen -t rsa -b 4096 -C "깃허브이메일" cat .ssh/id_rsa.pub ssh key 발급 key에 ssh key를 등록 GCP 메타데이터에서 SSH키에도 동일하게 등록 Git설치 sudo apt-get update -y sudo apt-get upgrade -y sudo apt-get install git git --version Git 레퍼지토리 만들기 SSH 주소로 복사 git clone SSH주소 클론으로 폴더 만들기 cd mulcamp-gcp/ 폴더로 접속 vi README.md readme파일 수정 git config --global user.email "your_id@email.com" git config --global user.name "your..
2024.04.18 -
[GCP] spark설치
VM시작하기 인스턴트 만들기 지역 서울 설정 가격에 따른 머신 구성 선택 머신유형 선택 부팅디스크에서 운영체제를 Ubuntu로 변경 방화벽은 HTTP,HTTPS 트레픽 허용체크 만들기 클릭 네트워크 보안 - 프로젝트 배포를 진행하기위해서 방화벽을 열어주어야 함 네트워크 세부정보 보기 클릭 방화벽 규칙 만들기 로그 사용안함 대상 네트워크의 모든 인스턴스 소스IPv4범위 0.0.0.0 프로토콜 및 포트 모두허용 개발환경 설치 SSH버튼을 클릭 -> 브라우저 창에서 열기 선택 -개발환경 설정 miniconda 설치 먼저 경로를 cd opt로 이동 cd ../../opt 설치를 진행(참조: https://docs.conda.io/projects/miniconda/en/latest/) mkdir -p ~/mini..
2024.04.17 -
코호트분석과 활용
코호트란? 특정 시간 기간 내에서 공통적인 특징이나 경험을 공유하는 개인들의 그룹 코호트내에서 고객들이 자사의 제품을 계속 쓰게 할 수있는 방법이 무엇일지에 대한 통찰력을 얻을 수 있으며 고객 행동을 더 잘 이해하고 데이터에 기반한 의사결정을 내리는 데 도움이 되는 강력한 도구 즉 코호트는 고객 행동을 시간이 지남에 따라 분석하고 이를 통해 마케팅 및 제품 전략을 개선하려는 기업에게 유용한 인사이트를 제공하는 강력한 방법 전향적 코호트 특정 시점에 개별 그룹을 모집하고 특정 결과의 발생을 평가하기 위해 일정 기간 동안 전향적으로 추적하는 연구 이를 통해 어떤 요인들이 특정 결과를 도출할 가능성이 더 높았는지를 식별할 수 있다. 전향적 코호트 연구의 장점: 다수의 원인 및 결과를 평가할 수 있다. 원인과 ..
2024.04.09 -
[QGIS] 격자데이터 K-means Clustering
QGIS에서 제공되는 K-means 클러스터링기능에 대해 알아 보겠습니다. K-means 클러스터링은 데이터들을 K개의 클러스터로 군집화하는 비지도 학습 알고리즘입니다. 가장 큰 장점으로는 클러스터의 크기를 지정하여 사용하기 간단하고 빠르다는 장점을 가지고 있습니다. 위와 같은 무작위 분포의 격자데이터를 거리를 기준으로 같은 군집으로 만들고 싶다면 K-means 클러스터링 기능을 활용하시면 됩니다. 톱니 바퀴를 눌러 공간처리 툴박스를 생성하시면 다루기 더 편합니다. 검색창에 k-means를 검색해주시면 툴을 확인 할 수 있습니다 클러스터 수에 사용자가 원하는 군집갯수을 적어주시면 됩니다. 이후 해당레이어의 속성에들어와서 심볼을 분류값사용으로 바꾸어 줍니다. 클러스터링이 완료된 모습입니다.
2024.03.29 -
[QGIS] 지도데이터를 격자에 배치하는 방법, 면적구하기
사용된 데이터는 나주시 격자데이터와 농림지역 데이터(격자 X) 농림지역을 격자로 구분하고 격자로 배치시키는 작업 1. 지도데이터와 격자데이터를 결합 위 위치대로 격자로 쪼개어 주는 작업 벡터 - 지리 정보 처리 도구 - 교차영역을 눌러줍니다 입력레이어에는 기준이 될 데이터(격자) 중첩레이어에는 모양대로 자를(지도)를 배치시켜 주고 실행해 줍니다. 다음그림처럼 격자모양으로 지도가 배치된 모습 2.격자내 지역의 면적 계산 여기서 문제는 아주 조금만 걸친지역도 해당격자로 포함시켜 적용하기 때문에 농림지역이라고 하기 애매한 부분들도 포함이 될 수 있습니다. 때문에 사용자가 면적 범위를 지정해서 확실한 기준 구분점을 만들어 주어야 합니다. (예를 들어 나는 면적이 꽉 찬 격자만 사용할 건지 70%까지 채워진 격자..
2024.03.19 -
[QGIS] geoJson파일 데이터 칼럼 연결하기
서로 다른 GeoJson파일의 칼럼을 합치기 위해서는 공통 칼럼이 존재해야 한다. 합치고 싶은 파일들을 레이어에 올려줍니다. 기준이 될 데이터에 우클릭 속성 - 결합 이 창을 띄워주시고 아래 초록색 +버튼을 누릅니다 결합을 할 데이터를 선택하고 결합필드와 대상필드를 동일하게 맞춰주시고 OK버튼 클릭 위 사진과 같이 데이터가 결합이 되었습니다. 결합데이터중 삭제를 하고 싶은 데이터가 있다면 클릭하시고 빨간색 -버튼을 누르면 됩니다. 확인을 하시려면 기준데이터 우클릭 속성테이블 열기를 통해 확인해 보실 수 있습니다.
2024.03.14