분류 전체보기(47)
-
타이타닉/Titanic 텍스트 데이터 조작
1. 타이타닉 데이터 불러오기 2. 타이타닉 데이터의 이름 데이터를 모두 소문자로 변환 3. 타이타닉 데이터 'Name' 성만 추출 해보기 .split('') 괄호안에 무엇을 기준으로 나눌지 작성 리스트로 결과물이 나오는걸 확인 str.get() 괄호안에 추출할 문자의 인덱스를 넣으면됨(성과 이름의 리스트로 나누었기 때문에 성이 인덱스 0번 ) 4. Countess 승객 데이터 뽑기 불린을 이용하여 True/False를 나누어준다. True값만 추출한다. 5. 타이타닉 데이터에서 가장 긴 이름을 가진 사람 추출 .len() 함수를 이용하여 문자열의 갯수 파악 .idxmax() 함수를 이용하여 문자열의 갯수가 가장 많은 항목의 index번호를 추출 인덱스 번호(307)를 알았으니 .loc[] 함수를 이용해..
2024.01.05 -
데이터 추출 Test
내가 쓴답 강사님 말씀 - 라이브러리를 불러오고 난 후 버전확인 필수 print(f'Numpy Version : {np.__version__}') 강사님 말씀 -데이터 연습을 위해 데이터셋 샘플을 같이 들고다니면 도움이 됨 sns.get_dataset_name() 강사님 말씀 -loc # labal -iloc # index tips.loc[:2,:]와 tips.iloc[:2,:]의 결과값이 다른이유이다. loc는 labal로 쓰기 때문에 0,1,2가 추출되지만 iloc는 index로 인식을 하기 때문에 0,1만 추출이된다. 판다스를 통해 분석에서는 iloc를 쓰기 어렵기 때문에 loc로 쓰는 연습을 해야한다. 강사님 말씀 tips.loc[tips['day']=='Sun',['total_bill','tip..
2024.01.05 -
[pandas] loc와 iloc의 차이 그리고 사용방법
Pandas의 iloc, loc은 무엇인가? - iloc의 i는 index를 표현하는 말로 말그대로 index활용한 지정방법이다. -DataFrame.iloc[index_index, column_index] -loc는 index를 사용하지 않고 직접 index명, column명을 통해서 지정하는 방법이다 -DataFrame.iloc[index_name, column_name] 사용방법 예시로 iris데이터를 불러와 실행 해보았다. iloc는 index_index인 2, column_index인1을 넣어 결과를 추출했다. loc는 index_name인 2, column_name인 'sepal_width'를 넣어 결과를 추출했다. iris의 데이터 셋은 인덱스가 숫자로 되어있어 index_name에 2를 넣..
2024.01.04 -
멀티켐퍼스 2주차-3/Pandas 기본문법과 데이터셋 다루기
날짜 자동 생성 pandas_data_range()함수의 freq 옵션 Time series / date functionality — pandas 2.1.4 documentation Time series / date functionality pandas contains extensive capabilities and features for working with time series data for all domains. Using the NumPy datetime64 and timedelta64 dtypes, pandas has consolidated a large number of features from other Python pandas.pydata.org https://pandas.pydata...
2024.01.04 -
VS Code 맥북 가상환경 구성 리뷰
1. 가상환경을 사용할 폴더를 만들기 2. VS Code를 켜준후 File - Open Folder로 미리 만들어 두었던 폴더를 선택 이 화면에서 상단 Terminal을 선택 콘다 기반의 (base)를 확인 pip3 install virtualenv 명령어를 입력 virtualenv practice 명령어 입력 source practice/bin/activate 명령어입력 (practice) 가상환경이 셋팅이 된걸 알 수 있음 명령어 pip list를 입력하여 현재 가상환경에 설치된 라이브러리를 확인 할 수 있음 현재 가상환경에는 기본라이브러리 외에는 아무것도 깔리지 않은 상태 pip install numpy pandas 명령어를 통해서 넘파이와 판다스 설치후 pip list를 통해서 확인 가상환경 비활..
2024.01.04 -
멀티캠퍼스 2주차 -2
복습 가상환경 virtualenv conda pipenv 생성 virtualenv venv conda create~ -n myenv python = 버전 접속 mac/window (PowerShell, Git Bash) / conda actuvate myenv source venv/ Scripts/activate 필요한 라이브러리 설치 pip install 라이브러리명 / conda install 라이브러리 해제 deactivate conda deactivate MAC의 경우 환경변수 파일을 열어서 수동으로 세팅 Vi편집기를 통해서 세팅 터미널 - vi~/.zshrc vi main.py i : insert :wq(저장) Numpy 선형대수, 행렬 수치연산과 관련된 라이브러리 통계 포커싱두고 공부 > 응용..
2024.01.04