[심화세션]_6주차
13. 머신러닝 분석 방법론 ~~ 13.4 선형 판별분석과 이차 판별분석(분류 모델) 판별분석: 로지스틱 회귀분석처럼 질적 척도로 이루어진 종속변수를 분류할 때 쓰이는 기법 기계학습보다 통계기반의 데이터 분류 모델에 더 가까움, 로지스틱 회귀분석보다 우수한 것으로 알려짐. 30% 적은 데이터로도 로지스틱 회귀분석과 유사한 성능을 낼 수 있다...
13. 머신러닝 분석 방법론 ~~ 13.4 선형 판별분석과 이차 판별분석(분류 모델) 판별분석: 로지스틱 회귀분석처럼 질적 척도로 이루어진 종속변수를 분류할 때 쓰이는 기법 기계학습보다 통계기반의 데이터 분류 모델에 더 가까움, 로지스틱 회귀분석보다 우수한 것으로 알려짐. 30% 적은 데이터로도 로지스틱 회귀분석과 유사한 성능을 낼 수 있다...
12. 통계 기반 분석 방법론 12.1 분석 모델 개요 통계 모델(Statistical model) 기계 학습(Machine learning) 모형과 해석 중요, 오차와 불확정성 강조 대용량 데이터 활용해 예측 정확도 향상 중시 비지...
주교재 [7장] 물류 네트워크 최적 설계를 위한 테크닉 10 61. 운송 최적화 문제를 풀어보자 # 초기 설정 # np.random.seed(1) nw = len(df_tc.index) nf = len(df_tc.columns) pr = list(product(range(nw), range(nf))) # 수리 모델 작성 # # 모델 ...
[6장] 다양한 가설검정 6.1 다양한 가설검정 어떤 가설 검정이든 간에 해석의 기본은 공통이다. 가설검정 해석의 기본 흐름 데이터 유형 먼저 확인 데이터 유형이 양적 변수인지 질적 변수인지에 따라 해석 방법이 달라진다. 분할표: 각 상태에 몇 개 데이터가 있는지를 나타내는 표 산점도: x-y 평면...
주교재 [5장] 회원 탈퇴를 예측하는 테크닉 10 DT를 통해 탈퇴를 예측하는 흐름을 배워보자. 41. 데이터를 읽어들이고 이용 데이터를 수정하자 import pandas as pd customer = pd.read_csv('customer_join.csv') uselog_months = pd.read_csv('use_log_months...
사전 학습 정리 주교재 [3장] 고객의 전체 모습을 파악하는 테크닉 10 21. 데이터를 읽어들이자 22. 데이터를 가공하자 # 테이블 조인하기 customer_join = pd.merge(customer, class_master, on="class", how="left") customer_join = pd.merge...
사전 학습 정리 교재 주교재: [파이썬 데이터 분석 실무 테크닉 100] 부교재: [통계101 x 데이터 분석] 주교재 [1장] 웹에서 주문 수를 분석하는 테크닉 10 1. 데이터를 읽어들이자 # pandas 임포트, 변수에 파일 저장, 데이터의 첫 5행 표시 import pandas as pd custome...
구성 교재: [실무로 통하는 인과추론 with.파이썬] 기본적으로 머신러닝, 통계, 파이썬 프로그래밍에 대한 일정 수준의 사전 진식이 있다고 가정하고 설명한다. 1부: 인과추론의 기본 개념 1장: 가격 인하가 미치는 영향을 분석하는 데 필요한 인과추론의 주요 개념 2장: A/B 테스트의 중요성 3장: 인과관...
세션 전 학습 내용 교재: p.286 ~ p. 337 [6-1] 군집 알고리즘 핵심 키워드: 비지도 학습, 히스토그램, 군집 과일 사진 데이터 준비하기 !wget https://bit.ly/fruits_300_data -O fruits_300.npy 코랩의 코드 셀에서 ‘!’로 시작하면 코랩은 이후 명령을 파이썬 코드가 아니라 ...
세션 전 학습 내용 교재: p.220 ~ p.283 [5-1] 결정 트리 핵심 키워드: 결정 트리, 불순도, 정보 이득, 가지치기, 특성 중요도 로지스틱 회귀 모델로의 와인 분류 문제 접근 import pandas as pd wine = pd.read_csv('https://bit.ly/wine_csv_data') wine.head...