기본 콘텐츠로 건너뛰기

라벨이 로지스틱인 게시물 표시

파이썬(Python)을 이용한 로지스틱 회귀분석(logistic regression)

파이썬의 statsmodels 라이브러리를 이용해 간단하게 로지스틱 회귀분석을 해볼 수 있다. 예시를 통해 살펴보자. 먼저 아래와 같이 예시 데이터프레임을 만든다. 1 2 3 4 5 6 7 8 9 10 11 12 # DataFrame 만들기 import pandas as pd score = [ 56 , 60 , 61 , 67 , 69 , 55 , 70 , 44 , 51 , 64 , 60 , 50 , 68 , 72 , 90 , 93 , 85 , 74 , 81 , 88 , 92 , 97 , 77 , 78 , 98 ] _pass = [ 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 ] result = pd . DataFrame( { "score" : score, "_pass" : _pass} ) result . tail() 위 코드에 대한 설명은  "파이썬(Python) Pandas를 이용한 데이터프레임(DataFrame) 만들기"  포스팅을 통해 확인할 수 있다. 위 코드를 Jupyter Notebook을 통해 실행해보면 아래와 같이 데이터 프레임이 만들어진 것을 확인할 수 있다. 종속변수와 독립변수가 모두 정규성을 가지는 연속적인 값을 가지고 있으면, 선형 회귀분석(linear regression)을 사용하여 독립변수들로 종속변수들을 설명하는 모델을 만들 수 있다. 선형 회귀분석은 "파이썬(Python)을 이용한 선형 회귀분석(linear regression)" 포스팅에서 더 자세한 내용을 확인할 수 있다. 하지만 종속변수가 연속값이 아니라 비연속값이면 선형회귀분석을 사용할 수 ...