파이썬을 이용해 히스토그램을 그릴 수 있다. 예시를 통해 살펴보자.
먼저 아래와 같이 body라는 데이터프레임을 만든다.
위 코드에 대한 설명은 "파이썬(Python) Pandas를 이용한 데이터프레임(DataFrame) 만들기" 포스팅에 설명해 놨으니 참고하자.
아래의 코드가 이번 포스팅의 메인인 히스토그램을 그리는 방법에 대한 설명이다.
히스토그램을 그리기 위해 먼저, matplotlib.pylab을 import한다.
body['height']를 이용해 body 데이터프레임의 height만 가져온다.
그런 다음 plot(kind="hist)를 사용해 히스토그램을 그린다. 그 뒤엔 여러 옵션들을 설정해줄 수 있다.
range는 히스토그램으로 표시할 범위를 지정하는 것이다.
bins는 히스토그램의 구간을 몇 개로 나눌지 지정하는 것이다.
edgecolor은 히스토그램의 윤곽선 색을 지정하는 것이다.
히스토그램을 그리고 plt.show()를 사용하면 히스토그램이 그려진다.
히스토그램을 그리는 데 몇 가지 옵션들은 지정하여 더 예쁘게 그릴 수 있다. 이 옵션들은 히스토그램만에 국한되지 않는다. 다른 그래프를 그릴 때도 사용할 수 있다.
plt.title()은 히스토그램의 제목을 상단에 지정하는 것이고,
plt.xlabel()은 히스토그램의 x축 제목을 정하는 것이다. y축 제목을 지정하고 싶으면, plt.ylabel()을 사용하면 된다.
히스토그램에 average 값을 선으로 넣어보자. 먼저 averag를 구해야 한다. average를 쉽게 구하기 위해서는 numpy 라이브러리를 import한다.
구하려는 평균값인 body['height']를 np.average() 메서드를 사용해 평균을 구한다.
plt.axvline()을 사용해서 평균값을 x축에 수직으로 긋는다.
옵션값으로 color, linestyle, linewidth, label을 지정할 수 있다.
plt.legend()를 사용해 라벨을 출력한다.
최종 결과물은 아래와 같다.
끝.
먼저 아래와 같이 body라는 데이터프레임을 만든다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | import pandas as pd height = [170, 168, 177, 181 ,172, 171, 169, 175, 174, 178, 170, 167, 177, 182 ,173, 171, 170, 179, 175, 177, 186, 166, 183, 168] weight = [70, 66, 73, 77, 74, 73, 69, 79, 77, 80, 74, 68, 71, 76, 78, 72, 68, 79, 77, 81, 84, 73, 78, 69] # DataFrame 만들기 body = pd.DataFrame( {'height': height, 'weight': weight } ) body.tail() |
위 코드에 대한 설명은 "파이썬(Python) Pandas를 이용한 데이터프레임(DataFrame) 만들기" 포스팅에 설명해 놨으니 참고하자.
아래의 코드가 이번 포스팅의 메인인 히스토그램을 그리는 방법에 대한 설명이다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | # 히스토그램 그리기 import matplotlib.pylab as plt import numpy as np body['height'].plot(kind="hist", range=(160, 190), bins = 12, edgecolor ="black" ) avg_height = np.average(body['height']) plt.axvline(avg_height, color ='red', linestyle ='dotted', linewidth=3, label='average') plt.legend() plt.title("Histogram Example") plt.xlabel("height") plt.show() |
히스토그램을 그리기 위해 먼저, matplotlib.pylab을 import한다.
body['height']를 이용해 body 데이터프레임의 height만 가져온다.
그런 다음 plot(kind="hist)를 사용해 히스토그램을 그린다. 그 뒤엔 여러 옵션들을 설정해줄 수 있다.
range는 히스토그램으로 표시할 범위를 지정하는 것이다.
bins는 히스토그램의 구간을 몇 개로 나눌지 지정하는 것이다.
edgecolor은 히스토그램의 윤곽선 색을 지정하는 것이다.
히스토그램을 그리고 plt.show()를 사용하면 히스토그램이 그려진다.
히스토그램을 그리는 데 몇 가지 옵션들은 지정하여 더 예쁘게 그릴 수 있다. 이 옵션들은 히스토그램만에 국한되지 않는다. 다른 그래프를 그릴 때도 사용할 수 있다.
plt.title()은 히스토그램의 제목을 상단에 지정하는 것이고,
plt.xlabel()은 히스토그램의 x축 제목을 정하는 것이다. y축 제목을 지정하고 싶으면, plt.ylabel()을 사용하면 된다.
히스토그램에 average 값을 선으로 넣어보자. 먼저 averag를 구해야 한다. average를 쉽게 구하기 위해서는 numpy 라이브러리를 import한다.
구하려는 평균값인 body['height']를 np.average() 메서드를 사용해 평균을 구한다.
plt.axvline()을 사용해서 평균값을 x축에 수직으로 긋는다.
옵션값으로 color, linestyle, linewidth, label을 지정할 수 있다.
plt.legend()를 사용해 라벨을 출력한다.
최종 결과물은 아래와 같다.
끝.
댓글
댓글 쓰기