동영상이 없는 텍스트 강의 자료입니다.
범주 변수다음과 같이 혈액형이 있다고 하자. blood = c('A', 'A', 'A', 'B', 'B', 'AB', 'O') 도수 분포표: blood A AB B O 3 1 2 1 시각화: 연속변수x = c(1, 1, 1, 2, 3, 5, 5, 7, 8, 9) 데이터를 구간으로 나눠 빈도표를 만든다. 데이터의 구간의 경계를 확인한다. [1] 0 2 4 6 8 10 수동으로 각 구간의 경계를 지정할 수 있다. 다음과 같이 하면 1, 3, 5, 7, 9를 경계로 4구간으로 나눈다. 1 ~ 3인 구간에서는 1은 포함하고, 3은 포함하지 않는다. h = hist(x, breaks = c(1, 3, 5, 7, 9), plot = F) 각 구간의 빈도를 확인한다. 1부터 3까지 구간의 빈도는 4, 3부터 5까지 구간의 빈도는 1, 등등 [1] 5 2 1 2 시각화:
hist(x, breaks = c(1, 3, 5, 7, 9)) R을 이용하면 히스토그램을 간단하게 그려볼 수 있습니다. hist()명령어로 간단하게 그리는 방법에 대해 소개해볼께요. ggplot2를이용한 히스토그램 그리기가 궁금하다면 click 우선 간단한 숫자 리스트를 만들어줍니다.
이 데이터를 hist()를 이용해보면 기본 히스토그램을 볼 수 있습니다. 하지만 다듬어지지 않은 모습입니다.
각 기둥의 두께를 조절하기 위해서는 breaks를 이용하면 됩니다.
xlim을 이용해서는 x축의 범위를 변경할 수 있습니다.
제목과 각 축의 이름, 색을 수정하면 원하는 히스토그램 완성입니다.
|