본문 바로가기

Radiant

Radiant 사용하기 (7) Explore 탭

Explore 탭은 데이터 탐색 단계에서 주로 사용한다.

 

하나의 숫자형 변수를 선택하고 Apply function(s) 에서 평균, 표준편자, 최댓값, 최솟값 등을 계산해주는 것이다.

 

 

예를 들어, 5 number summary 를 보고 싶다면 (min, 25%, median, 75%, max) 를 선택해주면 되는 것이다.

 

이 때, % 는 quantile 을 얘기한다.

 

표준편차와 분산도 여러 종류가 있는데 정확히 알고 쓰기 위해 몇 가지만 정리하도록 하겠다.

 

sd = standard deviation of sample data

sdpop = standard deviation of population data

var = variation of sample data

varpop = variation of population data

25% = 25% quantile (하위 25%)

75% = 75% quantile (하위 75%)