본문 바로가기
공부/r 프로그래밍

R 특이값 구하고 삭제/변경 하기

by 남는곰 2023. 5. 17.
728x90
반응형

특이값이란? 

데이터의 분포중 최고 최소치를 벗어나 분석 결과에 비정상적으로 큰영향을 주는 값으로

이상치라고도하며 연구자의 주관에따라 정규분포상 표준분포 3배 이상의 범위 혹은

통상적으로 밑에 상자그림과 같이 수염 이상에 값을 이상치로 구한다.

 

수염의 값은

IQR*1.5 한 범위내로 하며, 이 범위를 벗어나면 보통 이상치로 판단한다.

이는 IQR방법론에서 

IQR의 계수를 1과 2 그리고 1.5로 했을때

정규분포상 가장 적절히 데이터를 포함한 것이 

IQR 1.5가 가장 적절히 +-2

 

 

 

★R 코드로 결측치 구하기

st 변수에 state.x77이라는 r내에 있는 데이터를 가져온다.

상자그림을 그렸을때 

 

그려지는데 

plot(변수)$out 이라고 하면 결측치를 구해준다.

 ★결측치 조정 

-삭제 방법 

1.그 행을 직접 구해 없앤다.

인덱싱을 통해 조정할 수 있다.

st[행 조건,열]을 통해 행조건만 뽑아낼 수 있다.

 

 

-조정방법

1.그 결측치 찾아낸 다음 특정값으로 바꾼다.

반응형

댓글