728x90 반응형 통계5 r프로그래밍 파이프라인 %>% 사용해서 변수이름 바꾸기 파이프라인이란 먼저 %>% 라는 연산자를 쓰고 왼쪽 변수에 오른쪽 변수들을 적용해주는 것 입니다. 여러가지 함수를 한번에 연산할때 사용합니다. 맨위 코드들을 보면 변수 이름을 변경할때 알 수 있다 싶이 reshape이라는 패키지속 rename 함수를 쓰면되고 사용방법은 아래 블로그를 참고 하면 알 수 있다 싶이 rename(기존데이터셋,c(기존변수명="바꿀변수명",기존변수명="바꿀변수명") 입니다. https://0509ds.tistory.com/310 R: 변수의 이름을 바꾸는 방법/ 데이터 분리 방법 R에서 변수 이름을 바꾸기위해서는 reshape라는 패키지가 필요하다. 보통은 안깔려있으니 install.packages("reshape")를 통해서 깔고 library함수를 통해 reshape 패키지를.. 2023. 6. 6. R 변수 모두 삭제하는법/ 실행 단축키 오늘 설명할 코드는 제가 R사용하면서 많이 사용하는 코드인 변수 삭제코드입니다. r studio를 이용해서 r 프로그래밍하다보면 새로운 분석때 마다 변수가 지저분해서 불편했던 적이 많았습니다. 이 코드를 이용하면 현재 만든 모든 데이터를 삭제할 수 있습니다. ★만약 1개의 변수만 삭제하고 싶다면 rm(변수이름)을 통해 삭제할 수 있습니다. ★한줄 실행 단축키 alt+enter 드래그 해서 실행 -> 드래그한 부분만 실행 단축키 실행-> 해당 커서가 있는 부분 실행 전체실행의 경우 모든 코드를 드래그해서 단축키 실행하면 편함. 2023. 5. 18. R 데이터 샘플링, 데이터 랜덤하게 추출하기 모집단의 크기가 매우 큰 경우에는 표본을 추출하여 분석한다. 모집단을 통해 랜덤하게 추출한 표본의 통계치는 모집단을 대표할 수 있으며. 우리가 통계학에서 배우듯 표본 평균의 표본 분포는 모집단의 평균을 따른다. 물론 분산은 달라질 수 있지만 대표적인 분석치인 평균이 모집단을 따른다는 것이 큰 주요점으로 알 수 있다. 대한민국 전체 가구의 소득을 조사한다고 했을때 5천만 가구의 데이터를 돌리다보면 아무리 좋은 컴퓨터라할지라도 몇시간 아니 하루넘게 걸릴수도 있다. 따라서 우리는 표본을 추출하여 데이터를 분석할 수 있다. ★R에서 랜덤하게 데이터를 추출하는 방법 R에서는 sample 이라는 함수가 있다 일정 백터에서의 샘플링은 위와같이 간단하게 샘플 함수를 통해 다른 백터에 저장할 수 있다. 여기서 특이한점은.. 2023. 5. 18. R 특이값 구하고 삭제/변경 하기 특이값이란? 데이터의 분포중 최고 최소치를 벗어나 분석 결과에 비정상적으로 큰영향을 주는 값으로 이상치라고도하며 연구자의 주관에따라 정규분포상 표준분포 3배 이상의 범위 혹은 통상적으로 밑에 상자그림과 같이 수염 이상에 값을 이상치로 구한다. 수염의 값은 IQR*1.5 한 범위내로 하며, 이 범위를 벗어나면 보통 이상치로 판단한다. 이는 IQR방법론에서 IQR의 계수를 1과 2 그리고 1.5로 했을때 정규분포상 가장 적절히 데이터를 포함한 것이 IQR 1.5가 가장 적절히 +-2 ★R 코드로 결측치 구하기 st 변수에 state.x77이라는 r내에 있는 데이터를 가져온다. 상자그림을 그렸을때 그려지는데 plot(변수)$out 이라고 하면 결측치를 구해준다. ★결측치 조정 -삭제 방법 1.그 행을 직접 구.. 2023. 5. 17. 이전 1 2 다음 728x90 반응형