본문 바로가기
728x90
반응형

공부/r 프로그래밍9

R: 변수의 이름을 바꾸는 방법/ 데이터 분리 방법 R에서 변수 이름을 바꾸기위해서는 reshape라는 패키지가 필요하다. 보통은 안깔려있으니 install.packages("reshape")를 통해서 깔고 library함수를 통해 reshape 패키지를 라이브러리에 불러오자 rename이라는 함수를 통해 변수이름을 변경할 수 있다. 함수의 구조는 다음과 같다. rename(데이터,c("바꾸기전 변수이름1"="바꾸고나서 변수이름1","바꾸기전 변수이름2"="바꾸고나서 변수이름2")) c함수는 여러 데이터를 하나의 집합으로 묶어주는 함수이다. rename에서는 바꿀 변수명이 1여도 c로 표기해야한다.(꼭!) rename으로 바꾼 데이터는 따로 저장하는 것이 좋고, R에서 데이터에 변수나 추출 하는 함수는 출력만 할뿐, 실제로 바꾸지 못하니 따로 다른 변수나.. 2023. 5. 20.
R 변수 모두 삭제하는법/ 실행 단축키 오늘 설명할 코드는 제가 R사용하면서 많이 사용하는 코드인 변수 삭제코드입니다. r studio를 이용해서 r 프로그래밍하다보면 새로운 분석때 마다 변수가 지저분해서 불편했던 적이 많았습니다. 이 코드를 이용하면 현재 만든 모든 데이터를 삭제할 수 있습니다. ★만약 1개의 변수만 삭제하고 싶다면 rm(변수이름)을 통해 삭제할 수 있습니다. ★한줄 실행 단축키 alt+enter 드래그 해서 실행 -> 드래그한 부분만 실행 단축키 실행-> 해당 커서가 있는 부분 실행 전체실행의 경우 모든 코드를 드래그해서 단축키 실행하면 편함. 2023. 5. 18.
R 데이터 샘플링, 데이터 랜덤하게 추출하기 모집단의 크기가 매우 큰 경우에는 표본을 추출하여 분석한다. 모집단을 통해 랜덤하게 추출한 표본의 통계치는 모집단을 대표할 수 있으며. 우리가 통계학에서 배우듯 표본 평균의 표본 분포는 모집단의 평균을 따른다. 물론 분산은 달라질 수 있지만 대표적인 분석치인 평균이 모집단을 따른다는 것이 큰 주요점으로 알 수 있다. 대한민국 전체 가구의 소득을 조사한다고 했을때 5천만 가구의 데이터를 돌리다보면 아무리 좋은 컴퓨터라할지라도 몇시간 아니 하루넘게 걸릴수도 있다. 따라서 우리는 표본을 추출하여 데이터를 분석할 수 있다. ★R에서 랜덤하게 데이터를 추출하는 방법 R에서는 sample 이라는 함수가 있다 일정 백터에서의 샘플링은 위와같이 간단하게 샘플 함수를 통해 다른 백터에 저장할 수 있다. 여기서 특이한점은.. 2023. 5. 18.
R 특이값 구하고 삭제/변경 하기 특이값이란? 데이터의 분포중 최고 최소치를 벗어나 분석 결과에 비정상적으로 큰영향을 주는 값으로 이상치라고도하며 연구자의 주관에따라 정규분포상 표준분포 3배 이상의 범위 혹은 통상적으로 밑에 상자그림과 같이 수염 이상에 값을 이상치로 구한다. 수염의 값은 IQR*1.5 한 범위내로 하며, 이 범위를 벗어나면 보통 이상치로 판단한다. 이는 IQR방법론에서 IQR의 계수를 1과 2 그리고 1.5로 했을때 정규분포상 가장 적절히 데이터를 포함한 것이 IQR 1.5가 가장 적절히 +-2 ★R 코드로 결측치 구하기 st 변수에 state.x77이라는 r내에 있는 데이터를 가져온다. 상자그림을 그렸을때 그려지는데 plot(변수)$out 이라고 하면 결측치를 구해준다. ★결측치 조정 -삭제 방법 1.그 행을 직접 구.. 2023. 5. 17.
728x90
반응형