본문 바로가기
728x90
반응형

데이터5

[R 프로그래밍] cbind, rbind, merge 데이터 합치기,병합 cbind는 colunm bind로 세로로 붙임. 즉, 데이터 프레임이 x, y + y, z 라면 (+병합을 의미) x y y z 세로로 붙이는 것을 말함. rbind는 row bind로 행단위로 붙임. 10*5의 데이터 프레임과 5*5의 데이터 행렬이 있다면 15*5가 됨. ※주의 사항이 있다면 r bind는 각 변수 갯수와 이름이 같아야함. 그렇지 않으면 아래와 같이 에러가 뜰 수 있음. merge는 기준이 되는 변수를 기준으로 c bind함. 여러 옵션을 줄 수 있는데, 기준을 내가 직접 by= 옵션을 통해 지정할 수 있고,(이떄 c()로 묶어서 해야함._) 기준별로 합병했을때 결측값들을 어떤 것 기준으로 보여줄지 결정 할 수 있음. 그외에는 ?merge 라고 코딩하면 자세한 내용을 보여줌 간단하게.. 2023. 6. 1.
R 데이터 집계하는 법 , 열별로 평균, 합계, 최대값 산출 BY=LIST(쓰고싶은 이름=변수) 쓴다. 쓰고싶은 이름이 없으면 기본값으로 분류하는 열 이름으로 산출합니다. FUN= 옵션자리는 mena, max ,sd ,sum 등 옵션등이 들어갈 수 있습니다. 2023. 5. 31.
R 변수 모두 삭제하는법/ 실행 단축키 오늘 설명할 코드는 제가 R사용하면서 많이 사용하는 코드인 변수 삭제코드입니다. r studio를 이용해서 r 프로그래밍하다보면 새로운 분석때 마다 변수가 지저분해서 불편했던 적이 많았습니다. 이 코드를 이용하면 현재 만든 모든 데이터를 삭제할 수 있습니다. ★만약 1개의 변수만 삭제하고 싶다면 rm(변수이름)을 통해 삭제할 수 있습니다. ★한줄 실행 단축키 alt+enter 드래그 해서 실행 -> 드래그한 부분만 실행 단축키 실행-> 해당 커서가 있는 부분 실행 전체실행의 경우 모든 코드를 드래그해서 단축키 실행하면 편함. 2023. 5. 18.
R 데이터 샘플링, 데이터 랜덤하게 추출하기 모집단의 크기가 매우 큰 경우에는 표본을 추출하여 분석한다. 모집단을 통해 랜덤하게 추출한 표본의 통계치는 모집단을 대표할 수 있으며. 우리가 통계학에서 배우듯 표본 평균의 표본 분포는 모집단의 평균을 따른다. 물론 분산은 달라질 수 있지만 대표적인 분석치인 평균이 모집단을 따른다는 것이 큰 주요점으로 알 수 있다. 대한민국 전체 가구의 소득을 조사한다고 했을때 5천만 가구의 데이터를 돌리다보면 아무리 좋은 컴퓨터라할지라도 몇시간 아니 하루넘게 걸릴수도 있다. 따라서 우리는 표본을 추출하여 데이터를 분석할 수 있다. ★R에서 랜덤하게 데이터를 추출하는 방법 R에서는 sample 이라는 함수가 있다 일정 백터에서의 샘플링은 위와같이 간단하게 샘플 함수를 통해 다른 백터에 저장할 수 있다. 여기서 특이한점은.. 2023. 5. 18.
728x90
반응형