데이터셋의 짝수행과 홀수행 구분

2019-10-01 1 min read R

유투브에서 말하길, 파이썬을 이용하면 모듈과 자료를 불러들이는 과정을 포함하여 단 세 줄의 코드로 데이터셋에서 짝수행을 뽑을수 있다고 한다. R에서도 할 수 있겠다 싶어 머리를 굴려봤다.

library(dplyr)
data <- read.csv("filename")
data_even <- filter(data, seq_len(nrow(data))%% 2==0) # 짝수행
data_odd <- filter(data, seq_len(nrow(data))%% 2==1) # 홀수행

위의 코드를 단계별로 설명하면,

seq_len() 함수를 이용하여 데이터 테이블의 마지막 행 까지 인덱스를 부여
각각의 인덱스를 2로 나눈 나머지가 0인 행과 1인 행을 각각 필터링

위 두 단계를 거쳐 짝수행과 홀수행을 구분하였다. 파이썬 만큼 깔끔하지는 않지만 어쨌든 패키지를 불러와서 짝수행을 뽑는 것 까지 3~4줄의 R코드면 된다.

이 방법을 이용해서 청소년정책분석평가센터가 매년 공개하는 청소년정책성과(청소년의 삶의질, 청소년참여활동수준) 점수를 하나의 테이블로 간단히 정리하였다. 연도별 17개 시도의 성과정보를 스크래핑 하는 코드는 Github에 올렸다.

web scraping R문법

데이터셋의 짝수행과 홀수행 구분

Related