데이터 그룹 연산을 위한 주요 함수 정리 1. apply 계열 적용 함수 1. apply(matrix, margin, function, ...) : '행/열별' 함수에 반복적 적용(연산)의 위해 사용 => 그룹함수 연산 - 2차원 구조 적용 가능, 벡터에 적용 불가 - 행별, 열별 연산을 위해 만들어짐 - 그룹함수의 적용과 함께 사용 가능 - 행/열별 "벡터"로 묶어서 함수에 전달하므로 함수는 하나의 인자를 가져야 함 > m1 apply(m1,1,sum) # 행별 sum[1] 12 15 18> apply(m1,2,sum) # 열별 sum[1] 6 15 24 2. lapply(list, function) : '원소별' 함수에 반복적 적용(연산)을 위해 사용 (리스트로 리턴) - 리스트와 데이터 프레임(ke..
데이터 가공을 위한 주요 함수 정리 #. 데이터 색인 1. 벡터 c(요소1, 요소2, ...) - 정수 색인 : vec[5] - 이름 색인 : vec['b'] - 벡터 색인 : vec[c(1,3,5)] - 슬라이스 색인 : vec[1:5] - 조건 색인 : vec[vec$'PAY'>500] 2. 리스트 list (key1 = value1, key2 = value2, .. ) - 정수(키) 색인 : list[[1]][1] - 이름 색인 : list$name[1] or list[['name']][1] 3. 행렬 matrix(1:20, nrow=4, byrow = F(세로 채우기), T(가로 채우기)) - 정수 색인 : m[2,3] # 2행,3열 - 이름 색인 : m[2,c('b','e')] - 벡터 색인 :..
요약 order() : 정렬된 쉘의 위치 값 리턴, 색인으로 데이터 정렬 / 전체 데이터 정렬 가능sort() : 정렬된 데이터 바로 리턴 / 전체 데이터 정렬 불가능orderBy() : 정렬된 데이터 바로 리턴 / 전체 데이터 정렬 가능 데이터 정렬 R에서 데이터를 정렬하는 함수는 order(), sort)(), doBy::orderby() 함수가 있습니다.주로 order(), sort() 함수가 많이 사용됩니다. # 데이터 준비> v1 v2 order(v1) # 2번째 값이 가장 큰 것을 확인[1] 1 3 5 4 2> v1[order(v1)] # 색인을 통해 정렬된 값 출력 [1] 1 2 3 5 10> v2[order(v2)] # NA를 맨 끝으로 배치(default)[1] 1 2 3 5 10 NA>..