rank : 벡터 값들의 순위 출력 rank(x, # 벡터 na.last = TRUE, # na는 마지막에 출력 ties.method = # 동률 순위에 대한 계산 방법 ( defualt = average) c("average", # 각 순위의 평균으로 통일 "first", # 처음 오는 순서대로 1순위 (처음으로 발견된 데이터 우선) "last", # 마지막 데이터에 1순위 (마지막에 발견된 데이터 우선) "random", # 순서 상관없이 랜덤 "max", # 동률 순위 중 가장 높은 값 출력 "min")) # 동률 순위 중 가장 낮은 값 출력(대부분의 rank 구현 방법 ) > disease library(doBy) > disease$rank orderBy(~ 콜레라, disease) 월별 콜레라 ..
연산 수치연산자와 함수 벡터 연산 벡터 연산은 벡터의 요소별로 계산을 수행할 수 있고, 대체적으로 for문 없이도 연산이 가능합니다.(단, if문 제외) 참고: [R] 벡터(vector) > x x + 10 [1] 11 11 12 12 13 13 > x + x [1] 2 2 4 4 6 6 > x == c(1,2,2,3,4,4) [1] TRUE FALSE TRUE FALSE FALSE FALSE 벡터의 산술 연산 > x sum(x) # 합 [1] 330 > mean(x) # 평균 [1] 82.5 > median(x) # 중앙값 [1] 82.5 # sum과 mean 사용 시 주의사항 > help(sum) sum(..., na.rm = FALSE) # 인자가 확장형으로 설계 > sum(1,2,3) # 사용 가..
벡터(Factor) 벡터는 "1차원에 여러개의 데이터가 모인 데이터의 집합(컬럼)" 라고 할 수 있습니다. 스칼라로 이루어진 집합이라고 할 수도 있고 프로그래밍 언어에서의 배열이라고 할 수도 있겠네요. R 에서 동시에 여러 개의 데이터를 가질 수 있는 것은 벡터뿐이라고 하니, 벡터는 자주 쓰일 만큼 중요합니다 !! 그림으로 표현하자면 "1차원 통에 , 동일한 스마일들의 모임" 과 같이 표현할 수 있습니다. 벡터는 다른 타입의 데이터를 허용하지 않습니다. 그래서 하나의 데이터 타입으로만 저장해야 합니다. 만일, 숫자 타입과 문자 타입의 데이터를 한 공간에 저장하면 하위 데이터 타입(숫자 타입)은 상위 데이터 타입(문자 타입)으로 변환되어 저장됩니다. 만일, 숫자 데이터를 연산하여 사용하려하지만, 같이 저장..