doBy 패키지 doBy 패키지는 그룹 연산을 위한 패키지 입니다. summary(data) : 데이터의 요약 통계 확인(내장 함수)# 1st=25%째 데이터, Median=50%째 데이터, 3rd =75%째 데이터를 의미> summary(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50 Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50 M..
그룹별 적용- apply() : 2차원 데이터를 행, 열 방향으로 연산 # 적용방향 = 1:같은 행별, 2:같은 열별, c(1,2): 원소별 원소별 적용- sapply() : 벡터에 함수를 반복 적용(벡터로 출력) # 데이터 색인 시 벡터가 편리하므로, 주로 sapply()를 사용- lapply() : 벡터에 함수를 반복 적용(리스트로 출력)- mapply() : 벡터에 함수를 반복 적용(리스트로 출력) # sapply()와 유사, 다수의 인자를 받는 함수를 적용하기 위해 사용 그룹별 연산 - tapply() : 그룹별 연산 * 작성 방법apply(iris[,-5], 2, mean)sapply(iris[,-5], mean)lapply(iris[,-5], mean)mapply(mean, iris[,-5])..
R에 내장된(탑재된) 데이터 셋 중 분석 연습에 가장 흔히 사용되는 데이터 셋은 iris 데이터일 것입니다.iris 데이터는 data.frame 형식으로 저장되어있기 때문에 데이터 확인이 바로 가능한 것입니다.> data(iris)> iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 3.0 1.4 0.2 setosa...149 6.2 3.4 5.4 2.3 virginica150 5.9 3.0 5.1 1.8 virginica> str(iris)'data.frame':150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5..
R에서 데이터 포맷 변경을 위해 as.character() 함수를 주로 사용합니다. 데이터 포맷 변경 함수 데이터 포맷 변경 함수 sprintf(), gettextf()는 as.character()함수와 유사하지만 as.character()함수보다 성능이 더 우수하다는 점!다만, 문자형으로 리턴되서 숫자로 사용 시 숫자형으로 변환이 필요합니다. 1. sprintf() 함수 sprintf(format, data) # format = d : 정수 f : 실수 s : 문자열> sprintf('%02d', 2) # 오라클에서 to_char(2, '09') 와 유사[1] "02"> sprintf('%10d', 2) # 2를 열 자리 정수로 표현하되 부족한 자리수는 공백[1] " 2"> sprintf('%010d'..
파일 입력 read.csv() : 외부 csv 파일을 불러오고, 데이터 프레임 형식으로 저장 read.table() : 텍스트 파일을 불러오고, 데이터 프레임 형식으로 저장 scan() : 외부 텍스트 파일을 불러오고, 벡터 형식으로 저장 readline() : 사용자 입력 데이터 저장(사용자에게 메시지 전달 가능) readLine() : 텍스트 파일을 한 줄씩 읽어 문자열 벡터로 저장 파일 출력 write.csv() : 데이터 프레임을 외부 csv 파일로 저장 객체 파일 입출력 save() : 메모리에 있는 객체를 파일에 저장 load() : 외부 파일로 객체를 메모리로 읽기 파일 입력 read.csv() : 외부 csv 파일을 불러오고, 데이터 프레임 형식으로 저장 read.csv(file, stri..
엑셀 파일 불러오기(읽기), 엑셀 파일 내보내기(저장) #1. 신버전> name price item item NAME PRICE1 iPhone 1002 iPad 803 Mac 200 > install.packages("xlsx") > library(xlsx)# R 에서 작업한 데이터 외부에 엑셀 파일로 저장하기> write.xlsx(item, "item.xlsx")# 외부 엑셀 파일 R로 불러오기 > read.xlsx("item", "item.xlsx") #2. 구버전(2003)> name price item item NAME PRICE1 iPhone 1002 iPad 803 Mac 200 > install.packages("WriteXLS") > library(WriteXLS)# R 에서 작업한 데이터..
R에서 텍스트 파일을 읽어올 때 incomplete final line found on '파일 경로'혹은'read.csv'에서 readTableHeader에 의하여 발견된 완성되지 않은 마지막 라인입니다. 라고 Warning message가 출력되는 이유는 R이 텍스트 파일의 끝을 인식할 수 없기 때문입니다. 해결 방법은 텍스트 파일의 마지막 한 줄을 띄어주면(Enter!!) 됩니다. R은 Line이 바뀌고 데이터가 없을 때, 파일의 끝을 인식하기 때문에 텍스트 파일 생성 시 마지막에 Enter! 해주는 것 잊지 마시길!
함수의 정의 사용자 정의 함수 : 코드의 반복을 줄이기 위한 사용자 정의 함수 function(함수) 생성 시 반환되는 하나의 return 값이 꼭 있어야 합니다. # 함수의 인자는 위치에 맞게 순서대로 작성하거나 이름으로 작성할 수 있습니다. > func func(1,2)[1] 1 2> func(y=2, x=1)[1] 1 2 가변 길이 인자를 가진 함수 : 함수의 인자 개수가 정해지지 않은 경우 > func func func2 func2(1,2,3)[1] 1[1] 2 3 중첩 함수 : 함수 안에 또 다른 함수를 정의 > func f3 f3(1,1)[1] 2> f3(1) # 1 + 3(y=3)[1] 4 Q.# 연습문제 # abs함수와 동일한 사용자 정의함수를 f_abs이름으로 생성> abs(-3) # 절..