doBy 패키지 doBy 패키지는 그룹 연산을 위한 패키지 입니다. summary(data) : 데이터의 요약 통계 확인(내장 함수)# 1st=25%째 데이터, Median=50%째 데이터, 3rd =75%째 데이터를 의미> summary(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50 Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50 M..
데이터 타입 변환 함수 as.factor() # 팩터로 변환 (이 경우 factor의 levels 순서는 자동) as.numeric() # 숫자를 저장한 벡터로 변환 as.character() # 문자열을 저장한 벡터로 변환 as.Date() # 문자열을 날짜로 변환 as.matrix() # 행렬로 변환 as.array() # 배열로 변환 as.data.frame() # 데이터 프레임으로 변환 Q. > m1 m1 # 행렬 생성 no name price qty [1,] "1" "apple" "500" "5" [2,] "2" "banana" "200" "2" [3,] "3" "peach" "200" "7" [4,] "4" "berry" "50" "9" > as.data.frame(m1) # 행렬을 데이터 프..
벡터(Factor) 벡터는 "1차원에 여러개의 데이터가 모인 데이터의 집합(컬럼)" 라고 할 수 있습니다. 스칼라로 이루어진 집합이라고 할 수도 있고 프로그래밍 언어에서의 배열이라고 할 수도 있겠네요. R 에서 동시에 여러 개의 데이터를 가질 수 있는 것은 벡터뿐이라고 하니, 벡터는 자주 쓰일 만큼 중요합니다 !! 그림으로 표현하자면 "1차원 통에 , 동일한 스마일들의 모임" 과 같이 표현할 수 있습니다. 벡터는 다른 타입의 데이터를 허용하지 않습니다. 그래서 하나의 데이터 타입으로만 저장해야 합니다. 만일, 숫자 타입과 문자 타입의 데이터를 한 공간에 저장하면 하위 데이터 타입(숫자 타입)은 상위 데이터 타입(문자 타입)으로 변환되어 저장됩니다. 만일, 숫자 데이터를 연산하여 사용하려하지만, 같이 저장..
작업 디렉토리 지정 setwd("작업 디렉토리") # 작업 디렉토리의 위치 지정 getwd() # 작업 디렉토리의 위치 확인 작업 디렉토리를 지정해도 R 프로그램을 껏다 키면 기존 디렉토리 경로로 재설정됩니다. 현업에서는 주로 서버 컴퓨터에있는 R 프로그램을 공유 자원으로 사용하기 때문에, 작업 디렉토리를 변경해서 사용하는 방법보다 기존 디렉토리에 파일을 넣고 하는 습관을 들이는게 좋다고 합니다. 변수 1) 변수 생성 변수는 주로 알파벳, 숫자, _(언더스코어) 로만 이루어진 규칙을 사용하는게 좋습니다. .(마침표)도 가능하지만 파이썬이나 다른 언어의 변수에서 사용할 수 없는 경우가 있기 때문에 가능하면 공통적인 변수 규칙을 사용하는게 좋겠죠? 또한 이미 R이 사용하고있는 함수와 같은 문법적 규칙은 변수..
R Studio 다운로드 먼저 R Studio 설치를 위해 아래 링크에 들어갑니다. https://www.rstudio.com/ Products - RStudio Desktop 에 설치할 것이므로 RStudio Desktop 클릭! 마찬가지로 DOWNLOAD RSTUDIO DESKTOP 클릭! 공부 목적으로 RStudio 를 사용할 것이므로 FREE 버전으로 다운받았습니다. 자신의 컴퓨터 버전에 맞는 설치 파일을 다운 받으시면 됩니다. R Studio 설치 R Studio 설치도 굉장히 간단하고 쉽기때문에 다 default 로 두시고 진행하시면 되겠습니다. R Studio 사용 R 을 Command Mod 처럼 명령어 단위가 아닌 Script 단위로 작성하기 위해서는 file - new file - r ..
통계 프로그램으로는 SAS, SPSS, R, Python 등 다양한데요. 일단 SAS, SPSS 는 고가의 프로그램에 분석 공부를 위해 구매하기엔 굉장히 부담이 되죠.. SAS 는 대용량 데이터 분석에 사용되고, SPSS 는 소량의 데이터 분석이 주로 사용된다곤 하네요! 다행이 R 은 무료이고, 여러 기업에서 R로 다양한 분석 솔루션을 연구, 개발을 하면서 요즘 R 이 떠오르고있죠. 그럼 본격적으로 R 설치를 해봅시다! R 다운로드 먼저 R 설치를 위해 아래 링크에 들어갑니다. https://www.r-project.org/ download R 클릭! 다운받는 경로인데 다양한 나라에서 제공해주고있습니다. 저희는 Korean 이므로 Korea 를 찾아서 아무(?)거나 눌러주셔도 상관 없습니다. 한국 내에서..