진리값의 연산자 진리값의 연산자는 처음에 잡아두지 않으면 나중에 헷갈리기때문에 중요합니다! 논리 연산자 사용법 and 연산 : & , && or 연산 : | , || 1) 하나의 연산자( &, | ) 는 요소가 많을 경우(Vector), 요소 간의 논리연산을 수행(요소끼리 비교하고 싶을 때 사용)합니다. # 요소별 and 논리연산 수행(두 요소 모두 True 를 만족해야 True) c(TRUE, FALSE) & c(TRUE, TRUE) # [1] TRUE FALSE * 왼쪽 벡터의 첫 번째 요소 TRUE 와 오른쪽 벡터의 첫 번째 요소 TRUE의 &(and) 결과 = TRUE * 왼쪽 벡터의 두 번째 요소 FALSE 와 오른쪽 벡터의 두 번째 요소 TRUE의 &(and) 결과 = FALSE # 요소별 o..
팩터(Factor) Factor 란 "정해진 범주 내에서 카테고리별로 분석(범주형 자료 분석)을 하기 위해 주로 사용되는 데이터 자료형"입니다. 그림으로 표현하자면 "하나의 통에 , 각각 범주가 있는 스마일들의 모임"과 같이 표현할 수 있습니다. 남, 녀 / 상, 중, 하 같은, 중간에 다른 값이 포함될 수 없는 값을 범주형 데이터라고 합니다.Factor 형 변수를 만들 때 사전에 정의되어진 범주이외는 정의되지 않기때문에, 정의되어있지 않는 데이터를 입력하면 NA로 처리됩니다.(용어에서 범주 = 레벨 = 카테고리 다 같은 의미입니다.) 성별 변수가 있다면, 정의되어진 레벨(남, 녀) 이외의 다른 값은 절대 허용되지 않는다는 뜻이죠.범주형 자료분석에 주로 사용되고, 라인(범주)별로의 분포 비교를 할 때 유..
벡터(Factor) 벡터는 "1차원에 여러개의 데이터가 모인 데이터의 집합(컬럼)" 라고 할 수 있습니다. 스칼라로 이루어진 집합이라고 할 수도 있고 프로그래밍 언어에서의 배열이라고 할 수도 있겠네요. R 에서 동시에 여러 개의 데이터를 가질 수 있는 것은 벡터뿐이라고 하니, 벡터는 자주 쓰일 만큼 중요합니다 !! 그림으로 표현하자면 "1차원 통에 , 동일한 스마일들의 모임" 과 같이 표현할 수 있습니다. 벡터는 다른 타입의 데이터를 허용하지 않습니다. 그래서 하나의 데이터 타입으로만 저장해야 합니다. 만일, 숫자 타입과 문자 타입의 데이터를 한 공간에 저장하면 하위 데이터 타입(숫자 타입)은 상위 데이터 타입(문자 타입)으로 변환되어 저장됩니다. 만일, 숫자 데이터를 연산하여 사용하려하지만, 같이 저장..
작업 디렉토리 지정 setwd("작업 디렉토리") # 작업 디렉토리의 위치 지정 getwd() # 작업 디렉토리의 위치 확인 작업 디렉토리를 지정해도 R 프로그램을 껏다 키면 기존 디렉토리 경로로 재설정됩니다. 현업에서는 주로 서버 컴퓨터에있는 R 프로그램을 공유 자원으로 사용하기 때문에, 작업 디렉토리를 변경해서 사용하는 방법보다 기존 디렉토리에 파일을 넣고 하는 습관을 들이는게 좋다고 합니다. 변수 1) 변수 생성 변수는 주로 알파벳, 숫자, _(언더스코어) 로만 이루어진 규칙을 사용하는게 좋습니다. .(마침표)도 가능하지만 파이썬이나 다른 언어의 변수에서 사용할 수 없는 경우가 있기 때문에 가능하면 공통적인 변수 규칙을 사용하는게 좋겠죠? 또한 이미 R이 사용하고있는 함수와 같은 문법적 규칙은 변수..
스칼라(Scalar) 스칼라는 단일 차원의 값, 단 하나의 원소값을 의미합니다. 간단하죠? 한 변수에 하나의 값이 들어있다면, 그것은 스칼라라고 할 수 있겠죠? 그림으로 표현하자면 단일 차원의 통에 , 단 하나의 스마일 같이 표현할 수 있습니다. 스칼라만 설명하면 너무 단순하니.. NA, NULL 도 추가했습니다. 1) NA, NULL R 에서 NA는 잘못된 값, NULL은 아직 정해지지 않은 값을 의미합니다.> var1 var1 NULL# 여기서 null은 입력된 널 값을 의미하는 것이 아니라 변수에 값이 정해지지 않앗다는 의미의 null이 출력) > var2 var2 [1] 1 # var2 라는 변수에 1 이라는 정해진 값이 있기때문에, null이 아닌 1을 출력, null은 아직 값이 정해지지 않았..
환경 변수 PATH 설정 Java, C, Python, R 등 프로그램들을 설치했다면, 컴퓨터에게 이 프로그램을 실행하기 위한 파일들이 어떤 경로에 있다고 명시해주어야 컴퓨터가 이 경로를 참고하여 프로그램을 실행시킬 수 있습니다. 하지만, PATH 설정이 되어있지 않거나, 잘못 명시되어있다면, 프로그램을 실행해도 컴퓨터가 경로를 찾기 못하게 되므로, PATH 오류가 발생하게 됩니다. 프로그램이 설치되는 과정에서 자동으로 설정해주기도 하지만 그렇지 않는 경우도 있기 때문에, 환경 변수 PATH 설정하는 방법은 잘 알고 계시면 좋습니다! 환경 변수 PATH 를 설정하러 가볼까요~! Step 1) 내 PC 우 클릭, 속성 클릭 Step 2) 고급 시스템 설정 클릭 Step 3) 환경 변수 클릭 Step 4) ..
R Studio 다운로드 먼저 R Studio 설치를 위해 아래 링크에 들어갑니다. https://www.rstudio.com/ Products - RStudio Desktop 에 설치할 것이므로 RStudio Desktop 클릭! 마찬가지로 DOWNLOAD RSTUDIO DESKTOP 클릭! 공부 목적으로 RStudio 를 사용할 것이므로 FREE 버전으로 다운받았습니다. 자신의 컴퓨터 버전에 맞는 설치 파일을 다운 받으시면 됩니다. R Studio 설치 R Studio 설치도 굉장히 간단하고 쉽기때문에 다 default 로 두시고 진행하시면 되겠습니다. R Studio 사용 R 을 Command Mod 처럼 명령어 단위가 아닌 Script 단위로 작성하기 위해서는 file - new file - r ..
통계 프로그램으로는 SAS, SPSS, R, Python 등 다양한데요. 일단 SAS, SPSS 는 고가의 프로그램에 분석 공부를 위해 구매하기엔 굉장히 부담이 되죠.. SAS 는 대용량 데이터 분석에 사용되고, SPSS 는 소량의 데이터 분석이 주로 사용된다곤 하네요! 다행이 R 은 무료이고, 여러 기업에서 R로 다양한 분석 솔루션을 연구, 개발을 하면서 요즘 R 이 떠오르고있죠. 그럼 본격적으로 R 설치를 해봅시다! R 다운로드 먼저 R 설치를 위해 아래 링크에 들어갑니다. https://www.r-project.org/ download R 클릭! 다운받는 경로인데 다양한 나라에서 제공해주고있습니다. 저희는 Korean 이므로 Korea 를 찾아서 아무(?)거나 눌러주셔도 상관 없습니다. 한국 내에서..