스칼라(Scalar) 스칼라는 단일 차원의 값, 단 하나의 원소값을 의미합니다. 간단하죠? 한 변수에 하나의 값이 들어있다면, 그것은 스칼라라고 할 수 있겠죠? 그림으로 표현하자면 단일 차원의 통에 , 단 하나의 스마일 같이 표현할 수 있습니다. 스칼라만 설명하면 너무 단순하니.. NA, NULL 도 추가했습니다. 1) NA, NULL R 에서 NA는 잘못된 값, NULL은 아직 정해지지 않은 값을 의미합니다.> var1 var1 NULL# 여기서 null은 입력된 널 값을 의미하는 것이 아니라 변수에 값이 정해지지 않앗다는 의미의 null이 출력) > var2 var2 [1] 1 # var2 라는 변수에 1 이라는 정해진 값이 있기때문에, null이 아닌 1을 출력, null은 아직 값이 정해지지 않았..
환경 변수 PATH 설정 Java, C, Python, R 등 프로그램들을 설치했다면, 컴퓨터에게 이 프로그램을 실행하기 위한 파일들이 어떤 경로에 있다고 명시해주어야 컴퓨터가 이 경로를 참고하여 프로그램을 실행시킬 수 있습니다. 하지만, PATH 설정이 되어있지 않거나, 잘못 명시되어있다면, 프로그램을 실행해도 컴퓨터가 경로를 찾기 못하게 되므로, PATH 오류가 발생하게 됩니다. 프로그램이 설치되는 과정에서 자동으로 설정해주기도 하지만 그렇지 않는 경우도 있기 때문에, 환경 변수 PATH 설정하는 방법은 잘 알고 계시면 좋습니다! 환경 변수 PATH 를 설정하러 가볼까요~! Step 1) 내 PC 우 클릭, 속성 클릭 Step 2) 고급 시스템 설정 클릭 Step 3) 환경 변수 클릭 Step 4) ..
R Studio 다운로드 먼저 R Studio 설치를 위해 아래 링크에 들어갑니다. https://www.rstudio.com/ Products - RStudio Desktop 에 설치할 것이므로 RStudio Desktop 클릭! 마찬가지로 DOWNLOAD RSTUDIO DESKTOP 클릭! 공부 목적으로 RStudio 를 사용할 것이므로 FREE 버전으로 다운받았습니다. 자신의 컴퓨터 버전에 맞는 설치 파일을 다운 받으시면 됩니다. R Studio 설치 R Studio 설치도 굉장히 간단하고 쉽기때문에 다 default 로 두시고 진행하시면 되겠습니다. R Studio 사용 R 을 Command Mod 처럼 명령어 단위가 아닌 Script 단위로 작성하기 위해서는 file - new file - r ..
통계 프로그램으로는 SAS, SPSS, R, Python 등 다양한데요. 일단 SAS, SPSS 는 고가의 프로그램에 분석 공부를 위해 구매하기엔 굉장히 부담이 되죠.. SAS 는 대용량 데이터 분석에 사용되고, SPSS 는 소량의 데이터 분석이 주로 사용된다곤 하네요! 다행이 R 은 무료이고, 여러 기업에서 R로 다양한 분석 솔루션을 연구, 개발을 하면서 요즘 R 이 떠오르고있죠. 그럼 본격적으로 R 설치를 해봅시다! R 다운로드 먼저 R 설치를 위해 아래 링크에 들어갑니다. https://www.r-project.org/ download R 클릭! 다운받는 경로인데 다양한 나라에서 제공해주고있습니다. 저희는 Korean 이므로 Korea 를 찾아서 아무(?)거나 눌러주셔도 상관 없습니다. 한국 내에서..
쿼리 안에 또 다른 쿼리 - Sub Query SELECT col1, (SELECT ...) -- 스칼라 서브쿼리(Scalar Sub Query): 하나의 컬럼처럼 사용 (표현 용도) FROM (SELECT ...) -- 인라인 뷰(Inline View): 하나의 테이블처럼 사용 (테이블 대체 용도) WHERE col = (SELECT ...) -- 일반 서브쿼리: 하나의 변수(상수)처럼 사용 (서브쿼리의 결과에 따라 달라지는 조건절) 1) Inline view (인라인 뷰) 먼저, FROM 절에 사용하는 서브쿼리부터 살펴볼까요? 위의 설명처럼 인라인 뷰는 SELECT 절의 결과를 FROM 절에서 하나의 테이블처럼 사용하고 싶을 때 사용합니다. 기존 단일 쿼리로는 '테이블에서 각 부서별 최대 연봉' 까지..
여러 테이블의 데이터를 조회하기 - JOIN SQL 에서 Join 은 언제 사용할까요? group by 절을 설명할 때에도 한 번 언급하긴 했었는데, 여러 테이블로 나뉘어진 데이터를 조회하기 위해 사용한다고 생각하시면 될 것 같아요! 예를 들자면, 은행에는 대량의 고객 데이터가 있을 것입니다. 개인정보, 예금 정보, 적금 정보, 카드 실적 등등.. 다 분리가 되어있겠죠? 이런 데이터들을 하나의 테이블에 다 넣게되면, 데이터 조회 시 불필요한 데이터까지 모두 스캔되어버려 메모리 낭비를 초래하기 때문이죠. 고객의 카드 실적 정보만 보고싶은데, 적금 정보, 예금 정보, 개인정보 등등.. 까지 조회가 되버리죠. 그래서! 테이블들을 적절하게, 그리고 잘게 쪼개는 것도 중요합니다. 목적은 속도를 빠르게 하기 위함이..
SQL 구문 순서 SQL 구문의 순서는 먼저 다음과 같습니다. SELECT 컬럼명 --------------------- (5) FROM 테이블명 ------------------- (1) WHERE 테이블 조건 --------------- (2) GROUP BY 컬럼명 -------------------- (3) HAVING 그룹 조건 ----------------- (4) ORDER BY 컬럼명 -------------------- (6) SQL 의 여정을 시작해볼까요?! 1. FROM : SQL은 구문이 들어오면 테이블을 가장 먼저 확인합니다. 테이블이 없는데 다른 것들을 먼저 조회하면 헛수고니까요! 2. WHERE : 테이블명을 확인했으니, 테이블에서 주어진 조건에 맞는 데이터들을 추출해줍니다. ..
각 행을 그룹으로 묶기 - GROUP BY group by 는 공통적인 데이터별로 묶어서 연산처리를 하고싶을 때 사용합니다. 그렇게되면 그룹 별 하나의 결과값이 출력되겠죠? 쉽게 예를 들자면, 전체 회원 데이터에서 남-여 회원의 수, 나이대 별(20대-30대-40대) 회원 수 이럴 때, count 함수와 group by 를 함께 사용한답니다. 만약 회사에 3개의 '부서'가 있는데, '같은 부서'의 직원들끼리 묶어라. 라고 한다면 그룹이 3개 이므로 3개의 행이 출력됩니다. 여기서 '부서번호' 를 사용해서 같은 부서끼리 묶었으므로 (원래는 단일행이지만 group by 에 사용되었기 때문에) select 절에서 그룹함수와 같이 사용이 가능합니다. 하지만, group by 에 사용된 컬럼 이외의 컬럼은 단독으..