Plot 선 그래프 그리기 plot(x축 데이터, y축 데이터, 옵션) plot에 하나의 벡터 사용 시 벡터는 y축으로 전달되고 x축은는 y의 수(벡터 크기) 만큼 지정됩니다. plot함수의 목적은 선 그래프의 출력이지만, 함수에 들어가는 데이터에 따라서 다양한 형태의 그래프를 출력해줍니다. 그래프 타입par(mfrow=c(3,3)) # 그래프의 배치 조정 c(행의 개수, 열의 개수) 1. plot(x1, type = 'p') 2. plot(x1, type = 'l') 3. plot(x1, type = 'b') # 주로 사용 4. plot(x1, type = 'c') 5. plot(x1, type = 'o') # 주로 사용 6. plot(x1, type = 'h') 7. plot(x1, type = 's..
막대 그래프 그리기 Barplot(vector or matrix, 옵션) : 막대 그래프 그리기 # beside = T 옵션 : 그룹으로 묶어서 출력. 매트릭스 형태의 데이터만 가능(데이터 프레임 전달 불가) # beside = F (default) 는 하나의 막대로 묶음 # column끼리 묶어서 row끼리 비교 => 그룹별 비교를 위해 교차 테이블로 변환 필요 x head(del) 일자 시간대 업종 시도 시군구 읍면동 통화건수 1 20180201 0 음식점-족발/보쌈전문 서울특별시 강남구 논현동 5 2 20180201 0 음식점-족발/보쌈전문 서울특별시 강남구 역삼동 5 3 20180201 0 음식점-족발/보쌈전문 서울특별시 강서구 내발산동 5 ###############################..
아래와 같은 데이터를 R로 읽어오면 아래와 같이 공백을 NA로 채우게 됩니다. > subway subway 전체 구분 X05.06 X06.07 X07.08 X08.09 X09.10 X10.11 X11.12 ...1 서울역(1) 승차 17,465 18,434 50,313 93,398 78,705 86,342 93,585 ...2 하차 7,829 48,553 110,250 233,852 121,983 79,628 75,577 ...3 시 청(1) 승차 2,993 4,473 7,633 10,404 13,328 16,953 25,467 ...4 하차 4,142 19,730 67,995 175,458 83,777 48,363 47,519 ...5 종 각 승차 7,371 7,836 14,545 24,578 23,6..
교차 테이블로 데이터 구조 변경 1. stack()과 unstack() : 비교적 간단한 구조의 변경 stack() 함수와 unstack() 함수를 사용하여 데이터 구조를 변경해보았었습니다. [R] 데이터 구조 변경 - stack, unstack > m1 d1 d2 head(m1) year mon latte americano mocha1 2000 1 400 482 2982 2000 2 401 483 2993 2000 3 402 484 300...> head(d1) year name info value1 2000 latte qty 1002 2000 mocha qty 803 2000 latte price 2200...> head(d2) year name qty price1 2000 latte 100 1200..
sqldf 패키지 sqldf() 함수 : R에서 SQL문법을 활용하여 데이터 조작 sqldf() 함수는 R에서 SQL을 사용하여 데이터 처리가 가능하게 해줍니다. > install.packages("sqldf")> install.packages("googleVis") # Fruits 데이터 셋 사용을 위함> library(sqldf)> library(googleVis) > Fruits Fruit Year Location Sales Expenses Profit Date1 Apples 2008 West 98 78 20 2008-12-312 Apples 2009 West 111 79 32 2009-12-313 Apples 2010 West 89 76 13 2010-12-31...> sqldf('SELECT *..
plyr 패키지 plyr 패키지는 데이터 분할, 적용, 조합 세 단계로 데이터를 처리하는 함수를 제공해줍니다. 배열(a), 데이터 프레임(d), 리스트(l)에 적용 가능 > install.packages("plyr") > library(plyr) 1. adply() 함수 : 그룹 연산 adply() 함수는 apply()함수와 동일하지만 apply()는 벡터로 리턴, adply()는 데이터 프레임으로 리턴이 가능합니다. apply(데이터 셋, 적용방향, 적용(그룹)함수) # 적용방향 = 1:같은 행별, 2:같은 열별, c(1,2): 원소별 [R] apply 계열 함수 - 적용 함수(원소별 연산, 그룹별 연산) plyr :: adply( .데이터, # 행렬, 배열, 데이터 프레임 .margins, # 적용방..
그룹 연산 1. tapply() 함수 tapply(vector, index, function) # 벡터만 가능그룹 연산 tapply() 함수 참고[R] apply 계열 함수 - 적용 함수(원소별 연산, 그룹별 연산) 2. aggregate() 함수 aggregate() 함수는 tapply() 함수와 유사하게 그룹 연산을 수행합니다. ## method for class 'data.frame' aggregate(x, # 연산 대상, date frame 가능 by, # group by 컬럼, list로 전달, 여러 컬럼 전달 가능 FUN) # 함수 # student data에서 학년별 키와 몸무게의 평균 > std aggregate(std[,c('HEIGHT','WEIGHT')], + by = list(std..
데이터에서 최소(min), 최대(max)를 갖는 색인 출력 중요! which.min(), which.max() : 특정 값이 최소, 최대인 쉘의 위치 리턴 > which.max(emp$SAL) # SAL이 최대인 쉘 위치 리턴[1] 9> emp[which.max(emp$SAL),] # 리턴된 쉘 위치를 색인을 통해 추출 EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO9 7839 KING PRESIDENT NA 1981-11-17 0:00 5000 NA 10 > which.min(emp$SAL) # SAL이 최소인 쉘 위치 리턴[1] 1> emp[which.min(emp$SAL),] # 리턴된 쉘 위치를 색인을 통해 추출 EMPNO ENAME JOB MGR HIREDATE ..