참고글[Python] Pandas - Series [Python] Pandas - DataFrame[Python] DataFrame 그룹 함수 적용(map,apply,applymap) # 행/열 전치 (T 메서드)fruits.T 0 1 2 3nameapplemango bananacherryprice2000 150 500 400qty 5 4 10 NaN # 연산 (add, sub, div, mul 메서드)# NA 처리 가능한 연산 메서드 df1 = DataFrame({'a':[1,2,3], 'b':[10,NA,20]})a b0 1 10.01 2 NaN2 3 20.0 df2 = DataFrame({'b':[1,2,3], 'c':[10,NA,20]}, index = [0,1,3])b c0 1 10.01 2 N..
참고글 : [Python] Numpy 배열 메서드 NumPy (Numerical Python) - Array 구조의 객체 지원 - 수학적 반복 연산을 빠르게 처리 * array 구조는 단 하나의 데이터 타입만 허용 * 수학적 연산에 반복적인 벡터 연산 가능 (단, 문자 치환은 벡터 연산 불가) - 수학적 연산이 많은 딥러닝 수행 시 유용 * 딥러닝 구조의 핵심 데이터 타입 - 빠르고 효율적인 메모리 사용 # 모듈 적용# numpy 모듈을 np로 사용 import numpy as np # 생성 (.array, .arange, .random.randn)np.array([10,20,30])array([10, 20, 30]) np.arange(10) # 0 ~ n-1 까지의 값을 갖는 1차원 배열array([0..
튜플(tuple) : (읽기만 가능한)리스트 t = ( val1, val2, ... )# vector in R = Python list# 읽기만 가능한 리스트 (입력, 수정, 삭제 불가)# 주로 수정하면 안 되는 데이터셋에 사용 참고글 : [Python] 리스트 (list) # 튜플 생성>>> t1 = (1,2,3)>>> t1(1, 2, 3) >>> t1 = 1,2,3>>> t1(1, 2, 3) >>> t1 = (10) >>> t110>>> type(t1) # 하나의 원소만 삽입 시 스칼라 원소로 적용 >>> t2 = (10,) >>> t2(10,)>>> type(t2) # 하나의 원소를 튜플로 삽입 시 ,(콤마)와 함께 사용 # 튜플은 수정, 삽입, 삭제 불가>>> t1 = (1,2,3) >>> t1[..
참고글 : [Python] 리스트 메서드 (list method) 리스트 (1차원 자료구조 = 배열) l = [val1, val2, ...]# vector in R = Python list # 리스트 생성>>> l1 = [1,2,3,4,5,6,7,8,9,10] # 리스트의 요소 추가 : append>>> la = []>>> la.append(1)>>> la.append(2)>>> la[1, 2] # 리스트의 요소 삭제 : del>>> l1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]>>> del(l1[2]) # 특정 위치의 요소 삭제>>> l1[1, 2, 4, 5, 6, 7, 8, 9, 10] >>> l1[2:4] = [] # 슬라이스 색인으로 여러 요소 삭제 >>> l1[1, 2, 6,..
#. 리스트 생성R에서 vector라고 불렀다면.. Python에서는 list라고 불러다오.. # 대괄호로 리스트 생성>>> l1 = [1,2,3] >>> l1[1, 2, 3] # 리스트는 중첩으로 생성 가능 -> R에서는 벡터 안에 벡터 생성이란 불가능했지만, 파이썬에서는 가능하다는 것!>>> l1 = [1,2,[3,4]]>>> l1[1, 2, [3, 4]] #. 리스트 색인>>> l1[1, 2, 3] # 파이썬의 색인은 0부터 시작 >>> l1[1] 2 # list[n:m] : n ~ m-1 까지 추출>>> l1[0:2] [1, 2] # 1차원 색인 시, 차원의 숙소가 일어나 리스트가 아닌 벡터로 출력>>> l1[0]1 #. 리스트 원소 추가>>> l1 = [1,2,3]>>> l1.append(4) ..
그룹 연산 1. tapply() 함수 tapply(vector, index, function) # 벡터만 가능그룹 연산 tapply() 함수 참고[R] apply 계열 함수 - 적용 함수(원소별 연산, 그룹별 연산) 2. aggregate() 함수 aggregate() 함수는 tapply() 함수와 유사하게 그룹 연산을 수행합니다. ## method for class 'data.frame' aggregate(x, # 연산 대상, date frame 가능 by, # group by 컬럼, list로 전달, 여러 컬럼 전달 가능 FUN) # 함수 # student data에서 학년별 키와 몸무게의 평균 > std aggregate(std[,c('HEIGHT','WEIGHT')], + by = list(std..
그룹별 적용- apply() : 2차원 데이터를 행, 열 방향으로 연산 # 적용방향 = 1:같은 행별, 2:같은 열별, c(1,2): 원소별 원소별 적용- sapply() : 벡터에 함수를 반복 적용(벡터로 출력) # 데이터 색인 시 벡터가 편리하므로, 주로 sapply()를 사용- lapply() : 벡터에 함수를 반복 적용(리스트로 출력)- mapply() : 벡터에 함수를 반복 적용(리스트로 출력) # sapply()와 유사, 다수의 인자를 받는 함수를 적용하기 위해 사용 그룹별 연산 - tapply() : 그룹별 연산 * 작성 방법apply(iris[,-5], 2, mean)sapply(iris[,-5], mean)lapply(iris[,-5], mean)mapply(mean, iris[,-5])..
연산 수치연산자와 함수 벡터 연산 벡터 연산은 벡터의 요소별로 계산을 수행할 수 있고, 대체적으로 for문 없이도 연산이 가능합니다.(단, if문 제외) 참고: [R] 벡터(vector) > x x + 10 [1] 11 11 12 12 13 13 > x + x [1] 2 2 4 4 6 6 > x == c(1,2,2,3,4,4) [1] TRUE FALSE TRUE FALSE FALSE FALSE 벡터의 산술 연산 > x sum(x) # 합 [1] 330 > mean(x) # 평균 [1] 82.5 > median(x) # 중앙값 [1] 82.5 # sum과 mean 사용 시 주의사항 > help(sum) sum(..., na.rm = FALSE) # 인자가 확장형으로 설계 > sum(1,2,3) # 사용 가..