#. 색인 (.np.ix_, .iloc, .loc) *# 슬라이스 색인 (얕은 복사, 원본 갱신) - 1차원 : ar[n:m] # n~m-1 - 2차원 : arr[:2] # 행 우선 (n~1행) arr[:2, 1:] # (n~1행, 1~m열) # 다차원 색인 - arr[[1,5,3], [2,6,4]] # point 색인 (1,2), (5,6), (3,4) - arr[[1,5,3], [:,[2,6,4]] # 1,5,3행의 2,6,4열 # np.ix_() 함수 색인 - arr[np.ix_([1,5,3], [2,6,4])] # 1,5,3행의 2,6,4열 (np.ix_ 함수 : 위치 값으로 전달) # iloc[] 정수 색인 - df.iloc[0,:] # 0번째 행 - df.iloc[:,0] # 0번째 열 - d..
참고글 : [Python] 사용자 정의 함수 및 적용 함수(def, lambda, map) # test Data df1 = DataFrame({'a':[1,3,7,4],'b':[17,86,52,68],'c':[134,874,592,246]}) 1. map 함수 - map(func, **iterable) - 1차원 원소별 적용 - 다수의 인자 전달 시 각 인자의 크기 일치 필요 - in numpy - Return to List f1 = lambda x : '%03d'%x list(map(f1, df1['b']))['017', '086', '052', '068'] 2. map 메서드 - data.map(func, **iterable) - 1차원(Series) 원소별 적용 - 다수의 인자 전달 시 각 인자의 ..
# Python은 R과 다르게 벡터, 원소별 연산이 적용함수를 적용해야만 가능합니다. >>> l1[1, 2, 3]>>> l1 + (10,10,10) # 벡터 연산 불가TypeError: can only concatenate list (not "tuple") to list>>> l1 + [10,10,10] # 리스트로 연산을 시도해도 결합이 되어버립니다[1, 2, 3, 10, 10, 10] #. 함수 정의 (def)def funcName(input, ..) : # 매개변수에 default 값 설정 가능 함수 내용 return output def funcName(*param) : # 매개변수 개수에 제한이 없는 경우(*) 함수 내용 # for i in param : return result funcName(..
데이터 그룹 연산을 위한 주요 함수 정리 1. apply 계열 적용 함수 1. apply(matrix, margin, function, ...) : '행/열별' 함수에 반복적 적용(연산)의 위해 사용 => 그룹함수 연산 - 2차원 구조 적용 가능, 벡터에 적용 불가 - 행별, 열별 연산을 위해 만들어짐 - 그룹함수의 적용과 함께 사용 가능 - 행/열별 "벡터"로 묶어서 함수에 전달하므로 함수는 하나의 인자를 가져야 함 > m1 apply(m1,1,sum) # 행별 sum[1] 12 15 18> apply(m1,2,sum) # 열별 sum[1] 6 15 24 2. lapply(list, function) : '원소별' 함수에 반복적 적용(연산)을 위해 사용 (리스트로 리턴) - 리스트와 데이터 프레임(ke..
그룹별 적용- apply() : 2차원 데이터를 행, 열 방향으로 연산 # 적용방향 = 1:같은 행별, 2:같은 열별, c(1,2): 원소별 원소별 적용- sapply() : 벡터에 함수를 반복 적용(벡터로 출력) # 데이터 색인 시 벡터가 편리하므로, 주로 sapply()를 사용- lapply() : 벡터에 함수를 반복 적용(리스트로 출력)- mapply() : 벡터에 함수를 반복 적용(리스트로 출력) # sapply()와 유사, 다수의 인자를 받는 함수를 적용하기 위해 사용 그룹별 연산 - tapply() : 그룹별 연산 * 작성 방법apply(iris[,-5], 2, mean)sapply(iris[,-5], mean)lapply(iris[,-5], mean)mapply(mean, iris[,-5])..