참고글[Python] Pandas - Series [Python] Pandas - DataFrame[Python] DataFrame 그룹 함수 적용(map,apply,applymap) # 행/열 전치 (T 메서드)fruits.T 0 1 2 3nameapplemango bananacherryprice2000 150 500 400qty 5 4 10 NaN # 연산 (add, sub, div, mul 메서드)# NA 처리 가능한 연산 메서드 df1 = DataFrame({'a':[1,2,3], 'b':[10,NA,20]})a b0 1 10.01 2 NaN2 3 20.0 df2 = DataFrame({'b':[1,2,3], 'c':[10,NA,20]}, index = [0,1,3])b c0 1 10.01 2 N..
참고글 : [Python] 사용자 정의 함수 및 적용 함수(def, lambda, map) # test Data df1 = DataFrame({'a':[1,3,7,4],'b':[17,86,52,68],'c':[134,874,592,246]}) 1. map 함수 - map(func, **iterable) - 1차원 원소별 적용 - 다수의 인자 전달 시 각 인자의 크기 일치 필요 - in numpy - Return to List f1 = lambda x : '%03d'%x list(map(f1, df1['b']))['017', '086', '052', '068'] 2. map 메서드 - data.map(func, **iterable) - 1차원(Series) 원소별 적용 - 다수의 인자 전달 시 각 인자의 ..
1. oracle OR oracle_client 설치 (path 설정 필요) 참고글 : [R] R, Oracle 연동 Oracle이 설치되어 있다면 다음 단계로 ! 2. cx_oracle 설치 cx_oracle 모듈을 컴퓨터에 저장해야 하기 때문에, cmd mode에서 설치를 진행합니다. > conda install -c https://conda.anaconda.org/anaconda cx_oracle 계속적인 진행 여부를 묻는다면 yes ! 용량이 생각보다(?) 높기 때문에, 약간의 대기시간이 필요합니다. 마지막 3개의 transaction이 모두 done 으로 완료되면 설치 성공 ! 3. Python & Oracle 연동 3-1) 모듈 로딩 import cx_Oracle * 한글이 깨질 경우 오라클 ..
참고글[Python] Pandas - DataFrame 관련 메서드[Python] DataFrame 그룹 함수 적용(map,apply,applymap)[Python] Pandas - Series [Python] profile 만들기 (import를 한 번에) DataFrame - Series의 집합 - 서로 다른 데이터 타입을 갖는 column - Data Frame의 Key : column / Series의 Key : row를 의미 # 생성%run profileimport pandas as pdfrom pandas import Series, DataFrame 1. 한 번에 생성fruits = DataFrame({'name':['apple','mango','banana','cherry'], 'price'..
Python을 사용하면서 매번 작성해주어야하는 import .. 저장해두고 한 번에 하는 방법이 없을까..! Step 1) 작업 디렉토리 확인import osos.getcwd()'C:\\Users\\...' Step 2) import code 작성import pandas as pdimport numpy as npfrom pandas import Series, DataFramefrom numpy import nan as NA Step 3) 작성한 code를 .py 확장자로 작업 디렉토리에 저장 Step 4) .py file 실행 (%run 파일명)%run profile
참고글 : [Python] Pandas - DataFrame Series - 1차원 배열 구조(벡터) - 단 하나의 데이터 타입 허용 - 데이터 프레임을 구성하는 하나의 특정 row나 column으로 설명 가능 - DataFrame의 기본 (Series가 모여 DataFrame이 만들어짐) # Pandas 적용 import pandas as pd from pandas import Series, DataFrame # 함수를 이름 그대로 사용 # 생성 s1 = Series([1,2,3,4])s10 1 # 행 번호를 갖는 형태로 저장 (0부터 시작)1 22 33 4dtype: int64 # Index row(Key) 설정1. Series 생성 시 row index 이름(Key) 선언s1= Series([1,2..
R에서의 NA는 '잘못된 값', Null은 '아직 정해지지 않은 값'으로, 서로 다른 의미를 가지고 있었습니다. 파이썬에서는 R과 다르게 NaN(NA)와 Null 을 '정해지지 않은 값' 의 의미로 같이 사용합니다. 그렇기 때문에 NaN으로 Na와 Null을 모두 표현합니다. # NA 사용 방법from pandas import Series, DataFrame Series([1,2,3,np.nan])0 1.0 1 2.0 2 3.0 3 NaN dtype: float64 # NaN 값 때문에 데이터 타입이 float from numpy import nan as NA # np.nan 사용이 번거로울 경우 alias 사용 Series([1,2,3,NA])0 1.0 1 2.0 2 3.0 3 NaN dtype: fl..
수학, 통계 메서드 Numpy의 수학, 통계 메서드는 모두 axis(축) 지정이 가능합니다. # .sum : 합np.sum?np.sum( ['a', 'axis=None', 'dtype=None', 'out=None', 'keepdims=', 'initial='],) # axis = 축 지정, dtype = 데이터 타입, keepdims = 차원 유지 여부arr = np.arange(10).reshape(2,5)array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]])arr.sum()45 # 모든 원소의 합arr3.sum(axis=0) array([ 5, 7, 9, 11, 13]) # 서로 다른 행별(세로) 합arr.sum(axis=1, keepdims = True)array([[10], ..