참고글[Python] Pandas - Series [Python] Pandas - DataFrame[Python] DataFrame 그룹 함수 적용(map,apply,applymap) # 행/열 전치 (T 메서드)fruits.T 0 1 2 3nameapplemango bananacherryprice2000 150 500 400qty 5 4 10 NaN # 연산 (add, sub, div, mul 메서드)# NA 처리 가능한 연산 메서드 df1 = DataFrame({'a':[1,2,3], 'b':[10,NA,20]})a b0 1 10.01 2 NaN2 3 20.0 df2 = DataFrame({'b':[1,2,3], 'c':[10,NA,20]}, index = [0,1,3])b c0 1 10.01 2 N..
참고글 : [Python] 사용자 정의 함수 및 적용 함수(def, lambda, map) # test Data df1 = DataFrame({'a':[1,3,7,4],'b':[17,86,52,68],'c':[134,874,592,246]}) 1. map 함수 - map(func, **iterable) - 1차원 원소별 적용 - 다수의 인자 전달 시 각 인자의 크기 일치 필요 - in numpy - Return to List f1 = lambda x : '%03d'%x list(map(f1, df1['b']))['017', '086', '052', '068'] 2. map 메서드 - data.map(func, **iterable) - 1차원(Series) 원소별 적용 - 다수의 인자 전달 시 각 인자의 ..
참고글[Python] Pandas - DataFrame 관련 메서드[Python] DataFrame 그룹 함수 적용(map,apply,applymap)[Python] Pandas - Series [Python] profile 만들기 (import를 한 번에) DataFrame - Series의 집합 - 서로 다른 데이터 타입을 갖는 column - Data Frame의 Key : column / Series의 Key : row를 의미 # 생성%run profileimport pandas as pdfrom pandas import Series, DataFrame 1. 한 번에 생성fruits = DataFrame({'name':['apple','mango','banana','cherry'], 'price'..
Python을 사용하면서 매번 작성해주어야하는 import .. 저장해두고 한 번에 하는 방법이 없을까..! Step 1) 작업 디렉토리 확인import osos.getcwd()'C:\\Users\\...' Step 2) import code 작성import pandas as pdimport numpy as npfrom pandas import Series, DataFramefrom numpy import nan as NA Step 3) 작성한 code를 .py 확장자로 작업 디렉토리에 저장 Step 4) .py file 실행 (%run 파일명)%run profile
참고글 : [Python] Pandas - DataFrame Series - 1차원 배열 구조(벡터) - 단 하나의 데이터 타입 허용 - 데이터 프레임을 구성하는 하나의 특정 row나 column으로 설명 가능 - DataFrame의 기본 (Series가 모여 DataFrame이 만들어짐) # Pandas 적용 import pandas as pd from pandas import Series, DataFrame # 함수를 이름 그대로 사용 # 생성 s1 = Series([1,2,3,4])s10 1 # 행 번호를 갖는 형태로 저장 (0부터 시작)1 22 33 4dtype: int64 # Index row(Key) 설정1. Series 생성 시 row index 이름(Key) 선언s1= Series([1,2..
R에서의 NA는 '잘못된 값', Null은 '아직 정해지지 않은 값'으로, 서로 다른 의미를 가지고 있었습니다. 파이썬에서는 R과 다르게 NaN(NA)와 Null 을 '정해지지 않은 값' 의 의미로 같이 사용합니다. 그렇기 때문에 NaN으로 Na와 Null을 모두 표현합니다. # NA 사용 방법from pandas import Series, DataFrame Series([1,2,3,np.nan])0 1.0 1 2.0 2 3.0 3 NaN dtype: float64 # NaN 값 때문에 데이터 타입이 float from numpy import nan as NA # np.nan 사용이 번거로울 경우 alias 사용 Series([1,2,3,NA])0 1.0 1 2.0 2 3.0 3 NaN dtype: fl..
수학, 통계 메서드 Numpy의 수학, 통계 메서드는 모두 axis(축) 지정이 가능합니다. # .sum : 합np.sum?np.sum( ['a', 'axis=None', 'dtype=None', 'out=None', 'keepdims=', 'initial='],) # axis = 축 지정, dtype = 데이터 타입, keepdims = 차원 유지 여부arr = np.arange(10).reshape(2,5)array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]])arr.sum()45 # 모든 원소의 합arr3.sum(axis=0) array([ 5, 7, 9, 11, 13]) # 서로 다른 행별(세로) 합arr.sum(axis=1, keepdims = True)array([[10], ..
참고글 : [Python] Numpy 배열(생성, 색인, 연산 ..) # 메서드의 메뉴얼 확인np.arange? Docstring: # Enter : 계속, q: 종료arange([start,] stop[, step,], dtype=None) Return evenly spaced values within a given interval.... np.func?? # 함수의 코드 제공 # 정보 확인arr1 = np.arange(10).reshape(2,5) arr1.shape # 배열의 모양 확인 메서드(2, 5) arr1.dtype # 배열의 데이터 타입 확인 메서드dtype('int32') arr1.ndim # 배열의 차원 확인2 type(arr1)numpy.ndarray # 모양 변경 (a.reshape..