그룹 연산(Group by) - 연산대상.groupby(그룹핑 대상) - groupby의 결과는 Dictionary 형태 - groupby 수행 시 결과는 보여주지 않음 로 그룹핑이 되었다고만 출력 - 분리 -> 적용 -> 결합 : 다른 언어와 다르게 파이썬은 분리(split)까지 동작. 적용과 결합을 위해 연산 메서드를 적용 pd.groupby? pd.groupby(*args, **kwargs) #. 그룹 연산(pd.groupby) sub = pd.read_csv('subway.csv', encoding='cp949') # 노선번호별 승차에 대한 평균 # 방법 1) 일부 컬럼 전달(속도상 유리) sub['승차'].groupby(sub['노선번호']).mean() # 방법 2) 전체(연산 가능한 모든 컬..
참고글[Python] Pandas - Series [Python] Pandas - DataFrame[Python] DataFrame 그룹 함수 적용(map,apply,applymap) # 행/열 전치 (T 메서드)fruits.T 0 1 2 3nameapplemango bananacherryprice2000 150 500 400qty 5 4 10 NaN # 연산 (add, sub, div, mul 메서드)# NA 처리 가능한 연산 메서드 df1 = DataFrame({'a':[1,2,3], 'b':[10,NA,20]})a b0 1 10.01 2 NaN2 3 20.0 df2 = DataFrame({'b':[1,2,3], 'c':[10,NA,20]}, index = [0,1,3])b c0 1 10.01 2 N..
참고글 : [Python] 리스트 (list) 리스트의 메서드 # insert() : 리스트의 특정 위치에 요소 삽입>>> test1 = [1,2,3]>>> test1.insert(1, 10) # 두 번째위치에 10 삽입>>> test1[1, 10, 2, 3] # append() : 리스트 끝에 요소 삽입>>> test1 = [1,2,3]>>> test1.append(5)>>> test1[1, 2, 3, 5] # clear() : 리스트 내용 모두 삭제>>> test1 = [1,2,3]>>> test1.clear()>>> test1[] # del() : 리스트의 특정 위치 요소 삭제>>> test1 = [1,2,3]>>> del(test1[1])>>> test1[1, 3] # remove() : 리스트의..
Python은 벡터 연산이 불가능합니다. AttributeError: 'list' object has no attribute 'methodName' 이러한 오류가 출력되는 것은, 벡터 연산이 불가능한 메서드(method)에 리스트를 적용했기 때문이죠.이를 해결하기 위해서는 "사용자 정의 함수 + 적용 함수" 의 조합이 필요합니다. # test 변수 준비>>> im = 'im tired' #. startswith() : 문자열의 시작 문자 패턴 확인 (T or F return)>>> im 'im tired'>>> im.startswith('im')True #. endswith() : 문자열의 종료 문자 패턴 확인 (T or F return)>>> im 'im tired'>>> im.endswith('ed'..
먼저, 그룹함수란 두 개 이상의 여러개의 행을 묶어서 하나의 output 값을 리턴해주는 함수입니다. 예를 들자면, 합: sum, 평균: average 같은 함수를 말합니다. 카운트 - COUNT COUNT(컬럼명) :: 특정 컬럼 값이 NULL 인 값을 제외한 데이터의 개수 리턴 COUNT(*) :: NULL 값을 포함한 데이터의 개수 리턴 COUNT 함수는 어디에 쓰냐! 하믄,, 나중에 배울 group by 함수와 함께 사용하면, 남녀 성별 카운트를 확인할 수 있답니다. 현업에서 대량의 데이터를 모두 조회하는데, 데이터가 몇 억개정도 있다고하면.. CPU가 부글부글 할 것입니다. 그럴 때 미리 COUNT 함수를 사용해서 데이터의 개수를 확인한 후 필요한 데이터만 추출하여 조회한다면 CPU도 아주 좋아..