1. DataFrame 생성 & data 삽입--123456789import pandas as pd result_df = pd.DataFrame(columns=['col1', 'col2', 'col3'], dtype=str)res_idx = 0 for i in tqdm(range(0,100)): ... result_df.loc[res_idx] = [col1, col2, col3] res_idx += 1Colored by Color Scriptercs
Multi-index & Multi-column #. 생성 - 인덱스의 개수, 상위 level & 하위 level의 개수가 일치해야 함 - 생성할 일은 많지 않음 :( 1. Series s1 = Series([1,2,3,4,5,6], index=[['a','a','b','b','c','c'], [1,2,1,2,1,2]]) s1a 1 1 2 2 b 1 3 2 4 c 1 5 2 6 dtype: int64 2. DataFrame 생성 후 설정 df1 = DataFrame({'value':[1,2,3,4,5,6], 'ind1':['a','a','b','b','c','c'], 'ind2':[1,2,1,2,1,2]}) df1 = df1.set_index(['ind1','ind2']) # 리스트 형식으로 인덱스에 동..
참고글 : [Python] Pandas - DataFrame Series - 1차원 배열 구조(벡터) - 단 하나의 데이터 타입 허용 - 데이터 프레임을 구성하는 하나의 특정 row나 column으로 설명 가능 - DataFrame의 기본 (Series가 모여 DataFrame이 만들어짐) # Pandas 적용 import pandas as pd from pandas import Series, DataFrame # 함수를 이름 그대로 사용 # 생성 s1 = Series([1,2,3,4])s10 1 # 행 번호를 갖는 형태로 저장 (0부터 시작)1 22 33 4dtype: int64 # Index row(Key) 설정1. Series 생성 시 row index 이름(Key) 선언s1= Series([1,2..
딕셔너리(Dictionary) dic = { key1:value1, key2:value2, ...} # key, value 값을 갖는 자료구조 -> 빠른 입력과 출력# list in R = Python dictionary # Dictionary 생성>>> fruits = {'이름':'사과', '가격':2000, '수량':10}>>> fruits{'이름': '사과', '가격': 2000, '수량': 10}>>> type(fruits) # 새로운 key:value 삽입>>> fruits['크기'] = '중'>>> fruits{'이름': '사과', '가격': 2000, '수량': 10, '크기': '중'} # 수정 >>> fruits['크기'] = ['중','소'] # 리스트로도 수정 가능>>> fruits{..
튜플(tuple) : (읽기만 가능한)리스트 t = ( val1, val2, ... )# vector in R = Python list# 읽기만 가능한 리스트 (입력, 수정, 삭제 불가)# 주로 수정하면 안 되는 데이터셋에 사용 참고글 : [Python] 리스트 (list) # 튜플 생성>>> t1 = (1,2,3)>>> t1(1, 2, 3) >>> t1 = 1,2,3>>> t1(1, 2, 3) >>> t1 = (10) >>> t110>>> type(t1) # 하나의 원소만 삽입 시 스칼라 원소로 적용 >>> t2 = (10,) >>> t2(10,)>>> type(t2) # 하나의 원소를 튜플로 삽입 시 ,(콤마)와 함께 사용 # 튜플은 수정, 삽입, 삭제 불가>>> t1 = (1,2,3) >>> t1[..
리스트(list) 리스트는 Key-value 형태로 저장되는 데이터 형식입니다. key - value name : smith tel : 02)345-6958 sal : 4000 프로그래밍을 해보신 분 이라면, C의 구조체, 파이썬의 딕셔너리와 같은 구조라고 생각하시면 됩니다. 리스트는 벡터와 다르게 서로 다른 데이터 타입을 허용하지만, 리스트의 key 안의 데이터 타입은 같아야 합니다. 분석에서는 자주 사용되지 않지만 알고는 있는게 좋겠죠? 먼저, 벡터로도 리스트를 만들 수 있지만, 데이터 타입이 다르면 만들 수 없고, 따로 이름 지정을 해주어야 합니다. > val1 names(val1) val1 name tel sal "smith" "02)345-6958" "4000" 리스트의 생성 리스트는 층별 구조..
벡터(Factor) 벡터는 "1차원에 여러개의 데이터가 모인 데이터의 집합(컬럼)" 라고 할 수 있습니다. 스칼라로 이루어진 집합이라고 할 수도 있고 프로그래밍 언어에서의 배열이라고 할 수도 있겠네요. R 에서 동시에 여러 개의 데이터를 가질 수 있는 것은 벡터뿐이라고 하니, 벡터는 자주 쓰일 만큼 중요합니다 !! 그림으로 표현하자면 "1차원 통에 , 동일한 스마일들의 모임" 과 같이 표현할 수 있습니다. 벡터는 다른 타입의 데이터를 허용하지 않습니다. 그래서 하나의 데이터 타입으로만 저장해야 합니다. 만일, 숫자 타입과 문자 타입의 데이터를 한 공간에 저장하면 하위 데이터 타입(숫자 타입)은 상위 데이터 타입(문자 타입)으로 변환되어 저장됩니다. 만일, 숫자 데이터를 연산하여 사용하려하지만, 같이 저장..