#. 색인 (.np.ix_, .iloc, .loc) *# 슬라이스 색인 (얕은 복사, 원본 갱신) - 1차원 : ar[n:m] # n~m-1 - 2차원 : arr[:2] # 행 우선 (n~1행) arr[:2, 1:] # (n~1행, 1~m열) # 다차원 색인 - arr[[1,5,3], [2,6,4]] # point 색인 (1,2), (5,6), (3,4) - arr[[1,5,3], [:,[2,6,4]] # 1,5,3행의 2,6,4열 # np.ix_() 함수 색인 - arr[np.ix_([1,5,3], [2,6,4])] # 1,5,3행의 2,6,4열 (np.ix_ 함수 : 위치 값으로 전달) # iloc[] 정수 색인 - df.iloc[0,:] # 0번째 행 - df.iloc[:,0] # 0번째 열 - d..
R에서의 NA는 '잘못된 값', Null은 '아직 정해지지 않은 값'으로, 서로 다른 의미를 가지고 있었습니다. 파이썬에서는 R과 다르게 NaN(NA)와 Null 을 '정해지지 않은 값' 의 의미로 같이 사용합니다. 그렇기 때문에 NaN으로 Na와 Null을 모두 표현합니다. # NA 사용 방법from pandas import Series, DataFrame Series([1,2,3,np.nan])0 1.0 1 2.0 2 3.0 3 NaN dtype: float64 # NaN 값 때문에 데이터 타입이 float from numpy import nan as NA # np.nan 사용이 번거로울 경우 alias 사용 Series([1,2,3,NA])0 1.0 1 2.0 2 3.0 3 NaN dtype: fl..
아래와 같은 데이터를 R로 읽어오면 아래와 같이 공백을 NA로 채우게 됩니다. > subway subway 전체 구분 X05.06 X06.07 X07.08 X08.09 X09.10 X10.11 X11.12 ...1 서울역(1) 승차 17,465 18,434 50,313 93,398 78,705 86,342 93,585 ...2 하차 7,829 48,553 110,250 233,852 121,983 79,628 75,577 ...3 시 청(1) 승차 2,993 4,473 7,633 10,404 13,328 16,953 25,467 ...4 하차 4,142 19,730 67,995 175,458 83,777 48,363 47,519 ...5 종 각 승차 7,371 7,836 14,545 24,578 23,6..
연산 수치연산자와 함수 벡터 연산 벡터 연산은 벡터의 요소별로 계산을 수행할 수 있고, 대체적으로 for문 없이도 연산이 가능합니다.(단, if문 제외) 참고: [R] 벡터(vector) > x x + 10 [1] 11 11 12 12 13 13 > x + x [1] 2 2 4 4 6 6 > x == c(1,2,2,3,4,4) [1] TRUE FALSE TRUE FALSE FALSE FALSE 벡터의 산술 연산 > x sum(x) # 합 [1] 330 > mean(x) # 평균 [1] 82.5 > median(x) # 중앙값 [1] 82.5 # sum과 mean 사용 시 주의사항 > help(sum) sum(..., na.rm = FALSE) # 인자가 확장형으로 설계 > sum(1,2,3) # 사용 가..
스칼라(Scalar) 스칼라는 단일 차원의 값, 단 하나의 원소값을 의미합니다. 간단하죠? 한 변수에 하나의 값이 들어있다면, 그것은 스칼라라고 할 수 있겠죠? 그림으로 표현하자면 단일 차원의 통에 , 단 하나의 스마일 같이 표현할 수 있습니다. 스칼라만 설명하면 너무 단순하니.. NA, NULL 도 추가했습니다. 1) NA, NULL R 에서 NA는 잘못된 값, NULL은 아직 정해지지 않은 값을 의미합니다.> var1 var1 NULL# 여기서 null은 입력된 널 값을 의미하는 것이 아니라 변수에 값이 정해지지 않앗다는 의미의 null이 출력) > var2 var2 [1] 1 # var2 라는 변수에 1 이라는 정해진 값이 있기때문에, null이 아닌 1을 출력, null은 아직 값이 정해지지 않았..