티스토리 뷰

반응형

R에 내장된(탑재된) 데이터 셋 중 분석 연습에 가장 흔히 사용되는 데이터 셋은 iris 데이터일 것입니다.

iris 데이터는 data.frame 형식으로 저장되어있기 때문에 데이터 확인이 바로 가능한 것입니다.

> data(iris)

> iris

    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species

1            5.1         3.5          1.4         0.2     setosa

2            4.9         3.0          1.4         0.2     setosa

...

149          6.2         3.4          5.4         2.3  virginica

150          5.9         3.0          5.1         1.8  virginica

> str(iris)

'data.frame': 150 obs. of  5 variables:

 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...

 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...

 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...

 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...

 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

> class(iris)

[1] "data.frame"



하지만 !! 

arules 패키지에 내장된 Groceries 데이터를 예로 들면, 확인하고 싶은 데이터는 나오지가 않죠..

데이터가 data.frame 형식으로 저장되어있지 않기 때문입니다.

> library(arules)

> data(Groceries)

> Groceries

transactions in sparse format with

 9835 transactions (rows) and

 169 items (columns)

> str(Groceries)

Formal class 'transactions' [package "arules"] with 3 slots

  ..@ data       :Formal class 'ngCMatrix' [package "Matrix"] with 5 slots

  .. .. ..@ i       : int [1:43367] 13 60 69 78 14 29 98 24 15 29 ...

  .. .. ..@ p       : int [1:9836] 0 4 7 8 12 16 21 22 27 28 ...

  .. .. ..@ Dim     : int [1:2] 169 9835

  .. .. ..@ Dimnames:List of 2

  .. .. .. ..$ : NULL

  .. .. .. ..$ : NULL

  .. .. ..@ factors : list()

  ..@ itemInfo   :'data.frame': 169 obs. of  3 variables:

  .. ..$ labels: chr [1:169] "frankfurter" "sausage" "liver loaf" "ham" ...

  .. ..$ level2: Factor w/ 55 levels "baby food","bags",..: 44 44 44 44 44 44 44 42 42 41 ...

  .. ..$ level1: Factor w/ 10 levels "canned food",..: 6 6 6 6 6 6 6 6 6 6 ...

  ..@ itemsetInfo:'data.frame': 0 obs. of  0 variables

> class(Groceries)

[1] "transactions"

attr(,"package")

[1] "arules"




결론. 확인 방법 !! 


1. RStudio 우측 상단 Environment 창에 로딩된 Groceries 데이터를 클릭해줍니다.


2. 데이터가 들어있는 itemInfo 혹은 itemsetInfo에 커서를 올리면 우측에 아이콘이 두 개 생기는데, 왼쪽에 있는 아이콘을 클릭해줍니다.


3. 다음과 같이 데이터셋을 확인할 수 있습니다.



반응형
댓글
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday