upaksta’s blog

忘れないうちにメモする備忘録です

データの標準化 R

ベクトル、行列、データフレームのデータを標準化する ①、ベクトルデータの場合 > x <- c(1,2,3,4,5) > zx <- (x - mean(x))/sdx> zx[1] -1.2649111 -0.6324555 0.0000000 0.6324555 1.2649111 これをscale()関数でできる > scale(x) [,1][1,] -1.2649111[2,…

Rデータフレームから一部を抜き出す

いろいろやり方はあると思いますが、ここでは【subset()関数】を使います。 >?subset subset(x, subset, select, drop = FALSE, ...)x: データフレームsubset: 条件式を書き、それを満たすものが抜き出されるselect: 列を指定。その列が抜き出される。drop: …

データの種類

定性的データ:カテゴリカルデータ・質的データ ①名義尺度:単に分類するために整理番号として数値を割り当てたもの。 → 度数・最頻値 ②順序尺度:離散的な数値を用いる。順序には意味があるが、数値間の間隔には意味がない → 度数・最頻値・中央値 定量的デ…

Rで箱ひげ図をかく

統計ソフトのRを使って、箱ひげ図を作成。 データはRに入ってるmtcarsというデータセットを用いた。 中身は11個の変数に対してそれぞれ32個のデータがある。 > str(mtcars)'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 …