upaksta’s blog

忘れないうちにメモする備忘録です

データ処理

データの標準化 R

ベクトル、行列、データフレームのデータを標準化する ①、ベクトルデータの場合 > x <- c(1,2,3,4,5) > zx <- (x - mean(x))/sdx> zx[1] -1.2649111 -0.6324555 0.0000000 0.6324555 1.2649111 これをscale()関数でできる > scale(x) [,1][1,] -1.2649111[2,…

Rデータフレームから一部を抜き出す

いろいろやり方はあると思いますが、ここでは【subset()関数】を使います。 >?subset subset(x, subset, select, drop = FALSE, ...)x: データフレームsubset: 条件式を書き、それを満たすものが抜き出されるselect: 列を指定。その列が抜き出される。drop: …

データの種類

定性的データ:カテゴリカルデータ・質的データ ①名義尺度:単に分類するために整理番号として数値を割り当てたもの。 → 度数・最頻値 ②順序尺度:離散的な数値を用いる。順序には意味があるが、数値間の間隔には意味がない → 度数・最頻値・中央値 定量的デ…