k-takahashi's blog

個人雑記用

TRY R

最近よく耳にするようになった "R"。入門コースがあったので試してみた。
https://www.codeschool.com/courses/try-r
英語なんだけれど、分かりやすかった。このページとは別にRのコンソールを出しておいて、そっちで確認しながらやるのをお勧め。


http://www.ic.nanzan-u.ac.jp/~urakami/R.html
こちらはステップバイステップ。統計処理でよく使う検定まで含んでいます。日本語なので英語の苦手な人はこっちがいいのかも(上のページの英語は簡単ですけど一応)。


以下、自分用メモ

  • "<-" が代入。何度うっかりミスをやったことやら。
  • やっぱり日本語処理が色々不安。今のところは大丈夫だけど


お遊びで、手元の艦これの建造ログをいじってみた。

日付,種類,名前,艦種,燃料,弾薬,鋼材,ボーキ,開発資材,空きドック,秘書艦,司令部Lv
2014-02-02 22:56:29,通常艦建造,五十鈴,軽巡洋艦,300,300,600,600,1,0,長門改(Lv52),68
2014-02-03 20:13:26,通常艦建造,祥鳳,軽空母,300,300,600,600,1,0,長門改(Lv52),68
2014-02-03 21:20:13,通常艦建造,龍田,軽巡洋艦,30,30,30,30,1,0,赤城改(Lv61),68
2014-02-03 21:20:29,通常艦建造,龍田,軽巡洋艦,30,30,30,30,1,1,赤城改(Lv61),68
(以下続く)

というログファイル(建造報告書.csv)から、

x <- read.csv("建造報告書.csv", header=TRUE)
x2 <- subset(x, 種類=="大型艦建造")
v1 <- c("名前","燃料","弾薬","鋼材","ボーキ")
x3 <- x2[v1]
x4 <- transform(x3, 総資源=paste(x4[,2], x4[,3], x4[,4], x4[,5], sep="_"))
x5 <- x4[c("総資源", "名前")]
x5[order(x5$総資源),]

とかやると

総資源 名前
817 1500_1500_2000_1000 まるゆ
822 1500_1500_2000_1000 長門
737 4000_2000_4000_5200 加賀
760 4000_2000_4000_5200 翔鶴
782 4000_2000_4000_5200 長門
(以下続く)

とか出てきます。あとは数えるなり、グラフ化するなり。
ちなみに、私は今のところ「4000,6000,6000,2000」の大型艦建造を26回実施しており、うち大和型が1回。
ここによれば、このレシピの大和型建造率は「5223回中568大和(10.87%)」。さてこれを検定してみよう。

> chisq.test(c(1,26), p=c(568,5223-568)/5223)
Chi-squared test for given probabilities
data: c(1, 26)
X-squared = 1.4326, df = 1, p-value = 0.2313

Warning message:
In chisq.test(c(1, 26), p = c(568, 5223 - 568)/5223) :
Chi-squared approximation may be incorrect

ということで、「データが小さ過ぎる」という warning はとりあえず無視するとして、p-valueの0.23は充分大きいので、「あなたが特に不幸であるとか、データが間違っているとかはとりあえず疑わなくて良い」ということでした。
もうしばらく回さないと駄目そう。