Skip to content

Instantly share code, notes, and snippets.

@yuu-ito
yuu-ito / git-svn.md
Last active December 15, 2015 16:39
@yuu-ito
yuu-ito / date_tips.R
Created October 7, 2013 07:52
日付型の操作メモ
seq(as.Date("2013-01-01"), len=12, by="1 month")
# [1] "2013-01-01" "2013-02-01" "2013-03-01" "2013-04-01" "2013-05-01" "2013-06-01" "2013-07-01" "2013-08-01"
# [9] "2013-09-01" "2013-10-01" "2013-11-01" "2013-12-01"
seq(as.Date("2013-01-01"), len=12, by="-1 month")
# [1] "2013-01-01" "2012-12-01" "2012-11-01" "2012-10-01" "2012-09-01" "2012-08-01" "2012-07-01" "2012-06-01"
# [9] "2012-05-01" "2012-04-01" "2012-03-01" "2012-02-01"
# 文字列日付 --> 1ヶ月前の日付に
tail(seq(as.Date("2013-09-30"), len=2, by="-1 month"),1)
@yuu-ito
yuu-ito / 001_memo.md
Last active December 26, 2015 04:39
Rのmerge関数で3つ以上のデータフレームを結合したかったので。 ググって見つけたものをまとめておく。

R mclust メモ

クラスタ分析するときにまとめたメモ

お試しコード

  • test.R
    • irisのデータを使って

参考リンク

  • mclust -Normal Mixture Modeling for Model-Based Clustering, Classification, and Density Estimation-
@yuu-ito
yuu-ito / R_mvpart_package.md
Last active December 26, 2015 20:39
mvpart package サンプル

mvpart package サンプル

  • iris(あやめ)の大きな3枚のはなびらは,「Sepal がく片」
  • 小さな3枚のはなびらが,「Petal 花びら」である.
  • Sepal「がく片」の長さと幅・Petal「花びら」の長さと幅
  • Species「あやめ3品種 [setosa・versicolor・virginica]」
data(iris)

kmeans関数でのクラスタリング

k-meansでのクラスタリングはRはデフォルトで関数を用意している。 混合分布モデルでのクラスタリングは階層型。これは非階層型(分割最適化手法)のクラスタリング。

# 引用元 http://d.hatena.ne.jp/hamadakoichi/20100415/p1 kmeans
data(iris)
@yuu-ito
yuu-ito / 寒い冬の過ごし方.md
Last active December 30, 2015 07:49
寒い冬の過ごし方。 #vgadvent2013 〜アイスクリーム統計学をSQLで書いてみた〜
# install.packages("party")
library("party")
# ?ctree
irisct <- ctree(Species ~ .,data = iris)
irisct
plot(irisct)
@yuu-ito
yuu-ito / _共起尺度.md
Last active June 29, 2016 01:29
共起、距離行列、内積、類似度、

共起尺度メモ

主なものとして

  • Jaccard係数
  • Simpson係数
  • コサイン距離

共起尺度、共起頻度の指標は自然言語処理関連でよく使われているらしい。

  • 文書中の単語の出現数から文書間の類似性をみるなど