Blog
    54 posts
はじめに
データ分析勉強会は2011年度にヤマハ株式会社の小池利和氏が発足したR勉強会を母体としたソフトウェアメトリクスの分析に興味、関心がある有志による勉強会です。本勉強会は講義を聞くための場ではなく「主体的......
条件を満たすデータの個数をカウントする
ベクトルデータの場合 Text Update: 01/21, 2020 (JST) Rで条件を満たすデータの個数を数える方法はいたってシンプルです。 ベクトルデータの場合 例えば任意に発生させた\(1\)から\(100\)までの\(100\)個の整数があると......
RWeka::M5Pに代わるモデリング関数
Packages and Datasets データ概要 データの分割 Package Cubist パッケージのインストール モデリング 学習モデルの作成 モデルデータの参照方法 ルール 各ルールの回帰式(回帰係数表) 各フィーチャーの利用率(属性利用率) 学習モデルを用いた予測 モ......
線形回帰モデルとモデル木の比較
Packages and Datasets 対象データ 線形回帰による予測 モデル木による予測 データの分割 モデルの作成 結果の読み方 モデルを用いた予測 全データに対する予測 結果比較 まとめ Text Update: 11/20, 2019 (JST) 『Rによる機械学習』第2版(以降、テキスト)の第6......
tidyr 1.0.0
Packages and Datasets tidyr pivot_longer関数 旧来の方法 新しい方法 旧新比較 応用例 応用例(その2) pivot_wider関数 旧来の方法 新しい方法 旧新比較 応用例 応用例(その2) 識別情報がない場合 補助関数群(sele......
交差検証
Packages and Datasets 交差検証 交差検証の概要 k-fold交差検証 leave-one-out交差検証 評価指標 混同行列 評価指標の定義 正確度・誤答率(エラーレート) 真陽性率・偽陰性率 真陰性率・偽陽性率 陽性的中率・偽発見率 調......