FC2ブログ

データマイニンぐー


いまもって確かなことはよく理解してないで
見よう見まねであそんでおります。

まずは練習データをつくる。
基本的には1つのデータについて
知りたい、予想させたい項目を一番右にして
全項目をカンマで区切る。
属性情報もいろいろつける。

想定外な数値が混じると
それにひっぱられて芳しくない結果が出たりするから
間引いたり、逆にこちらで計算した属性をつけたりもする。
この前処理はデータを作る際にやってもいいし
マイニングツールにやらせてもいい。
ただし、あまりやり過ぎると
ただの統計分析になるので注意。

で、それをクラスファイアに流す。
これが訓練の段階。
クラスファイアもいろいろあるので、
いろいろ試す。いろいろやることが大事。
誤認識がすくないクラスファイアと設定を
見つけるのがマイニングたるゆえん。

で、クロスフォルドでテストしたり、
別の実データをもってきてテストする。
こんな流れ。
これで株するのがいまの夢だなぁ。

数学の抽象性も好きだけど
応用科学っていうのかな、
実社会にアプローチできる技術も好きだなぁ。
関連記事

コメントの投稿

非公開コメント

a8
最近の記事
月別アーカイブ
ブログ内検索
グリムス
フリーエリア
リンク
RSSフィード