データマイニング・統計・数学の最近のブログ記事

ほとんど読むところがないし,目新しいことは全くない本.
平均三種(算術平均(相加平均),幾何平均(相乗平均),調和平均),相関係数,回帰分析などを知っている人ならば,この本に載っていることぐらいはすでに試していると思われるので読む価値は全くないと思う.値段ほどの価値は無いと感じた.

【送料無料】上昇株らくらく発見法

【送料無料】上昇株らくらく発見法
価格:1,890円(税込、送料別)

話はシンプルでわかりやすい.
要するに過去3ヶ月間の月足の安値の増加が等間隔(3,2,1ヶ月前という並びと月足安値の相関=0.98以上)の銘柄を,前月の高値と安値の調和平均以下で買うというルールを紹介している(下げの時は相関=-0.98以下).

4ヶ月なら相関=0.87以上の銘柄を買うだそうだ.もっとも上げ相場のときはその基準を少しゆるめて0.95以上とかでも良いとか.

しかし,紹介されている方法だけでは実際には使い物にならない.


さらに,単回帰で翌日の安値とか高値を予測するとかいってうまく予測できる例が載っているが,他のデータでちょっと試してみれば,それだけで予測しようなんて気には絶対にならないと思う.

あと,「うまくいきました」というのに都合が良いものになるよう,ささやかな処理を各所でしている気がする.四捨五入か,切り捨てか,切り上げか等も含めて.

それにしても『散布図』ねえ?一応,1変数の時系列データなんだから...



なんか中途半端な印象の本.それ以前に,自分の文化圏というか領域では普通は縦棒|で表現するものがびみょうな斜線になっていて,それだけで気持ちが悪い.

ベイズを使ったという例がいろいろ書いてあり読み物としてはなかなか楽しいのだけど,それについてプログラムを書いて実装とかを考えると,本筋のところが抜けているようで,この本自体はあまり役に立たないかも.

一応,後ろの方にExcelを使った方法が説明されているので,とりあえず使ってみたいという人には良いのかもしれない.

ベイズな予測

第1章 「ベイズな予測」で何がわかる?
 「ベイズの定理」とは?─ベイジアンクラブへようこそ
 ベイズの定理の適用範囲─実はいろいろな場面で使われている
 「ベイズの定理」を応用すると)

第2章 予測の仕組みを知ろう!─ベイズの定理のキホン
 「ナイーブ」なベイズ??
 提供してくれる価値─洞察と予測
 モデルの役割 
 極端な値を出さないために~ラプラス補正~
 モデルの精度を高めるために~リフトチャート~
 利益を確保するために~ROIチャート~
 予測誤差を出さないために~混同マトリクス~

第3章 ベイズの定理実践編─Microsoft Officeへの拡張
 Excelで予測をはじめよう!
 Visioでもっと予測してみよう!

ベイズ統計の入門といったタイトルの本は多いが,全然入門書ではないものも見受けられる.

その点,松原先生の本はわかりやすくてよい.多少入り組んで見える部分もきちんと読めばちゃんと理解できるように書いてある.ベイズ統計の入門書の中ではオススメ出来ると思う.
 入門ベイズ統計
中身としてはずっと昔に,放送大学のテキストとして市販されていた『統計的決定』の改訂版といった感じ.ほとんど同じ内容の章が多い(ただし,もちろん当時の誤植はかなり修正されている).ほとんど書き換わっているのは全部で3章分ぐらいかな.最後のベイジアン・ネットワーク入門は全くの新規かも.


ベイズの定理
ベイズ決定の基礎
社会的リスクと決定
ベイズ判別問題とパターン認識
情報検索とベイズ決定
線型回帰モデルのベイズ推定
ベイズ更新とカルマン・フィルター
医学とベイズ決定
医薬とベイズ統計学
信頼性とベイズ統計学
イメージ・プロセシングとベイズ定理
ベイジアン・ネットワーク入門

著者名をどこかで見たことがあるなと思ったら,ブルーバックスから出ている孫子の兵法の数学モデル(実践篇)などを書いた人だった.

評価と意思決定の解析に従事している人のマニュアルとのことだが,最初のほうは経済政策の話.全体としては,公共事業評価にコンジョイント分析とAHP分析を使うといった感じ.
もっとマーケティングとか商品開発寄りの題材が載っているかと思って買ったので,その点はちょっとがっかり.

ただし,基礎理論も解説してある.つまり,AHP(階層分析法)やそれをネットワーク型に拡張したANPの理論や,コンジョイント分析の理論についても一通り書いてある.個人的にはこちらの方に興味があった.

184ページの参考文献は一部文字が消えていて読めなかった.

最後の章はエスミから出ているエクセルのアドインソフトでコンジョイント分析とAHP分析をする方法について.そのソフトは使ったことがないのでよくわからないが,出力の読み方等はもっと詳しく書いてもらえた方がありがたいかも.

 AHPとコンジョイント分析

第1章 公共事業評価における新しいパラダイム
第2章 公共事業の決め方と公共受容.決定について.
第3章 AHP理論と解釈,下宿決定の例.
第4章 AHPによる交通手段分担率の推定
第5章 ANPと比較構造分析法
第6章 コンジョイント分析の理論と課題.ボイスメールサービス,CATVサービス.
第7章 コンジョイント分析によるビオトープの環境経済評価
第8章 CVM調査とコンジョイント分析.仮想市場評価法,海岸汚染と海岸の復元等に関するアンケート.
第9章 ソフトによるAHPとコンジョイント分析

 女子大生会計士の事件簿(DX.5)
全体として,美人でお嬢様の新キャラ村咲紫編といった方がぴったりかな.せっかくの新キャラなんだから,あと半巻ぐらいは活躍させても良かったのではという気も.

それにしても,村咲紫の読み方を説明するシーン,そう来るか?といった感じ.普通に源氏物語と紫のゆかりを言ってから,ふりかけについて語った方が笑いを誘いそうな気も.


カッキーの誕生日は2/22らしい.あと,女子大生会計士,はじめましたのおまけファイル2に出てきた人がなんじゃそら?という形で再登場.


出てくる話題は美術品,コンビニの内部不正,連結外しなど.

いろいろご都合主義なところもあり,最後はベタな終わり方.でもまあ楽しく読めた.5巻で完結という話だったが,まだ続くみたいで嬉しい.

しかし,ドラマ化されるんだ.イメージが壊れなければいいんだけど.


アンケートの自由記述内容を分類してから対応分析か決定木でもしようかと思って,本を探しているときに見つけて,タイトルだけで注文してしまい失敗したと思った一冊.

少なくとも,マーケティングとかそういった分野での活用を考えているなら,今日では多分ほとんど役に立たないと思われる.

CLTOOL(ことえもん)というソフトウェアの使い方を説明した本.手元の本は2003年初版となっている.著者のWebサイトを探したのだけど,Googleでは残骸しか見あたらなかった.つまり,そのソフトを使いたいと思っても,このブログを書いている時点ではダウンロード等はできないということになる.

 Windows PCによる日本語研究法―Perl,CLTOOLによるテキストデータ処理

もちろん,一応CD-ROMつきなので,本を買えば使えなくはない.

ただし,テキストの検索やフィルタリングなどの用途であれば,最近はもっと別のソフトが出ているので,ちょっとしたテキストマイニングもどきをしたいのであれば,わざわざこの本を選ぶ理由はあまりないかも.

分析の例も文学作品のちょっとした集計といった感じなので,大して参考にはならなかった.今時そんなものを集計して誰が嬉しいんだろうかという感じだし.もっとも,当時は有用なツールだったのかもしれないが.

 女子大生会計士、はじめました

はじめました,って始めてないやんけ.と思ったのは自分だけではないはず.

世界一やさしい会計の本です に登場した社長さんはキャラが書き換えられて再登場していた.

萌実版ヴェニスの商人は,CMを無理矢理織り込んだりで何か笑える.

アキハバラ会計士遁走曲事件で出てきた『送料で儲け』というのは,実際にやっているインターネット販売のお店が結構あるよなぁ.楽天の1円オークションとかだとメイル便サイズのものの送料が1200円とかいうのもあったし.

アキハバラ会計士遁走曲事件―インターネット販売の話
藤原萌実と謎のプレジデント事件―投資と詐欺の話
逆粉飾の殺人事件―逆粉飾の話
萌実版ヴェニスの商人事件―冒険会計の話
女子大生会計士、はじめました事件―むかしの話


 その数学が戦略を決める
タイトルからは何となくもうちょっとソフトな統計的意志決定の本かなと思ったのだけど,データを使ってバリバリという感じ.

そろそろデータマイニングという言葉が古くさくなってきたところで,今度は絶対計算といったところか.


ちなみに『やばい経済学』の著者の一人と同僚らしい.それと,p.244ジョン・ロット(メアリー・ロシュ)に難癖つけられたようだ.

p.37付近のガルトンって書いてあるのは心理学の分野ではゴルトンと表記されることが多いかな.

回帰分析の類を使って専門家をなぎ倒すって感じを出したかったのだろうか?それはともかくとして,回帰分析ってそんなに良いかな?自分が使った経験からは,当たり前だけど式に突っ込む変数が適切でないと大して上手く予測できないような気が...

もちろん,適切なデータが存在し,適切な変数を使用した場合には予測の類も上手くできるわけだけど,結局それ以外の何物でもない.その難しさが問題になるわけだが,その解決策が示されているわけでもない.例えば,ワインの値段(品質?)を予測する変数は一体どのように決めたのだろうか?

 図解入門よくわかる多変量解析の基本と仕組み
副題として巨大データベースの分析手法入門とも書いてある.

幅広く載ってはいるのだけど,個々の手法についての説明がとにかく薄すぎる.数量化I類とII類を合わせて2ページ.数量化III類が2ページ.潜在クラス分析が6ページ.サポートベクターマシンも図を入れて6ページといった調子.

以前から知っている事柄が半分以上だったけれど,この本を読んで『よくわかる』かと言われるとちょっとどうかと思う.

本文中に入っているべき記号がボコボコ抜けていて訳がわからない状態になっているページもある(いや,内容が分かる人には何が入るか分かるだろうけど,そういう人は普通読まないだろう).

多変量解析について全く知らない人にはちょっと取っつきにくいだろうし,ある程度知っている人には全然物足りないだろうしといった感じ.

まったくの期待はずれ.これで1800円ではコストパフォーマンスが悪すぎる.

数式を使わないデータマイニング入門 数式を使わないデータマイニング入門

データマイニングとはどんなモノか,ほんのさわりの部分だけでも理解したい方向けという印象で,本当に数式が出てこないが,読んだからといってデータマイニングが出来るようになるわけではなさそう.

中身としてはは,回帰分析,決定木,クラスター分析,自己組織化マップ(コホーネンマップ),連関規則(連想規則,相関規則),ニューラルネットの簡略な説明.最後の方に情報管理,監視社会の話が出ている.

前書きの所に,『「最小二乗法が説明できる」,「クラスタ分析は仕事でやっている」という方には簡単すぎる』という趣旨のことが書いてあるが,全くその通りだと思う.少しでも多変量解析などを勉強したことがある人は読まなくてもよいかも.

モビルスーツのクラスタ分析には笑ってしまった.自己組織化マップはよく分からなかった.

 ビジネスチャンス発見の技術

ビジネスチャンス発見の技術というタイトルなので,データマイニングの方法が色々解説されているのかと思って買ったのだけど,全然違った.

MDSで対象を布置したような図とともにキーグラフという言葉がたくさん出てきたので,これこそが著者が説明したい&唯一紹介されている手法かと思ったのだけど,それについてもこの本を読んでも正体が今ひとつつかめなかった.

(自分にとっては○○基準に基づいて類似度行列を作った等の説明があると分かりやすいのだけど...アルゴリズムなどはチャンス発見の情報技術 を参照だって)

結局モデルやシナリオを作ったり,解釈したりするのは人間ということか.で,人間の相互作用なども大事と.人間の相互作用やリーダーに関する話はともかく,モデルを作るのも解釈するのも人間だという話なら統計学の授業でさんざん言われたような気が...

新書だから安かったとはいえ,あまり勉強にならなかったなぁという印象(読み込み不足かもしれないが...).

章立てとメモ

1.チャンスはどこにあるのか
見落とさなければすぐそこにあるかもということか.

2.チャンス発見のプロセス
決定木で降雪予測.『うすうす気づき』.二重螺旋,主体の思考過程とデータ.

3.コミュニケーションからチャンスに気づく
コール天の例,シニアの衣類乾燥機,環境問題.テキストマイニングで副詞にも着目というのはなるほどと思った.自分が使うときにはデータの性質上いつも捨てているのだけど.

4.チャンスに気づくコミュニティを創る
スモールワールド.p.114のミルグリムの実験っていうのはミルグラムの実験と習ったような気がするのだけど...だとすると届いた手紙の方がずっと少なかったと記憶しているが気のせい???

5成功と失敗 シナリオの分かれ目
肝炎データの失敗と成功.

付録

このアーカイブについて

このページには、過去に書かれた読んだ本の紹介のうちデータマイニング・統計・数学カテゴリに属しているものが含まれています。

次のカテゴリは健康です。

最近の読んだ本の紹介はインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。