データ解析(統計)の講義1〜2

基本情報も終わり、区切りがついたのでWEB関連の勉強をする。
『ゼロから学ぶWEBプログラミング』という雑誌を一通り読み、以下の講義を見てた。
全部英語だったので、学習メモを記録に残す。

インターネット計測とデータ解析 (GIGA) (1〜2)
http://gc.sfc.keio.ac.jp/cgi/class/class_top.cgi?2012_33903

【講義内容】
WEBの膨大なデータを取り扱う。
rubyやGunplotを使って、膨大なデータを可視化する。

Rubyのインストール手順
1.http://rubyinstaller.org/downloads/ にアクセスする。
2.「Ruby 1.8.7-p371」をクリックし、ダウンロードする。
3.ダウンロードした「Ruby 1.8.7-p371」をクリックし、インストールする。
4.インストールの際に、パスを設定する。パスの設定をし忘れた場合は、
マイコンピュータ右クリック→プロパティ→詳細設定タブ→環境変数→システム環境変数のpathに「C:\Ruby187\bin;」を入力し、設定する。
5.コマンドプロンプトを表示し、「ruby -v」と入力する。「ruby 1.8.7 (2012-10-12 patchlevel 371) [i386-mingw32]」と表示されたらインストール成功。このように表示されなかったら、インストールを間違えたかpathの設定が誤っている可能性があるのでやりなおしする。

Gunplotのインストール手順
1.http://gunplot.info/にアクセスする。
2.「Current gnuplot version (4.6.0)」の「Primary download site on SourceForge .」をクリックする。
3.「Download gp460-win32-setup.exe (9.9 MB)」をクリックしてダウンロードする。(sourceforge
4.インストールする。(一応パス指定した)
5.gunplotを起動して、「plot tan(x)」と入力すれば、tan(x)を可視化することができる。

          • ここまでが事前準備-----

講義、pdfのサンプルプログラムの例
1.「http://www.iijlab.net/~kjc/classes/sfc2012f-measurement/marathon.txt」を「foo.txt」という名前で保存する。
2.「講義2の lecture slides (pdf) 」のp28の内容を「count.rb」という名前で保存する。
3.コマンドプロンプトで、「ruby count.rb foo.txt」と入力すれば「68」と出力される。

その他、統計に使えそうなサンプルプログラムが用意されており、実際に練習できるようになっていた。
数式の意味とアルゴリズムの処理内容、出力された結果の意味がわかるようになれば、面白くなってきそうだ。
内容に関しては、後で振り返る。

以下、キーワード(google翻訳で翻訳したキーワード)。あとで学習する。
離散モデル、連続モデル、大数の法則中心極限定理、標準誤差、正規分布ヒストグラム確率密度関数、累計分布関数