LIVE SIMPLY

データ活用組織のマネジメントを行いつつコーチング、本など学んだことを書くblog

12/29(水) 大学同級生と飲み

今日は恵比寿のビアステーションで、
大学の学科友人の結婚式の打ち合わせ飲みだった〜ビール

当日の役割分担と、タスクを割り振って終わりました

てか今日は久々(半年ぶりくらい?)の飲みだったが、
まったくブランクを感じさせない飲みだった
楽しかった〜チョキ
伊藤リ○ンのマネと海○蔵のマネが意外と鉄板だった(笑)

1月の結婚式までにもう一回集まる予定
結婚式も楽しみだ〜!!



====
学習メモ

形態素解析
・機能
分かち書き

形態素
テキストから、品詞分解した結果抽出された各単語

・どうやって品詞分解しているのか??
→内部で辞書を持っている(辞書はカスタマイズできる)

・辞書にない単語は?
→品詞の並びで予測できる

・最近
KAKASINamazu
JUMAN(京大)
Chasen
MeCab → 語幹がわかるので、活用もカバーできる
ex.ググる、ググれ、ググって

■JSON
○ひとことで言うと
データ交換を行うためのデータ記述形式の一種

○特徴
・軽量
・Webアプリケーション(ブラウザー上で動作するアプリケーション)環境でのデータ送受・連携によく利用される
・特にAjaxを用いた利用が注目される
JavaScriptにおけるオブジェクトの表記法の1つを、ほとんどそのまま利用したデータフォーマット。
JavaScriptの言語仕様から生まれ、XMLよりも表記方法が単純→人間が理解しやすい

○略
Java Script Object Notation


■構造化プログラミング
○ひとことで言うと
分かりやすい構造をもつプログラムを書こう!というプログラミング方法論の1つ

○背景
★良いプログラムとは
・正しい動作をする。
・それが正しく動作することが分かりやすく理解できる
→プログラムの中を見て論証で確認することがしやすくする!
→分かりやすい構造をもつプログラムを書こう!

★抽象化とは?
事柄の本質的部分とそうでない部分とを分離し,
その本質的部分を抜き出すことを抽象といいます。


○概要
・順次、選択、反復の3つを利用してプログラムする
→構造化プログラミングはこれ以外の制御構造を使ってはいけない

※有名なものとしては
任意の処理への無条件,或いは条件付ジャンプを使わない、つまり goto文は使わない
∵コンピュータでの計算経過をプログラム上で追うことが困難になる


○特徴
・構成要素になっているそれぞれのプログラムブロックは、
与えられたその機能を実現することだけを考えて作ればよく、プログラム全体のことは原則として考慮する必要がない。

参考:http://hms.tukusi.ne.jp/~ooyu/s78k/s78k33.htm
http://www2.cc.niigata-u.ac.jp/~takeuchi/tbasic/Intro2Basic/Structure.html#purpose

○メリット
各ブロックを複数人で分担して作成できる
プログラムの再利用が可能になる
メンテナンスが楽である



プログラムは命令の列でできている。この命令 はつぎの3つに分類される。


ベイジアンフィルタ
事前に正解データを学習させておくことで
確率的にその文書がどのカテゴリに属するのかを判定するプログラム

MogileFS(モガイル) とは
○概要
Perl で記述されているオープンソース分散ファイルシステム

○特徴
・ファイルを複数ホストに自動コピー / バックアップできる。
・クライアント・サーバー間のプロトコルに HTTP を利用する。
iSCSIのように利用するために、カーネルをリビルドする必要もない

trackers
client と storage nodes との仲介役。
database
ファイルのノード情報、storage nodes の情報を保持するデータベース。
storage nodes
ファイルの実体を保持する HTTP サーバー。