プログラム
概要 Wikipediaデータを利用して面白いことをできないか考え中な今日このごろ. そこで今回はWikipediaの編集履歴をリアルタイムで取得できたら世の中のはやりがわかるのではと考えた. ここではリアルタイムにWikipediaの編集履歴を取得する方法についてま…
概要 前回,Twitterデータ分析のため日付ごとのツイートのWordCountを計算した.twitterデータを分析してみた その2(Word Count編) - 技術メモ(仮) fuji-151a.hatenablog.comしかし,各日付の上位10件の単語が同じであり特徴がでない結果に終わった. そこで…
概要 モチベーションなどは前回の記事を参照してくださいtwitterデータを分析してみた その1(Tweet数編) - 技術メモ(仮) fuji-151a.hatenablog.com を参照
最近パーフェクトRubyという本を買った. 色んな人やブログからこのパーフェクトシリーズと言うのは好評である. 他にもJavaScriptやJava,C#にPython,PHPなどが存在する. 今回はこのパーフェクトRubyで僕が知らなかったことを簡単にまとめる. 知っている…
前回はJavaでMeCabを動かせるようにした. それを用いてTFを算出しようかな考えた. しかし,そもそもTFってなに?から始まると思う. 主にtf-idf法で用いられる.特徴語を算出する方法. 今回はこのtf値とidf値.すなわちtf-idf法について説明したいと思う.
コンパイルっていう単語とビルドっていう単語は何が違うのか? ていうか今までそれがわからないまま生きてきた自分が恥ずかしい... 今回両者の違いを調べてみた.