技術メモ(仮)

IT系の話や研究,他のことなど話して行けたらいいな~って感じです.ただいまJavaを学習中

2015-01-01から1年間の記事一覧

Wikipediaの編集履歴をリアルタイムで取得する方法(node.js編)

概要 Wikipediaデータを利用して面白いことをできないか考え中な今日このごろ. そこで今回はWikipediaの編集履歴をリアルタイムで取得できたら世の中のはやりがわかるのではと考えた. ここではリアルタイムにWikipediaの編集履歴を取得する方法についてま…

twitterデータを分析してみた その3(tf-idf法編)

概要 前回,Twitterデータ分析のため日付ごとのツイートのWordCountを計算した.twitterデータを分析してみた その2(Word Count編) - 技術メモ(仮) fuji-151a.hatenablog.comしかし,各日付の上位10件の単語が同じであり特徴がでない結果に終わった. そこで…

twitterデータを分析してみた その2(Word Count編)

概要 モチベーションなどは前回の記事を参照してくださいtwitterデータを分析してみた その1(Tweet数編) - 技術メモ(仮) fuji-151a.hatenablog.com を参照

twitterデータを分析してみた その1(Tweet数編)

概要 昨年の秋(2014年10月)からtwitterのPublic Stream APIを用いて全量の1%のTweetを収集している.Public streams | Twitter Developersdev.twitter.com しかし,ずっと貯めているだけで何も触っていなかったのでちょっとだけこのデータを利用しようと思う…

Apache Kafkaについて(0.8系)

1年前にApache Kafkaについてざっくり紹介したことがあったが, システム図が0.7系のままになっていたので今回ちょっと修正して 再度Kafkaについて書いてみる.