2015-01-01から1年間の記事一覧
概要 Wikipediaデータを利用して面白いことをできないか考え中な今日このごろ. そこで今回はWikipediaの編集履歴をリアルタイムで取得できたら世の中のはやりがわかるのではと考えた. ここではリアルタイムにWikipediaの編集履歴を取得する方法についてま…
概要 前回,Twitterデータ分析のため日付ごとのツイートのWordCountを計算した.twitterデータを分析してみた その2(Word Count編) - 技術メモ(仮) fuji-151a.hatenablog.comしかし,各日付の上位10件の単語が同じであり特徴がでない結果に終わった. そこで…
概要 モチベーションなどは前回の記事を参照してくださいtwitterデータを分析してみた その1(Tweet数編) - 技術メモ(仮) fuji-151a.hatenablog.com を参照
概要 昨年の秋(2014年10月)からtwitterのPublic Stream APIを用いて全量の1%のTweetを収集している.Public streams | Twitter Developersdev.twitter.com しかし,ずっと貯めているだけで何も触っていなかったのでちょっとだけこのデータを利用しようと思う…
1年前にApache Kafkaについてざっくり紹介したことがあったが, システム図が0.7系のままになっていたので今回ちょっと修正して 再度Kafkaについて書いてみる.