ほろ酔い開発日誌

Web開発、機械学習を中心とした技術を発信するブログです。Web開発はサーバー・インフラ周り、機械学習は特にComputer Visioin系が好きです。ただし、記事の内容はそういった内容に限定はせず、ビジネス的考察や技術外のエンジニア周りの話題等を含みます。

Rails RedisでPVランキングを作ってみた

記事のPV数ランキングを実装したかったので、Redisを利用して実装してみたいと思います。 ちなみに、Redisを使うに至った経緯は、 MySQLにPVテーブルを持たせると負荷上がりそうだから避けたい。 とはいっても簡単にランキング機能を実装したい。 じゃあ、Go…

Ruby HTMLとXMLをスクレイピング

HTMLとXMLをRubyのgem「Mechanize」を使ってスクレイピングを行う手法を簡単にまとめておきます。 まず、 gem 'mechanize' これでgemの準備done。 HTMLスクレイピング agent = Mechanize.new page = agent.get("http://hoge.com") # スクレイピングしたいペ…

Ruby URL文字列を扱う方法

最近スクレイピングでURLを取得してきたのですが、絶対パスになっていたり相対パスになっていたり統一感がなくて困ったのでちょっとURLを変更してみようと思います。 相対パスを絶対パスに変える news_path = "http://hoge.com/news/" entry_path = "/entry/…