ほろ酔い開発日誌

Web開発、機械学習を中心とした技術を発信するブログです。Web開発はサーバー・インフラ周り、機械学習は特にComputer Visioin系が好きです。ただし、記事の内容はそういった内容に限定はせず、ビジネス的考察や技術外のエンジニア周りの話題等を含みます。

2016-05-01から1日間の記事一覧

Ruby HTMLとXMLをスクレイピング

HTMLとXMLをRubyのgem「Mechanize」を使ってスクレイピングを行う手法を簡単にまとめておきます。 まず、 gem 'mechanize' これでgemの準備done。 HTMLスクレイピング agent = Mechanize.new page = agent.get("http://hoge.com") # スクレイピングしたいペ…