banner
ximalaya

ximalaya

这里是openkava 的blog,关注程序开发的一切技术。 ZZ 表示转载的文章,如涉及版权,请和我联系删除。 在这里你可以看到关于以下技术的文章: 移动开发技术,ANDROID ,IOS,WINDOWS PHONE平台开发,企业ERP开发,动态脚本PYTHON ,OPENGL ES 3D技术,游戏开发技术,HTML5 ,JAVASCRIPT ,MYSQL,AMAZON EC2 ,GOOGLE GAE ,GOOGLE CLOUD SQL 等 。 本站发展历程: 2010年,正式把所有的blog移到这里,租用godaddy的空间,记录生活和工作上的一些心得。 下面是关于我的个人介绍,写在这里权当凑字数啦。 职业:软件开发,开发经验6年,管理经验3年; 工作上使用的技术:C#, SQL SERVER 个人使用的技术:PYTHON,PHP, CSS, JAVA ,ANDROID ,object-c 等等 联系我请发邮件:<a href="http://blog.openkava.com/openkava@gmail.png"><img class="alignnone size-full wp-image-96" title="邮箱" src="http://blog.openkava.com/openkava@gmail.png" alt="" width="174" height="24" /></a>

rubyを使用してnokogiriを使ってウェブページを取得します。

Nokogiri という gem は本当に便利で、spidr と組み合わせるとウェブページや画像を簡単にスクレイピングできます。

spidr は Nokogiri を使用します。

したがって、柔軟に操作するためにはやはり Nokogiri を使用する必要があります。

 

require 'net/http'
require "open-uri"
require 'nokogiri'

weburl='http://slide.eladies.sina.com.cn/fa/slide_3_22147_9430.html#p=17'
doc = Nokogiri::HTML.parse(open(weburl), nil, 'gb2312') #このように書かないと文字化けする
doc.css('dl dd').each do |link|

puts link.content

rescue
puts 'error'
end

学習リソース:

http://ruby.bastardsbook.com/chapters/html-parsing/

 

 

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。