Spidering hacks―ウェブ情報ラクラク取得テクニック101選
2005年4月30日 コンピュータ
スパイダとはウェブを横断して、情報を収集してくるプログラムのこと。Googlebot.Scooter、MSNbotなどのUser-Agent名がログに記録されていればそれがスパイダであり、検索ロボット(bot)だ。スクレーパ(scraper)と呼ぶこともあり、ごっそり情報を取り出すのがスパイダでそれより狭い範囲の情報をとるのがスクレーパという感じらしい。で、スパイダリングとは、ウェブ上にある情報の入手、選別を自動化する処理とうことになる。このHacksシリーズ(http://hacks.oreilly.com/)はなかなか興味をそそるタイトルが並んでいて、コンピュータ関連の本ではいま一番面白いかな?
この本のURLは以下。
http://www.oreilly.com/catalog/spiderhks/
http://www.oreilly.co.jp/books/4873111870/
ISBN:4873111870 単行本 村上 雅章 オライリー・ジャパン 2004/05 ¥3,675
この本のURLは以下。
http://www.oreilly.com/catalog/spiderhks/
http://www.oreilly.co.jp/books/4873111870/
ISBN:4873111870 単行本 村上 雅章 オライリー・ジャパン 2004/05 ¥3,675
コメント