|
必聴講座ご紹介 ビッグデータ EXPO 2012春 日本マイクロソフト ビッグデータ EXPO 2012春 NEC Cloud Days Osaka 2012 セールスフォース・ドットコム |
「Pragger」で一段上の情報収集に挑戦!
PraggerはRSSの情報を処理するソフトウエアです。近代的なBlogやCMS(コンテンツマネジメントシステム)を使っているサイトは、かなりの割合でRSS情報を出力しています。例えば、つくば市の市役所サイトもRSSで市内の情報を出力しています。もっとも、全サイトがRSSに対応しているわけではありません。普通のRSS処理ソフトでは、RSSを出していないサイトはお手上げになってしまいます。 そんなときに役立つのが、Praggerの入力プラグイン群です。RSS情報を取り込めるのはもちろん、RSSに対応していないサイトのデータも取り込めます。Praggerには、細かい機能がたくさんあり、それらを組み合わせると、面白いことがいろいろとできるようになっています。また、機能はプラグインという形でどんどん追加できます。私が作った機能以外にも、ネット上ではたくさんのプラグインが配られています。説明上、これらの機能を「入力」「加工」「出力」に分け、今回はPraggerの入力機能について書きいていきます。 仕組みを簡単に説明すると、情報を取りたいWebサイトをあらかじめPraggerに登録しておきます。するとPraggerが自動的にそのサイトにアクセスし、設定を元にRSSを生成して、サイトで作られたRSSと同じように取り込みます。RSSを出していない古い日記サイトの場合なら、Praggerがトップページの10件程度の日記を日付に分けて、10件の情報を含むRSSを作ります。そしてRSSリーダーが変更があったものだけを表示してくれます。 このPraggerの入力プラグインを使って、私はRSS対応サイトもRSSに対応していないサイトも、RSSリーダーで読んでいます。例えば、掲示板の情報やSkypeのダウンロード数を集計したページをRSSとして読んでいます。面白いところでは、DELL社のサーバーの価格を取得して、RSSにしてチェックしています。 このようにPraggerでさまざまな情報を扱えば、飛躍的に多くの情報を集められます。プラグインを書けば、コンピュータで扱えるデータはすべてPraggerで扱えます。また、Webデータの処理なら、プラグインを作らなくても簡単な設定を書くだけで、対応できます。あなたも、Praggerを使ってRSS対応していないサイトをRSSリーダーで読んでみませんか? 連載新着記事一覧へ >>
著者プロフィールSkypeまとめサイトSkypeやろうぜ」の管理人。プログラマの観点からSkypeを解説し,新しい使い方を提案している。Skypeの技術を解説した『入門 Skypeの仕組み』(日経BP社刊)の著者。筑波大学の学生で,4月からは大学院に進学。サークル活動をしたり,学生ベンチャー「ソフトイーサ」の副社長を務めたりとドタバタな大学生活を楽しんできた。この記事へのコメントはSkypeやろうぜ内のページでも受け付けています。また,このITproWatcherへの連載のきっかけとなった連載記事『Weekend Special』(2006年1月13日から毎週金曜日更新)のバックナンバーはこちらへどうぞ。 |