証券会社ランキング

みんかぶくん
総合1位
発表!!

Raguelさんのブログ

最新一覧へ

GraniでRSS非対応サイトの更新通知を得る

136604929 


先日、RSS非対応サイトのRSSフィードを取得する方法を紹介したところ、コージー様から素晴らしい対応方法をご教示いただきました。
コメントのままでは情報が埋没しかねないので、その方法をコラムにして残しておくことにします。

コージー様の方法を簡単に言えば、RSSリーダーにHeadline-Readerを使用する、ということです。
Headline-Readerには、RSSに対応しないホームページの更新通知を行う「HTML抽出機能」というものがあるらしい。
早速ぐぐってみたところ、これは「ホームページの新着情報一覧ページなどから追加された文字列リンクを抽出することによりRSSに対応しないホームページの更新検知を可能とする」機能との解説がありました。詳細は以下のリンク先の説明を読んでください。
Fenrir & Co. RSSに対応しないホームページの更新を知ることができる
Headline-Reader Plugin RC2 と Grani1.2 を公開

技術的なことは良く判りませんが、説明文を読む限りではRSSフィードを生成して受け取るという方式ではないようです。ただ、重要なのはRSS非対応サイトの更新を知ることなので、実現方法は大した問題ではありませんね。

ここで気になるのは、この超絶便利機能Headline-Readerを実装するRSSリーダー/ブラウザの種類。私が調べた限りでは、Headline-Reader(有料版)、Sleipnirのプラグイン、そしてGraniの3種類のようです。
残念ながら、無料版のHeadline-Reader-Liteには当機能はないようでした。ダウンロードしてざっと使ってみただけなので間違っているかも知れませんが。

で、この3種類の中でも特にイチオシなのは、ブラウザソフトのGrani。
その理由は、Headline-Reader機能を実装している上に、単なるブラウザとして見ても、非常に軽量かつ高速だからです。
インターネット高段者?ならばSleipnir+プラグインの選択肢が良いのかも知れませんが、私のようにRSS初心者には高機能すぎてあまりお勧めできません。

Graniを起動してHeadline-Readerのパネルを開くと、下のイメージ図のように3ペイン構成になります。

左側の部分がHeadline-Readerパネル、上段がフィードの明細で、下段がブラウザです。

GraniでHTML抽出機能を利用する手順は、
1.RSS非対応サイトのURLをコピーしておく
2.Headline-Readerパネル部分で右クリック
3.「フィードの追加」を選択
4.コピーしたURLを指定
5.HTML抽出機能のチェックボックスをオンにする

これだけ。
上記イメージ図でフィード明細部分に表示されているのが、HTML抽出機能を使って表示した日経ネットの(擬似)フィードの明細です。擬似フィードといっても、見た目はRSSフィードを受け取っているのとなんら違いはないのがお判り頂けると思います。

ちなみに、フィードを受け取る間隔は標準で30分。最低は15分で、自由に設定変更可能です。
ただ、必ずしもこのタイミングで確実にフィードを受け取れるわけではないらしい。
というのは、ブルームバーグ(正確にはinfoseekマネー)のフィード設定を15分にしていて、その間に元サイトにニュースがアップされているにもかかわらず、フィードが入ってこないという現象が起きているからです。今のところ、だいたい30分〜1時間遅れといった感じでしょうか。
この原因は今のところ不明。もしわかる方がいましたら、教えてください。

最後に、HTML抽出機能を利用する上で重要な機能となるフィルタリング機能について補足しておきましょう。これは、コージー様の説明が判りやすいので、そのまま引用させて頂きます。

-------------------------------------------------------------------
Headline-Readerにはフィルタリング機能があり、不要なリンク先を除外したり、必要なリンク先のみ抽出できます。
http://www.infomaker.jp/headline/extract.htm
http://www.infomaker.jp/headline/tree.htm#keyword

例えば、日経ヴェリタスのサイトですが
http://veritas.nikkei.co.jp/scramble/index.aspx
記事以外の不要なリンク先まで読み込んでしまうことがあります。そこで記事のリンクを見ると必ず「日付」があることがわかります。したがってフィルタ文字を「*/*/*」と指定することにより、必要記事のリンク先だけ、読み取ることができます。

他にも例えば、ドリームバイザーはNSJ日本証券新聞に動画を配信していまが
http://www.nsjournal.jp/index.php
これもフィルタ文字を「*月*日(*)」と指定することにより、ドリームバイザーの動画のリンク先のみ抽出することができます。

また、タイトルだけではなく、カテゴリーでも抽出することができきます。

例えばFC2は新着記事のRSSフィードを配信していますが
http://blog.fc2.com/newentry.rdf
これもフィルタ文字に「株式・投資・マネー」と指定することにより、株式・投資・マネーのジャンルの記事のみ読み取ることができます。

このようにHeadline-ReaderでRSS非対応サイトを読むことができ、さらにフィルタリング機能により必要なリンク先のみ抽出することができますが、範囲指定をしなければならないページはgooフィードメーカーを使ったほうが便利です。

例えば楽天ブログに「株式投資でお小遣いを増やそう」というテーマがあります。
http://plaza.rakuten.co.jp/thm/42093/g1200/
このページの右側には新着テーマの不要なリンクがあり、左側の必要な部分のみをHeadline-Readerで指定することは不可能です。このような範囲指定が必要なページはgooフィードメーカーを使用することにより解決します。

http://money.www.infoseek.co.jp/MnJbn/jbnindex/?pubid=10

-------------------------------------------------------------------

フィルタリング機能は、条件に合致する記事のみ読み取ります。これは、逆に言えば正確に条件を指定しないと一切フィードを受け取れなくなるという意味であり、注意する必要があります。
(これで私は失敗しました^^;)
ちなみに、上のイメージ図に示した日経ネットのフィードではフィルタリング機能は使っていません。使わなくてもそれほど問題にならない場合もあるので、まずは無指定から始めるのが良いのでしょう。

長々と書きましたが、言いたいことは「GraniのHTML抽出機能」はとにかく凄いということ。

そして、なんといってもGraniは速い。
クソ重たい当ブログも、結構早く読み込んでくれます^^;
IE7では動作しないチャートだけの更新機能もしっかり動いてくれますし。

「株で悩んだら見るブログ」を読むときにも、Graniは絶対オススメです!

Graniをダウンロードする方はこちら

クリックして頂けると励みになりますm(_ _)m
FC2 Blog Ranking[株式・投資]

  • 関連銘柄:

    ---
  • 通貨ペア:

  • 経済指標:

  • コモディティ:

  • CFD:

  • タグ:

    ---
登録日時:2008/03/29(15:59)

通報する

コメントを書く

コメントを投稿するには、ログイン(無料会員登録)が必要です。
みんかぶアカデミー

Raguelさんのブログ
トムソン・ロイター 金融マーケット情報配信サービス
個人投資家の予想
最新24時間の予想傾向(%)
買い優勢
+7.5%(前日比)

予想投稿数 比率(%)

74.3 25.7
買い予想数上昇(最新48時間)
売り予想数上昇(最新48時間)
個人投資家の予想(新着順)
マーケットサマリー
今日の市況
期間|日中3ヶ月6ヶ月1年3年5年
日経平均株価

18,274.99

▼ -151.09

TOPIX

1,466.96

▼ -11.02

JASDAQ総合指数

118.47

▼ -0.45

米ドル/円

113.78

▲ +0.64

ユーロ/円

122.44

▲ +2.55

重要な経済指標 発表日時
ヤフーファイナンスお勧め
中国株投資情報
香港上海など株式最新情報
マーケット概況
東京市場、今日の状況は?
株予報
決算予定や業績をチェック
みんかぶピックアップ

ネット証券比較

証券口座選びを完全サポート
総合ランキング1位はこちら!
みんためスタッフが独自調査で
おすすめのFX会社を紹介!
おすすめのクレジットカードを
ピックアップしてご紹介!

ページTOPへ