ねこめしにっき(2004年12月)

2004年12月20日

RSSとトラフィックの問題 (2004/12/20 - 06:41)

RSSの利用方法は様々だが、「アンテナ」と同じ感覚で、更新を自動的にチェックさせて、常に最新の情報を読むという使い方が多いだろう。真っ当な RSSリーダーは、取得したRSSをキャッシュして日時を記録し、次回アクセスの際はサーバーのRSSファイルの更新時刻をチェックして、手元のキャッシュより新しい場合だけデータをとりだしていく。これならば普通のアンテナツールと同じで、トラフィックを無闇に増大させることはない(アクセスログが膨れあがるという別の問題はあるにしても)。

残念ながら一部の巡回ソフトは、この更新時刻チェックを行っていないようで、毎回RSSファイルを取得していく。しかも、人間のユーザーと違って律儀に定期的にいらっしゃるので、こうしたソフトはサーバーの負荷を高める。RSSに本文全体を埋め込んでいたりすると、帯域も馬鹿にならない。スクリプトによるページ埋め込み型RSS表示も、潜在的には同じ問題を持っている。この点に関する懸念は以前からあったが、それがいよいよ現実的になってきたというのがSlashdotスレッドの問題提起だ。

[ ちょっとしたメモ より ]

ここで言及されている普通のアンテナツールの一種である「さとみかん」も御多分に洩れず、ブログツール系サイトの捕捉先が増加の一方を辿っております。

ブログツール系の特徴はすなわち「狭義のブログ」の特徴として挙げられる、コメント機能とトラックバック機能を持っていること。言わずもがな。そんなブログツール系サイトは、コメントをひとつ受けるごと、ひとつトラックバックを受けるごと、ブログ最新ページの Last-Modified ヘッダの日時が変わる事多し。あるいは、 CGI 仕掛けであることに由来して、 Last-Modified ヘッダが送出されていないケースも多々。

コメントやトラバ受信による「更新」をも感知したいというニーズの存在は否定しないけど、漏れのアンテナ運営方針は「サイト運営者による有意な本文記事の更新・追加だけを感知したい」というもの。イヤなら他をあたってくださいね、という。てな具合に上記性質を持つブログツール系サイトは、漏れ的アンテナ運営方針との親和性がよろしくありません。以前から申しまくっている事ですが。

そんなブログ系サイトでは、RSS こそが「有意な本文の更新・追加とその日時を知る」用途のためにあるじゃないの?というのがワリと自然な流れ。ところが。その RSS 自体の Last-Modified ヘッダさえも、通常サイトやブログツール本体ページと同様に、信用が置けないことが多々ありまくり。ここでようやく、上記引用文と絡む話となる。

1. RSS の Last-Modified ヘッダがなんだかよくわからない謎の日時になっている。
頻出例は、 RSS ファイルにアクセスしたその瞬間の日時が Last-Modified というモノ。意味ねーよソレ!
2. そもそも Last-Modified ヘッダがついてない。
論外。
3. RSS の Last-Modified ヘッダまでも、コメント受信・トラバ受信の日時になっている。
3−1. RSS 内には、受信したコメントやトラバのデータは含まれてない
3-1-1. RSS それ自体の更新日時を示す <dc:date> は、最新記事が追加・更新された日時を示している
一体何がしたいの?
3-1-2. RSS それ自体の更新日時を示す <dc:date> も、コメントやトラバを受けた日時になっちゃっている
メタデータとして何かがオカシクありませんこと?
3−2. RSS 内には、受信したコメントやトラバのデータも含まれている
そんなもんは不要だと小一時間…。いや、まぁ、そういう方針で RSS を配信してるという断固たる主張ならば、致し方ないのか…。

ブログツール普及後ここ 2 年程度経た経験を振り返ってみる。初期から 1. あるいは 2. はよく散見された。1. は減少しつつあり、 RSS 出力まで CGI 仕掛けとなるケースも散見されるのと微妙に関係して 2. が微増ぎみ。でも今も昔も多くは 3-1. な気配。現状は 3-1-1 のほうが多いかな。 RSS 正味データを GET 取得し <dc:date> 内の日時データを解析すれば、「漏れの欲しい更新日時情報」を取得できるので、アンテナ運営的にはまだ助かっている。ただ、 Last-Modified に信用がおけず、 GET 取得で実データを解析せざるを得ない以上、この記事の主題である無用トラフィック氾濫問題の発生源のひとつがココ。

そして昨今明らかに増加傾向なのが、 3-1-2. と 3-2. あたり。かな。最近の RSS 業界は、メタデータとしてサマリーを伝達する RSS1.0 的用途よりも、とにかく何でもぶち込んで配信してしまえ系の RSS2.0 的な用途のほうがブログ界の趨勢ではとっくに優位となって久しい気分。そんなブログ界が即物的に生み出した RSS Auto Discovery が <link rel="meta"...> ではなく <link rel="alternate"...> のほうを探索対象にしてるのが端的。あ、 RSS1.0 であっても content:encoded とかで記事全文を丸々ブチ込んでる系は 2.0 的だとおもう。

というように、Last-Modified の信頼性が低いゆえに GET 取得が増え、 RSS に記事全文がまるまる含まれている事で GET 時のトラフィックが増え、さらにコメントやトラバのデータまでも含まれる傾向でさらに増え、記事更新よりはるかに頻度の高いコメント・トラバ受信でも「更新」とみなす事でますます増える、と。

「さとみかん」で、RSS を更新日時調査の対象にする際は、もう始めから GET 取得を前提にしてます。当然ネットワークに優しくないんだけど、その調査対象 RSS の Last-Modified が果たして漏れ的アンテナ運用観点において、信用おけるものなのかどうなのか、そのサイトがアンテナ捕捉後にコメントなりトラバなりを受信した直後の Last-Modified をこの目で見ないことには不明なわけで、そして、そんな事はとてもやってられない。

そもそも、RSS は「本文記事が更新・追加された日時のみを知りたい」というニーズを満たすモノじゃ無いという話もあるかも。そういうニーズを満たすように、別個の RSS あるいは別個の類似データを用意する等の「運用」が考えられるけど、機械仕掛けで全自動処理を目指したはずのメタデータの類において、結局「運用」なる人的・恣意的なもので何とかせにゃいかん雰囲気が漂うあたり、なんかアレゲな気分がする。

微妙に気づけないこと (2004/12/20 - 04:20)

この「指向性メモ」を書いているのは石川雄大で、このサイトは「第3開発室」です。「Arielworks.net」は微妙に違うサイトですし、私はArielworksではありません。

微妙に向うとは世界が違うのです。混同したところで特に問題があるわけでは有りませんが。

[ 指向性メモ より ]

ネット自意識過剰系の漏れとしては、ああこれは「さとみかん」への指摘なんだろうなぁとすぐ思ったわけです。すでに修正しております。失礼しますた。

アンテナでどこかのサイトの捕捉を始めるときは、いつもそのサイトのプロフィールページを探して彷徨うわけですが、なかなか見つからない事も多くて。プロフィールページっぽいのを見つけても、「このサイトは XHTML1.1 で CSS2 で云々」とかの信者系能書きで埋め尽くされながら、肝心の製作者プロフィールの記述が忘れ去られているとかも!(笑)。いや笑い事じゃなくって、ホントにそういう事もチラホラあるんですよ。これを読んだ信者系のキミも一度プロフィールページを点検してみよう!…あ、とかいってる漏れ本人がいきなりやばげ。わらい。

で、捕捉先を増やすときは、大概まとまった数を増やすので、サイトプロフィールとか能書きなどなどは、申し訳ありませんが完全に読み飛ばしモードです。熟読は後日気が向いたときでいいとか思うし、ともかく今は目先の作業を完遂せねばなりません。寝る時間が迫っているから! (謎)

「指向性メモ」 (当時は単に "memo" だった記憶) の場合も、そのようにプロフィールページを探して上位階層でズンドコ上がっていき、見つけたのが「サイト案内」。そこにある通りを sites.lirs (アンテナ捕捉先設定ファイル) に記述してご満悦してました。つまり「サイト案内」の存在には気づいてませんでした。いや、気づいてたかもしれないけど、「微妙に世界が違う」という話も含め、見分けがつかなかった。ゆえの混同で、申し訳無しまくり。

他、捕捉時から時間がたつと、サイト名称や製作者名 (ハンドル) などが変わったりするケースも頻出事象なのだけど、そういうのもあまり気づけず失礼してるケースも多い。どうしても気に障る際はひそり何気に仄めかすよりも、直メール恫喝とかのほうがオススメカモ。

ちうか、そもそも手書きでサイト名称やら何やらを書き写しているのがそもそもガンという説。サイト側提供の情報をよしなに反映すればそれでいいじゃないかという説は、セマンティック Web なんて単語を誰も叫んでなかった昔から、自然と沸き上がってきていたわけで。

「sites.lirs」にサイトのタイトルや管理者名を全く書かないと、リモート情報や対象サイトから抽出して自動的に補完します。 (略) 設定が面倒な場合、あるいはDI・LIRS・対象サイトから得た情報に依存したい場合などに有効です。

[ なつみかん:ドキュメント:リファレンス より ]

…という機能が一応「なつみかん」には備わっているのですが、これ、実はうまくいった試しが無くて。だからシコシコ手書き写しの刑。捕捉先サイト名称は <title> 要素から、製作者名は <meta name="author" ...> あたりから引っ張ってくる実装だったと思う。しかし、今も昔も <title> 要素はアテにならんのですねコレが。「日記」だの「memo」だの「Weblog」だの、 Web グローバルレベルではユニーク性に乏しい名称が与えられている事は多々あるわけで、アンテナの一覧リスト上にて見分けが容易につくようなタイトルを、結局手動で (恣意的に) 付けざるを得ない罠。<meta name="author" ...> に至っては、往時も今時も、そのいまいち杜甫々的印象 (謎) の拭えないタグを使用している人はあんまり多くない。

サイト名称やら製作者名なんてのはまったくもってのメタデータなので、今時なら RSS とか FOAF あたりから引っ張ってくるべきですね。でも現状ではメタデータも結局は人的恣意性が強くて信頼性に欠けるという罠も。上記の非ユニークなサイト名称の問題がまさにそれというか、メタデータ云々以前の問題というか…。

RSSTIMES と feedmeter を導入してみたよ (2004/12/20 - 02:55)

RSSTIMES に至ってはおくればせながら系。いやー、置き場所に悩んでた。よくある三段組レイアウトなブロギだったら、こういうお遊びアイテムを置く場所に困らないというか、体のいいレイアウト埋め草用としてちょうどいいのですが (毒)。漏れもイマいヤングなブロギのフリをするために段組とかしよーかなー。こう、構造上なんの意味のない class="left" とか "right" とかのアタマの悪い div で囲いまくってー (毒)

あ、スクリプト ON かつ Gecko とか WinIE6 とか Safari あたりじゃないと出てきませんので、ヨロシコ。スクリプトによる動的生成方式にしておけば、気が変わったときの取り外しとかが超絶ラクなので、どうしても流される。

2004年12月19日

OSX10.3.7 ウプデータンで AFP のアホバグ解消 (2004/12/19 - 19:16)

OSX10.3.6 ウプデータンと AFP 続報」のさらに続報。とっくに旧聞ですが、AFP のファイル操作の際、 31 文字以上の長いファイル名が勝手に省略されちまうという例の OSX10.3.6 の糞バグ、 OSX10.3.7 アップデータで解消ですね。はぁよかった…。これであんしんして AFP 越しのシンクロバックアップができるー。

バグ発生時も AFP でなく SMB で、そう、 OSX 同志なのになにが悲しいのか SMB で(笑)ファイルのやりとりをすれば OK という回避策もあった模様なれど、それじゃリソースフォーク付きファイルがシボンヌだし、ビミョ。

で、ソフトウェアアップデートに表示された 10.3.7 の能書きだけども。

10.3.7 アップデートにより、Mac OS X v10.3 "Panther" の機能強化と信頼性の改良が行われます。すべてのユーザの方にアップデートをお勧めします。

主な改良点:
  • 長い名前でファイルを保存するための AFP 対応の強化

(以下略)

なるほどポカ系のバグをバグとは言わずこっそり直して元通りにする事、イコール強化と。営業トークですねーすばらしいですねー。何かの参考になります!

Preferred Style Generator (2004/12/19 - 15:55)

略して PSG 。

ひとまず「ねこめしにっき」の各本文ページに導入してみますた。導入にあたり、以下の改造を施した次第で、メモっとく次第。

PSG.Event.addEvent()

addEventListener()attachEvent() も使えない場合に、仕方なく "onなんたら" プロパティにイベントハンドラを直接紐付ける処理をしている部分を丸々削除。DOM そこそこ実装済みかつ addEventListener()attachEvent() も使えないブラウザといえば、まず浮かぶのは MacIE5 ですね。

複数のスクリプトが同時に動作する場合、同じ要素ノードの同じ "on なんたら" プロパティへの登録がカチ合う可能性があり、最終的に上書き競争に勝ち残ったイベントハンドラだけしか動作しないというオチがありがち。もっともカチ合う可能性の高いのは、いわずもがなの window.onload

ある HTML ページ上で動作する複数スクリプトの全てをひとりで作成しているのであれば、このカチ合い問題もうまいこと回避できるけれども (運用レベルで重複を避けるとか、クロージャを使った独自のイベントリスナ登録用ラッパー関数を用意するとか) 、 PSG のような一般配布用途のスクリプトでこの問題を回避するのはちとキビシイですね。某「あれこれポップアップ」が MacIE5 で動作しない (というか動作可能にできない) のは、このイベントリスナ登録カチ合い問題がいちばん大きいかったり。

イベントリスナ登録問題がなんとかなったとしても、MacIE5 には PSG を正常動作させるための諸問題が他にも多々あるので、ともかく上記の部分を削除することにより MacIE5 での動作開始自体を回避してしまう、と。

「ねこめしにっき」的には、MacIE5 の場合は PSG.js 自体を読み込ませないようにしたので、別に問題ないといえば無いのですがが。 (で、 MacIE5 には以前から使ってた、クッキー記憶機能もなんもない拙作「超簡易的スタイル選択スクリプト」が依然として適用されてるオチ)

PSG を正常動作させるための MacIE5 諸問題
  • window.onerror = null とかしてても、「スクリプトエラーの警告を表示」に設定してる場合は容赦なくエラーダイアログが出たりして。
  • getAttribute() メソッドが実装されてないので、そこかしこでエラーが出て困っちゃう。
  • select 要素ノードへの option 要素ノードの追加は、標準 DOM 的な方法では正常にできません。「超簡易的スタイル選択スクリプト」にあるような方法じゃないとダメ。 Fxxk!
  • 他。 (以上までで MacIE5 でも正常稼働させようという画策に挫折したので、未確認。まだまだ道は遠そう。ていうかいまさら MacIE5 でも無いかと思われ。)

PSG.LinkSwitcher.createCheckBox(), PSG.StyleSheet.createComboBox()

この「ねこめしにっき」的には、 h1 の弟の ul のリスト項目として、各種コントロール (配布元の呼称では「セレクトボックス」) を配置したかった。けれどもオリジナルのままだと ul の直下にいきなり form 要素が生成されてしまい、 HTML 文法的に具合が悪かったので、なんとかした。具体的には、付与先要素ノードが ulol のときは、まず li 要素を生成してその中に form 以下のノードを生成するように変更。

…ていうか別に get も post もしない、完全にスクリプト処理で使うのみのチェックボックスやプルダウンメニューなんで、 form 要素中に置く必然がそもそも無い気がしてきた。

PSG.StyleSheet.createComboBox()

オリジナルではスタイル切り替えメニューの select 要素が dfn 要素の子要素として生成されてるけど、なぜここで dfn なのか HTML 文法的に意味不明なので、 dfn 要素をあぼーんした。

オリジナルではスタイル切り替えメニューの select 要素と対になっているはずの label 要素に、 for 属性がついてなかったので、つけた。

2004年12月7日

iPod ご購入ッ (2004/12/07 - 05:27)

そして池袋からの帰りにアキバで iPod 買っちまいますた! 20GB のやつ!

古き良き時代の国内家電メーカーのウォークマンとかだと、持ち運び用の袋がかならず付属してきたもんなのだけど、 iPod はそゆのなにもついてこなくてキビシー。あとやっぱり本体裏面のピカピカ部分は手垢がキビシー。電源ケーブルも兼ねてる付属の FireWire ケーブルが短くてキビシー。「プレイリスト」で選曲するとただ曲名だけズラズラ表示されるのみで、どれが何の曲なんだかサッパリわからないのがキビシー。いまさらの Chicago フォントはさすがに古っぽい印象を醸しまくりだろ!そしていくら iPod が巷にあふれているといっても、さすがに電車内で本体取り出してクルクル操作するのが気恥ずかしいのはなぜ…。

でもやっぱイイよ iPod!

どっきんロリポップ (2004/12/07 - 05:10)

池袋ジュンク堂書店での山名沢湖センセェサイン会の際に店内をブラブラしてたら、かの名作「どっきんロリポップ」の復刻版をなにげに発見!そして衝動買い!…って十数年前オンタイムで買った単行本全四冊もしっかり持っているというのにッ!そして上京引っ越しの際の熾烈な取捨選択競争に勝ち残って、いまもココにあるというのにッッ!てゆかこの復刻版自体、出版されてもう 2 年も経っているでわないかっっ!

ええと今さらのようにこの作品の概略。中学二年生の石川智子たん、瞬間移動の術を神さまから授かったはいいけど、どうしても衣服とは同時には移動できなくて、どうしてもアコガレの明博クンの目の前に全裸で現れちゃうのでさあ大変!運が悪いと彼の顔面に全裸でまたがっちゃったりとか、どういうわけか校舎屋上で全裸おしっこしてたら見られちゃったりとか、ある日なぜか校舎全体がプールになってて全校生徒は水着で授業うけるのだが新素材の紙で出来た水着が溶けだして女子生徒全員全裸でワッショイ!とかもうヤリタイ放題。そしてそこかしこにあからさまに混入している謎のヘヴィメタルネタ群。

往時の単行本表紙からも伝わってくるけど、絵もお話もわりかし少女漫画テイスト (あくまでテイスト)。そこがまた良いのだが。復刻版は下世話即物系の表紙に仕上がってて残念しきり。ただその即物的側面においては、オビの存在を考慮にいれて絵を絶妙に配置してる点が超ナイス。で、久々読み返すに、ああ、漏れの絵柄のルーツってここにあったのかしらん?全然意識してなかったけど。とか思った。

復刻版には描きおろしのリバイバル版 24p が収録されているんだけども、作画的にもお話的にもかなりビミョーだった。んー…。時は残酷ナリ。

2004年12月6日

山名沢湖センセェサイン会 (2004/12/06 - 12:02)

土曜日は池袋のジュンク堂書店にて開催された、山名沢湖センセェのサイン会にいってみた。

行ってみたというか、妻たんがセンセェのお知り合いなので、その関係上、冷やかしというか何というか。妻たんはそもそもからセンセェのファンなので、フツーのいち読者ファンのようにサインなど頂いていたのだが、そのやりとりが妙によそよそしくてワロタ。

サインしてもらうべく並んでいたのはことごとく男子だった。コミティア系の。ふーむむ。

記念にポップなど撮ってみたが、店内は撮影禁止だったかもしらん。まぁいいや。

もえたん 2 の「広報キット」の PDF (2004/12/06 - 01:48)

ダウンロード配布中の「広報キット」、同梱の PDF を何となしにイラレで開いたら、編集可能な PDF だったという事に今さらのように気づいてみた。これ、もちろん故意ですね?

さっそく要らない文字等を消去し、明度を下げ、お好みの解像度で出力し、壁紙用画像に。再利用可能データマンセー。ああ、もちろん再配布などという野暮はしませんよ。

2004年12月5日

東京都水道局うぜぇ (2004/12/05 - 23:35)

東京都水道局「安全でおいしい水プロジェクト」とやらをやっているようだが、マトモな味の水道水がフツーに供給されてる田舎に生まれ育った漏れらにとって、我が家の水道水はとても飲めるレベルに無いゲゲボ味…というか生命の危険すら感じるレベルなのでありまして、飲料水は完全に近所のサミットストア美し水サービスに依存しております。まさしく我が家の井戸サミットストア。妻たんはお買い物のついでに、 さながらアフリカの水汲み女よろしく 4 リットルもの水を毎回運んで帰ってくるわけですよ。いや、数十キロも離れてるとかアタマに水鉢を乗っけてるとかはしませんよ?

んで、先週月曜、その貴重な飲料水が底を尽きそうになり、いつものようにサミットへ水汲みに行った妻たん、しょぼくれて帰ってきた。いわく、水道局が何とかかんとかで検査中とかで水汲めなかった…って水道局め!自分らは飲める水を供給できてないくせに、飲める水の井戸汲みまでも妨害すんのかコノヤロ!と憤ってみたりするテスト。まぁその検査とやらはその日のうちに終わったらしく、次の日には水汲めたので、漏れらの生命の安全はかろうじて保たれたわけですが。

そういえば各種公共料金の引き落とし、引っ越し時のゴタゴタのまま、東京三菱銀行の名古屋市内の支店の口座から引き落とす設定にしてしまってるんだけど、水道局だけが首都圏にない口座からは引き落とせませんとかゴタクを並べて受理しなかった。うぜぇ。まったくもってうぜぇ。非論理的で感情論かもしれんけど、うぜぇもんはうぜぇのです。

あと関係ないけどサミットストアのサイトもヒドイね。フル FLASH の「もぐらたたき系」サイト。今日日お部屋の中に各ページにつながるボタンがあります!探してみてくださいね!だって。だれが探すかそんなもん。


Copyright © 1998-2006 ALIMIKA SATOMI/NYAN-NYAN-HANTEN.