この日記はMozillaのプロダクトへの貢献者としての私の成果を中心に、気になったバグやWeb界隈の話題について書いていますが、 断り書きがある場合を除き、いかなる団体のオフィシャルな見解ではありません。あくまでも個人的なものです。 Mozilla Foundation、Mozilla Corporation、及び関連企業の公式情報ではないことに注意してください。

現在、XHTML 1.0 (もどき)から、HTML5なコンテンツに修正中です。古い日記は修正が完了していませんので表示が崩れます。 順次、修正していく予定ですのでしばらくお待ちください。

もずはっく日記(2006年6月)

2006年6月9日

RSS配信と引用
初回投稿日時: 2006年06月09日04時08分36秒
最終更新日時: 2006年06月10日00時44分16秒
カテゴリ: HTML XHTML XML
SNS: (list)

少し前からもずはっく日記もRSSでコンテンツの一部も配信するようになったわけですが、この機能追加を行っている時に感じたいくつかの引用に関する問題点。

転載と引用の境界線として、本文と混じらず、引用部分であることが明確であることと、引用元の明示していなければいけない、というのがあります。これらを満たしていないと引用とは認められない訳ですが、HTMLの場合、blockquote要素とそのcite属性を使うことで引用元を明示することができます。(多くのUAはcite属性をレンダリングはしませんが、それはUAの問題であって、コンテンツ作者には責任の無い問題だと思います。意図的に筆者の言葉として誤認させるような構成になってるとまずいでしょうけど。)

RSSで内容を配信するには二つの方法があります。一つはタグを削除してプレーンテキストを配信する方法と、CDATAを利用してタグもテキストの一部として配信してしまう方法です。

ここで、前者の方法をとると、blockquote要素のcite属性が削除されてしまうので、どこからどこまでが引用か不明瞭になる上に、引用元の明示ができずに、条件が満たせず、確実に著作権違反となると思います。本文で引用元を明記していれば問題無いでしょうが、そうではない文章がRSS内にひとつでもあるとアウトでしょう。

で、問題は後者。CDATAでHTMLの断片を入れることで、blockquote要素という情報は残ります。cite属性値にはURIがそのまま残るので、引用元を明示できていると言えるかもしれません。しかし、引用している、また、その引用元であるという意味は、(X)HTMLのblockquote要素と、cite属性が持つものであって、XMLでは当然成り立ちません。CDATAで含まれているソースコードの断片がHTML文書であるということを立証しない限り、引用であると明示できているとは言えない可能性があるわけです。問題のタグがHTMLのものであると立証するには、CDATA内でひとつのHTML文書として、(文書型宣言から始まって)完結していなくてはいけないように思えます。

こういう理屈で考えていくと、文書型宣言の無い怪文書は引用の条件を満たそうとするとblockquote要素に頼らずに自然言語で明言するしかないのかもしれません。

つっこみメールを頂いたので補足。

これらを満たしていないと引用とは認められない訳ですがというあたりの下りですが、私があげた条件は、必要条件の一部であって、これを守れば十分、という訳ではないです。このトピックは必要条件すら満たせない可能性がある、という話でした。

関連するかもしれないエントリ

関連するかもしれないエントリを発見できませんでしたが、無いとは限りません。