CSSとHTMLとBLOGとセマンティックWeb(2)

さて、前置きが長くなりましたがbewaadさんのエントリより。
strictなマークアップとCSSによるレイアウトというのは、究極的にはセマンティック・ウェブを目指したものだとwebmasterは思います。
そうかもしれません。世の中のウェブページがstrictなHTMLを経て、やがて全てXHTMLになると、解析プログラムを作るほうも楽チンになっていろいろリッチなことが出来そうです。

セマンティックWebについて


セマンティックWebっていうステキな世界を思い描いているバーナースおじさんという人がいる。今ではずいぶんたくさんの人がセマンティックしたくてセマンティックなセマンティッカーにセマンティッキング中だ。

彼らの不満はとにかく一点、
Web上にはすごくたくさんの情報があるはずなのに、なぜ自分に必要な情報を必要なときに簡単に探し出して使えないんだっ
ってこと。

で、セマンティックWebな世界になると、すべての情報には、目立たないように「これは○○に関する情報ですよ」て書いてあって、たとえ○○という単語そのものが含まれていなくても検索でひっかけることが出来るようになる。

たとえば今の検索技術だと「山田」町に住んでる「国士舘」さんが書いた「東京大学」というタイトルのブログはものすごく探しにくいけど、セマンティックWebな世界では、
<author>
<name>国士舘</name>
<region>山田</region>
</author>
<title>東京大学</title>
とかっていう「意味構造」が文書のどこかに書いてあって、コンピューターが上手に扱ってくれて、国士舘大学とか、山田まりやとかは検索にヒットしないようにしてくれる。

そいうのがどんどん広がっていって、やがては「熱海で2食付き12000~18000円で料理自慢の宿」みたいな情報を、じゃらんや楽天でなく、あちこちに好き勝手に散らばったWebページの中からGoogleでリストアップできちゃったりするかもしれない。
もしかしたら、宿が用意したサイトだけじゃなく、泊り客が感想を書いたブログとかまでリストにできるようになるかもしれない。

閑話休題。再びbewaadさんより。
namespaceとしてURIを活用することから勝手に妄想するなら、namespace URIで指定されるページにおいては、スキーマ言語によりセマンティック情報も記述し、xml文書においてどのような要素名が付されていようとも、同様の意味づけがなされている要素を共通項でくくり出すことによりセマンティック・ウェブが可能となります
オントロジーと呼ばれるやつですね。まさにそのそういう仕組み(の、もうちょっと複雑なやつ)を一生懸命考えていらっしゃる方がたくさんいるようなので、期待しないで待つことにしましょう。

なぜ期待しないかというと、セマンティックWebの完全形は企業ページから個人の日記まで、みーんなみーんな細かくタグづけられたXMLになることなのですが、bewaadさんが
でも、少なくともwebmasterにとっては、そんな面倒は願い下げです。
とおっしゃるように、企業や事業主は検索に引っかかれば儲かるから頑張るでしょうが、そんな面倒なことをする個人なんてマニヤの人だけだからです。

ステキな世界を実現するためには、表現欲を満たしたがっている、良いコンテンツを持った個人が大量に食いつく仕組みを用意しなければならないのです。

セマンティックWebの完全な形は難しいですが、一部ならば、いい線行きそうです。
blogの普及という思わぬ現象から、セマンティック・ウェブの理念は一部実現しているのではないか、というのがwebmasterの仮説です。
とおっしゃるとおりblogツールのおかげです。

サイトの更新情報(タイトル、日付、概要)のメタデータは、RSSなりATOMなりの構文が整備されたのですでに実現されて検索にも利用されつつあります。

今のところはまだ、blogのページ上にたくさんあるリンクのうちどれがトラックバック(話題の共通)なのか、最近のエントリ(ナビゲーション)なのか、機械にわかるようには区別されていませんが、そういう「リンクの意味」についてのメタデータ構文が標準化された後は、各ツールの提供者が中身をゴニョゴニョいじるだけで全てのページが「意味のあるリンク」をふんだんに持つことになるでしょう。

今のところはまだ、その記事が何について書かれたものかを示すのは「カテゴリ」しかありませんが、文書の話題についてのメタデータ構文が整備された後はすぐにでもblogのバックエンドで利用されるでしょう。そのうち、テキストマイニングを利用してもっと細分化された属性を自動的につけてくれるような仕組みなんかもでてくるかもしれません。

そして、
テキストエリアにデータを放り込めばページができて、レイアウトもお手軽にいじることができる
というのは、表現欲を満たしたい、良いコンテンツを持った個人に対する格好の餌であり続けるでしょう。

最もとんがったセマンティック推進派の理想からは程遠いけれど、とりあえずはそれっぽい世界というのは意外と早く来るかもしれません。

関連エントリー
CSSとHTMLとBLOGとセマンティックWeb(1)
CSSとHTMLとBLOGとセマンティックWeb(3)
「パソコンできる」ヒトの悲哀
いろんな得意技
[PR]
by tockri | 2005-04-11 20:12 | ├ コンピュータ
移転しました。
by tockri
S M T W T F S
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
最新のトラックバック
[media][gove..
from bewaad institu..
甘やかされた男たち
from とっくりばー
~が下手
from たのしい検索・ゆかいな検索
例えバトン
from ひまわりてんびんへの道
例えバトン
from 明日は明日のホラを吹く-To..
リンク
ライセンス

クリエイティブ・コモンズ・ライセンス

このブログのテキストおよび画像は、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。




検索
ファン
ブログジャンル
画像一覧