World-Wide Webの生みの親として知られるTim Berners-Leeが,次世代のWeb開発に取り組んでいる。「Semantic Web(意味を理解するWeb)」と呼ばれるプロジェクトだ。Semantic Webは文字通り,「コンピュータ(あるいは,それらが接続したネットワーク)が,人間の複雑で曖昧な真意を汲み取って,かゆいところに手が届くように,必要な情報やサービスを提供してくれる」というコンセプトである。

 例えば「どうも体調が悪い。でも病気なのか,ただの疲労なのか,原因はハッキリ分からない。そういえば2日前の昼飯,あれが悪かったかな。でもやっぱり飲み過ぎかなあ。ひょっとしてアレルギーかもしれない。いや待てよ,近くにある工場の排水も,昔から気になってるんだよな」などといったことを,次々とコンピュータに入力していく。

 すると,Semantic Webの方では「その症状ではアレルギーではないですね。ご心配の工場は,実は2年前から操業を停止してるので,これも原因ではなさそうですね。むしろ,あなたは消化器系に問題がありそうです。ご自宅の近くに消化器科がある病院がありますが,診断をご予約するなら,明日の3時が空いています」といったメッセージを返してくる。

 まあ現時点では夢のようなサービスだが,Berners-Leeがディレクタを務めるチーム(World Wide Web Consortium)などが,この実現を目指している。Berners-Leeが自らの論文の中で指摘しているように,Semantic Webのアイデアはいわゆる人工知能(AI)にかなり近い。両者の根本的な違いは,これまでのAIの場合,そうした知的な作業を,中央のコンピュータとソフトウエアに任せてしまうわけだが,Semantic Webではその作業を,ネットワーク全体に分散させて,「みんなで力を合わせて高度な情報処理を実現しましょう」と提案している点にある。

コンテンツやWebサイトに“意味情報”を付加,コンピュータに理解させる

 しかし,そんなことが可能なのだろうか? また,どの程度までそれを実現できるか? これは結局,そのやり方と,「ネットワークにつながった一般利用者(ここでは,むしろ「ホームページの作成者」あるいは「Webサイトの運営者」と言った方が適切かもしれない)が,どこまで協力してくれるか」にかかっている。

 Semantic Webの基本的なアイディアは,要するにコンテンツやサイトの作りを,「一般利用者が妥協できる範囲」で複雑にする点にある。例によってRDF(Resource Description Framework)だの,PICS (Platform for Internet Content Selection)だの,素人には理解し難い用語がたくさん出てくるのだが,これらを,ここでつぶさに説明しても仕方がないだろう。ちょっと感じをつかんでもらうために,一例として「RDF」だけ概略を紹介しておこう。

 RDFは,Semantic Webの世界で「知識を表現する」ために使われる。Webコンテンツを作成するために現在広く利用されているHTMLは,基本的には“文書の構造”を表現するためのものだ。これに対してRDFでは,対象となるリソース(一つひとつのコンテンツでもよいしWebサイト全体でもよい)の持つ“意味”や“情報”までも表現する。

 このように書くとXMLを思い起こす読者も多いと思うが,実際,RDFはXMLを基盤とした技術である。Semantic Webに関する文書を見ていくと,「RDFをXMLを使って表現する」といった表現に出会うことがある。

 冒頭の病院の例で言うと,今でもGoogleなどの検索エンジンを使って,結果としては「自宅近くの消化器科がある病院」や「その病院が明日の3時なら予約できる」といった情報にたどりつけるかもしれない。だが,文字列検索が基本の検索エンジンを使ってこの情報を得るためには,「このキーワードで検索しよう」「結果一覧からこの情報を選ぼう」「表示されたWebサイト内のこのページにアクセスしよう」といった人間の知能や操作を介在させる必要がある。

 コンピュータに文字列情報だけでなくRDFを使った意味情報を与えることができれば,インターネットのコンピュータを(例えば冒頭にあげた例のように)もっと人間のために有効に使えるようになるかもしれない。

コンテンツ作りが難しくなる度合いは「妥協できる範囲」で収まるのか

 こうかいつまんで書いてしまうと,「その程度でいいの?」という印象を抱く方もおられよう。それはすなわち「その程度のことで,そんなに高度な情報処理が実現できるの?」という疑問と,「その程度の苦労で済むなら,もう少しコンテンツ作成に手間をかけてもいいよ」という両方の気持ちである。実は,ここが最大のポイントである。つまり得られる効果と負荷のバランスの問題だ。

 初代のWorld-Wide WebはBerners-Leeに言わせると,自分でも感心するほどシンプルなルールに従って構築されていた。それ故に,どんどんホームページが蓄積されて,世界規模のサイバー・スペースへと成長することができた。しかし,あまりにもルールが簡単過ぎたため,逆に「情報のカオス」と非難されるような問題も生じたわけだ。こうした状態は,その基本デザインを考案した時点で,彼は予想していたという。

 ただ,それ以降のWebの発展を見ると,そうした欠点を「みんなで工夫して直す」という方向に進化してきた。例えばGoogleなど,最近の検索エンジンの能力アップは目覚しいものがあり,いまだに多少の努力は必要であるにせよ,我々の要求する情報が,かなり手際よく入手できるようになった。結局,ルールを簡略にしておけば,誰でも参加できる。参加者数が多くなると,中には賢い人や「やる気のある人」も多くなる。そういう人たちが工夫して,Webを良いものにしてきたのだ。

 Semantic Webでは,恐らくこの「簡単なルール」を,もうちょっと難しくしようとしている。今より,ほんの少しコンテンツを記述するレベルを上げるだけで,あとはネットワークの「規模の効果」によって,サイバー・スペースの性能が,一挙に異なる次元まで押し上げられると見ているのだ。

 しかし,気になるのは「一般利用者が,複雑さにおいて妥協できる範囲」を,Berners-Leeらが正確に読んでいるかどうかである。

 みんなで協力して「何か素晴らしいこと」を成し遂げるには,誰かがどこかで「嫌な仕事」や「骨の折れる作業」を引き受けなければならない。以前のAI研究者らは,こういう大変な作業をコンピュータやロボット,つまり,そこに搭載するソフトに「まとめてやらせようとした」わけだが,Semantic Webの考え方では「嫌なことは,広く薄く,みんなで分担してやりましょう」ということになる。

 その結果として当然,Webサイトやコンテンツの作り方は,今より少し難しくなる。しかし,インターネット上に分散した「数億人」の利用者が,少しづつ面倒なことを分かち合えば,その結果として「高度の人工知能が実現できる」とBerners-Leeは考えているのだ。

Webサービスに歩み寄り,普及を図る

 もちろん,こういう提案を受け入れるかどうかは,一般ユーザーの勝手である。今のところ米国のIT企業は,あまり関心を示していない。「Semantic Webのルールは複雑過ぎて,使う人は増えないだろう」と見ているのだ。

 そこで最近,World Wide Web Consortiumでは企業に向かって,Semantic Webのプロモーション活動を強化している。手始めは「Web Services(Webサービス)」への応用である。

 現在の米ソフトウエア業界が最も注目している技術の一つが,このWebサービスである。たとえば自動車メーカーの企画担当者なら,国内外の部品業者のWebサイト,需給状況から規制の現状まで,自動車事業に関係のあるWebサイトを横断的に検索して,必要なレポートがあっという間に作成できたら便利だろう。Webサービスは,このように複数のサイトを容易に連携させるための技術だ。また,検索処理だけでなく,受発注など,企業間にまたがる業務処理にも応用され始めている。

 ところが現在のWebで,これをやろうとすると,かなり難しい。異なる企業のWebサイトは,基本的にHTMLという同じ記述言語で書かれているが,そのデザインは会社によって違うし,データの表現や使い方も違う。異なるサイトを単に寄せ集めただけでは,正しく情報を加工できない。そこで,「Semantic Webを使えば,このWebサービスをごく自然な形で実現できる」という発想が出てくるわけだ。

 考えようによっては,WebサービスもSemantic Webも同じような方向を目指しているのである。ただ前者は,「異なるサイトの横断利用」に力点を置いており,後者は「そうした高度なサービスを実現するために,リソース(コンテンツやWebサイトなど)のデータ表現を改良する」というプロジェクトなのだ。違いはそこにあるが,両者は互いに助け合う形で,これからのWebを高度化して行くのではなかろうか。