2007.08.29

タギングの妙味は文脈性

イメージ:タギングの妙味は文脈性

一歩先のWeb標準 ♯5
ゆう(我的春秋)

バックナンバー

先月から体調を崩していましたが、みなさんはいかがお過ごしでしょうか? 残暑が厳しいですが、体調には気をつけたいところですよね。

さて、今月は気分転換にちょっと趣きを変えて、情報整理……より具体的にいえば、タギングの話をしようと思います。「Web標準」から少しはずれますが、情報と情報の関連づけは、Webを考える上でもとても重要なテーマです。

タグ(タギング)とは?

タグはカテゴリーとは少し違います。カテゴリーはツリー状に構造化・体系化されるのが一般的ですが、タグは原則として、ひとつひとつが独立した単独のラベルです。データモデルとして、これ以上ないくらいシンプルです。ツリー構造でもなければ、テーブルのような2次元構造でもありません。というか、そもそも構造ですらありません。

ところが、ここまでシンプルだと、かえって色々と考えさせられるものです。

  • 上位概念と下位概念という観念がない。タグを階層的に整理できない。
  • 多義語の区別ができない。
  • どういうタグをつけたらいいかわからない。

などなど。かくいう僕も、今でも試行錯誤の途上です。シンプルゆえに奥も深い。

※参考:ソーシャルブックマーク考2 タグの構造について(fladdict.net blog)ほか

コンテキストで使うのがタグ

タグのつけ方は、基本的に個人の自由に委ねられるものです。でも、あえてツボがあるとすれば、それは情報を、1つではなく、複数のタグの組み合わせで絞り込んでいくことを、最初から前提にしてしまうことだと思います。

たとえば月並みですが、ブラウザの Opera と歌劇の opera を区別したいとしましょう。ところが、僕が常用しているソーシャルブックマークサービスの del.icio.us は、アルファベットの大文字と小文字を区別しません。したがって、"Opera" と "opera" で区別させるという手段は使えません。

この場合、タグ語になんらかの prefix なり suffix なりをつけ加えて区別させることもできますが、あえてそういうことはせずに、両方とも "opera" と、同じタグをつけておきます。代わりに "opera" 以外のキーワードを必ずタギングするようにしましょう。

僕たちは日常、言葉を耳から聞いて意味を判断していますけど、ブラウザも歌劇も「オペラ」でまったく同じ発音です。では、どうやって、その違いを識別しているんでしょうか?おそらく、文脈の中で "opera" という言葉と一緒に出てくる、Web ブラウザや Webページと関連する用語や、歌劇やクラシック音楽と関連する用語から "opera" の意味を類推しているんじゃないでしょうか。

2285_01.jpg

それと一緒で、たとえば opera + CSS ならブラウザ、opera + Mozart なら歌劇といったような感じで、タギングにも、自然言語とまったく同じ原理を持ち込むことができます。いわば、タグの組み合わせというよりも、コンテキストで意味を特定するといったところでしょうか。

ついでにいえば、こうしておくことで、境界が曖昧な多義語の意味を、区別することも同一視しておくことも可能になります。

次ページでは、「適確な場所で、適確な情報を呼び出す」方法について取り上げます。

1 2 3

このエントリーをブックマークする

このエントリーにトラックバックする

このエントリーのトラックバックURL
http://withd.jp/mt/mt-tb.cgi/1780


株式会社ロボット|クリエイターインタビュー |イマジカデジタルスケープ共同募集