第 257 回 PTT のお知らせ


日時: 2000年 2月23日(水) 18:30 から
場所: 東京農工大学 工学部 情報コミュニケーション工学科 7号棟 1階 1E 室
      中央線 東小金井駅 南口から,西へ向かって,徒歩8分程度です.
      農工大の東門に建物の配置図があります. WWWを見られる方は,
      http://www.namikilab.tuat.ac.jp/Guide/tuat_position.html
      に案内図があります.

話者: 澤田 圭 (農工大・電子情報工学専攻・情報工学斎藤研M2)
題目: WWW検索のためのハイパーテキスト情報の可視化
概要:
 本研究では,WWWから目的のHTMLドキュメントを探す際のユーザの 手間と時間を削減するために,ハイパーテキスト情報の可視化を試み る.既存の検索エンジンでは,キーワードを指定することで,関連す るドキュメントを検索できる.しかし,キーワードによっては検索数 が膨大になり,そこから真に必要なドキュメントを探し出すことが困 難となる.そこで,各ドキュメント中の,キーワード出現位置,タグ 情報,リンク情報などを,コンパクトに可視化する手法を提案する. HTMLドキュメント1行を数ピクセルに圧縮表示することで,一画面上 に100個以上のドキュメントの情報を提示できる.ユーザはこれを一目 見ることで,各HTMLドキュメントの特性を理解でき,更なる絞り込み を効率的に行うことが可能となる.可視化効果の検証のために,提案 の可視化手法と全文検索システムNamazuとを組み合わせて,WWW検索 支援のための実験システムを設計し実装した。その結果,ダウンロー ドやリンク集を探すなど,いくつかの種類の検索要求に対する有効性 が確認できた.
食事: ありません.東小金井駅近辺のモスバーガー,途中のピーコック (マクドナルドあり)などをご利用ください.
第257回 PTTメモ
出席者: 田渕邦夫,鈴木信吾,佐藤喬, 尾崎亮太,山内斉,岩村卓成, 山之内暢彦(電通大),長慎也(早大), 伊知地宏,倉部淳(富士ゼロックス), 斎藤隆文,並木美太郎,瀬川大勝,大野晋哉,兵頭博成(農工大), 折戸朗子(日本電信電話),和田英一(富士通研究所),岩崎英哉, 塩崎毅彦,丸山一貴,寺田実(東大)
概 要:
本研究の目的は、WWWから目的のHTMLドキュメントを探す際のユーザの手間と時間を 大幅に削減するために、検索の該当候補のハイパーテキストに含まれるさまざまな情報 を可視化を用いて、ディスプレイ上にコンパクトに表示することである。その結果、 ユーザは多数のドキュメントの情報を一覧できるため、可視化画像を検索の該当候補 を絞り込むための判断材料として使うことができる。

WWWは、巨大な貯蔵庫ともいうべき性質を持っている。ユーザは、自分の趣味に関する 情報や、学術的な調査のために必要な情報などを、WWWから取り出すことができる。WWW において無秩序なドキュメントやリソースを整理してくれるものは、検索エンジンである。 検索エンジンは、複数の無関連なHTMLドキュメントをキーワードで関連づける。しかし ながら、新たなる問題も発生している。それは情報源であるWWWが広がるにつれて、 一つのキーワードに関連するHTMLドキュメントが増えてきたことである。このことは、 あるキーワードで検索した際に返される検索結果が膨大なものになるという傾向に つながる。実際にInfoseekなどのロボット型エンジンで検索を行う と、一万件を超える検索結果が返されることも少なくない。ブラウザで一度に確認できる 件数は10件程度であり、すべてのHTMLドキュメントを見に行ってその内容をチェックする ことは不可能である。

本研究では、HTMLドキュメントの中で可視化すべき要素は、タグとキーワードとURL情報 であると仮定した。タグは画像やハイパーリンクなどの種類・個数・位置、キーワードは その個数と位置、URLはそのドキュメントが存在するドメインの種類、といった情報を 可視化すれば、検索において有効である。

そのために可視化する形態を検討し、二次元のグラフの画像での表示方法を採用した。 本研究では、この可視化オブジェクトをバーと呼ぶ。一つのバーは、一つのキーワードに対 する検索結果のHTMLドキュメントを表している。バーは、ハイパーテキストの情報とプレ ーンテキストの情報からなっていて、キーワードの位置や、ハイパーリンクの位置、種類、 画像の位置、種類などを一目見ることで、HTMLドキュメントの特性を理解しやすいように なっている。また、このようにHTMLドキュメントをバーとして表示することで、一つの検索 結果をごく小さいサイズで表示できるという利点がある。これによって、検索結果を一度に 最大100件表示できる。

本研究では、検索の実行速度の問題を解決するために、また、多数の検索結果を表示した ときに、バーがどのような役目を果たすかという実験的な意味合いも含めて、全文検索シス テムNamazuを導入した。そして、Namazuと可視化部をあわせることで、WWW検索支援システム とも呼べるシステムを設計し、実装した。 その結果、ダウンロードやリンク集を探すなど、ある特定の検索要求に 関しては、可視化による検索支援は大きな手間の削減を果たせるということが確認できた。

質疑応答:
たくさんの質問を頂いたのですが、メモを取っていなかったので 忘れてしまいました。すみません。