2000年4月
concon問題を修正しよう
全文検索機能はどう便利か
ハイパー日記システムをインストール
Yaphoo!かgooか?
Shurikenを見直す


concon問題を修正しよう

「全文検索ソフト(Perl版)徹底比較」のページはその後も順調にアクセスが伸びている。もうすぐ映画評のページを抜いてトップに躍り出そうな勢い。アクセスの多いページにリンクしてもらうというのは効果があるものなんですね。あくまで付録のページのつもりなので、本筋(映画)のページより多くなるというのは複雑な感じもしますが、まあいいでしょう。トップページにリンクフリーと明言しているので、どこにリンクしてもらっても構いません。インターネットは共有資源と思っていますから。ただし、自分のページのコンテンツのように表示するのはダメ。中にはそういうページがあるんですよね。他人が苦労して作ったページを、さも自分のページのコンテンツのように表示したページ。これはルール違反です。リンクであることを明示するのが礼儀でしょう。フレーム内でのリンクを禁じたサイトもありますが、これもそんなリンクの仕方と判断しているわけです。あ、これは一般論で、僕のページがそういう風にリンクされているわけではありません。それほどの価値はありません。念のため。

さて、先月初めに、concon問題というのが話題になった。システムをハングアップさせるフォルダ名の問題である。以下は窓の杜メールからの引用。

“concon問題”は、Windows 95/98で“CON”や“PRN”などのデバイスファイル名を含んだ実在しない特定のフォルダにアクセスしようとすると、システムがハングアップしてしまうという問題。Windows 95/98のファイルシステム上の問題のため、どのアプリケーションを利用していても、デバイスファイル名を含んだ特定のフォルダにアクセスしようとするだけで問題が発生する危険がある。悪意ある人がWebページに特定のフォルダに誘導するタグを埋めこむだけで、閲覧者のシステムをハングアップさせることもできるため、その危険性の高さが指摘されている。

Windowsに固有の問題だからマッキントッシュの人には関係ない。さすがに試してはみなかったけれど、とりあえず修正しておく必要はあるだろう。webページでリンクをクリックしたらハングアップなんてことにもなりかねないのだ。その修正モジュールがマイクロソフトのホームページでようやく公開された。以下のリンクからモジュールをダウンロードできます。

http://www.microsoft.com/japan/support/kb/articles/J052/7/92.htm

なーんて、書いてあって実は上のリンクでハングアップさせたりすることもできるわけです(これは大丈夫です)。上のリンクページのタイトルは「W98:パスに複数回 MS-DOS デバイス名を含むと致命的な例外 OE 発生」(なんか分かりにくいタイトルですね)といい、concon問題の現象を詳しく書いてある。conというのはMS-DOSのデバイス名にあり、それを複数回(つまり2回以上)記したフォルダへのアクセスによって引き起こされるという。例えば、C\:windows\con\con\…などのフォルダ名はまずい、ということです。 ハングアップしても再起動すればすむことだから、大した問題ではないが、初心者が引っかかると、ハードディスクに傷をつけてしまう心配はある。早めに修正しておくに越したことはないでしょう。でも、なぜこの修正モジュール、Windows Updateからはインストールできないんでしょうかね。「重要な更新」に入っていてもおかしくないと思うのですが。(4月3日)

[BACK]

全文検索機能はどう便利か

「日本語全文検索エンジンソフトウエアのリスト」を見ていたら、「Namazu(Perl版)設置ノーハウ」のページもリンクされているのが分かった。あのページ、バージョン1.3xについての設置法で、バージョン2.xには対応していない。だから今となってはあまり有用ではないのだが、アクセスしてくれる人に申し訳ないので、ページの記述を一部書き換えた。プログラムのダウンロード先を修正し、バージョン2.0xの説明ページへもリンクさせた。インストール方法も(特にkakasi for win32について)一部修正した。kakasiに関してはインストーラー付きのプログラムが現在(Namazuがバージョン2.xにアップして以来)公開されていないので、初心者には難しいと思うけれど、autoexec.batにkakasiとその辞書のパスを通せば、何とかなります。設置しようと思っている人は頑張ってください。

ああいうページでもアクセスしてもらえるのはNamazuの一般ユーザー向けの説明ページが少ないからだと思う。ここで言う一般ユーザーとはプロバイダのサーバーにホームページを持っているユーザーのこと。Namazuは元々UNIX用のプログラムで、一般ユーザーには敷居が高い。Windows向けのNamazu for Win32は主にローカル環境での使用を考慮してあり、プロバイダのサーバーにPerl版を設置させるところまでは詳しく説明してない。その隙間があのページになるのだと思う。僕はまだバグが心配なのでバージョン2.0xは設置していないが、本当に安定したら設置して、あのページもバージョン2.0xに対応させるべく書き換えようと思う。

検索機能はweb上に限らず、ローカルでもよく使う方だ。例えば、このコラムを書くのに使っているTTTエディタ。以前書いたように検索機能が大幅にアップしたのだが、ある文字列を検索させると、それを含むすべてのファイルと文字列のある部分を表示してくれる。これは相当便利な半面、出力結果が多すぎるという側面もある。試しにキーワード“Namazu”を検索すると、119件も出てきた。文字列やタグの訂正用に作られたものだろうから、これは仕方がない。もっと便利なのはWZエディタ。これはgrepを行うと、ウインドウが2つ表示される。上はキーワードを含むすべての文書の一段落、下はカーソルのある文書の全文ですぐに編集に移れる。秀丸も使ってみたが、grepに関してはWZの方が機能は上のようだ。WZも秀丸もHTMLファイルを編集できるので、TTTで使いにくい場合はこちらを使えばいい。

検索機能はアウトルック・エクスプレス(OE)の場合、別の意味でもっと便利に使える。僕は映画のメーリングリストに加入しているが、映画の感想を知りたかったら、メーリングリストのフォルダ内を映画のタイトルで検索すれば、探したい映画タイトルを含むメールが一覧表示される。届いたメールをいちいち読む必要はないのである。ちょっとしたデータベース的使い方と言えるだろう。grepなのでメールが増えてくると、速度的には遅くなるけれど、ローカル環境なら、速度はそれほど気にしなくてもいい。ま、メールが数万単位に増えると使えないでしょうけどね。

データベースを作るには最初から情報を系統立てて分類し整理する必要がある。しかし、一般人はそんなことしないんですよね。時間がかかりすぎるし、入力も面倒だ。入力した後で変更したい部分も出てくる。全文検索機能を使えば、雑多な情報をデタラメに入れていても、後でデータベース的な使い方ができるのである。野口悠紀雄「超知的生産とパソコン」にはgrepについて「『あらかじめ準備しなくてもよい』というのは、私のようなものぐさには大変ありがたい」との記述があるが、その通りなのである。僕が全文検索に興味があるのはこの利点があるからだ。野口悠紀雄はついでにパソコンで書く文書は必ずテキスト形式にするようアドバイスしている。テキスト形式ならエディタのgrepが使えるからである。WORDや一太郎のようなワープロはgrepが使えない(一部使えたにしてもタグジャンプはできない)。

僕はこれまで1つのページに4つから5つの映画評を書いてきた。このコラムも1カ月ごとにまとめてある。ファイルが多くなると、自分でも収拾がつかなくなる、と恐れたからだ。しかし、こういう考え方からすれば、1つのページに1つの映画評、コラムでも構わないわけである。むしろその方がNamazuのようなインデックス作成型の検索エンジンを使う場合には好ましいのかもしれない。検索結果をクリックすれば、すぐに目的の映画評にたどり着ける。ファイルの整理の仕方、映画評の書き方を変えてみようかなと考える今日このごろです。

ところで、Namazuを使っていて一つ気づいたことがある。例えば、“韓国”を検索すると、“韓国人”はヒットしないのである。“韓国人”で検索すると、“韓国”はヒットしない。一般的なgrepの場合は両方にヒットする。Namazuはkakasiという分かち書き辞書を備えているから、“韓国”と“韓国人”を別のキーワードと判断するらしい。これは便利なようで、不便なところでもあると思う。(4月9日)

[BACK]

ハイパー日記システムをインストール

Namazu関連のWEBページをgooで検索していたら、ハイパー日記システムというページにたどり着いた。ここにNamazuのインストール方法が書いてあったのである。インストールの記述は簡単に済ませてあったが、これで分かったのは、僕が利用しているさくらインターネットに(Perl版ではない)Namazuをインストールできそうだということ。しかしこれまでC言語のcgiをインストールしたことはないので急にできるわけがない。手始めに同じC言語であるこのハイパー日記システムというプログラムをインストールしてみることにした。そうしたら、難しいんですよね、これ。圧縮ファイルをサーバーに送って解凍(解凍したファイルを転送してもいい)→Makefile(コンパイル設定ファイル)の書き換え→コンパイル(make)→設定ファイルの書き換えという手順なのだが、telnetにもUNIXにも慣れていないので、悪戦苦闘した。

解凍までは簡単。といっても一度ミスし、telnetの画面に意味不明の文字が大量に出てきて止まらなくなった(*_*)。焦って強制切断し、やり直し。続いてMakefileの書き換え。ホームページのマニュアルにはサーバーのvi(UNIXのエディタ)を使って書き換えるよう書いてある。telnetで初めてviを呼び出して使ったら、入力できない(ーー;)。UNIXの参考書を見ると、viはコマンドモードと入力モードがあり、最初にアクセスした時はコマンドモードになっているそうだ。aかiを入力すると、入力モードに変わる。この辺、UNIXの知識がないと分かるわけないですね。で書き換えたが、保存がうまくいかず(ーー;)、結局、Makefieをダウンロードし、ローカルで書き換えて再アップロードした。コンパイルも初体験。これはつまりファイルをサーバーに認識させる手順で、インストールのことですね。やってみたら、できているはずのフォルダが見あたらない(*_*)

ハイパー日記システムはインストールすると、DIARY、PUBLIC_HTMLという2つのフォルダが出来、その中に必要なファイルが入ることになっている。でも2つともないんです。初心者向けのマニュアルページを読んだら、圧縮ファイルの解凍はいつもファイルを置くフォルダの一つ上のフォルダ(つまりtelnetで最初にログインする場所)で行わなければならない、とあった。再度、ファイルを転送し、コンパイルし直したが、やっぱりない。うーん。ここで躓いた。初日はこれで終わってしまった。

2日目。もう一度、Makefileの記述を確認していて気づいた。さくらインターネットはWWWというフォルダにファイルを転送しないと、ブラウザで表示できない。これ、一般的にはPUBLIC_HTMLフォルダのことですね。URLでは省略されるので、普段は意識しないが、FTPでアクセスすると、ちゃんと表示される。Makefileのインストール指定フォルダにこれを書き加えていなかったのが原因だったのだ。WWWフォルダの一つ上のフォルダを見てみたら、2つのフォルダがちゃんとできていた。しかし、これではブラウザで見ることはできないので、ファイルを削除し、最初の手順からやり直した。最後に設定ファイルを書き換える。コンパイルがうまくいっていれば、あまり書き換えるところはない。これもローカルで書き換えてアップロードした。これでようやく、インストール完了。

以上の手順、かなり手間がかかったように見えますが、これでも端折ってます。ファイルの書き換えはこのほかにも何回もやっており、修正、アップロード、修正、アップロードを飽きるほど繰り返しているのです。しかも、何とか動くようにはなったものの、ブラウザからの日記記入はまだできない。ブラウザから日記を書くにはまず、メールで日記を書けるように設定する必要があったのである。それには.forwardという設定ファイルを作らなくてはならないという。うーん、面倒な手順が多い。ファイルをFTPで転送して表示できるようにはなっているが、これでは普通のHTMLで日記を書くのと手間は変わらない。C言語プログラムのインストールは難しい。Namazuへの道はまだ遠い…。(4月17日)

[BACK]

Yaphoo!かgooか?

Namazu関連のページを検索していたら、「ヤフーは墓穴を掘っていませんか?」 というページを見つけた。Namazuとはまったく関係なく、検索エンジンの登録に関する記事。これはなかなか興味深かった。Yaphoo!は1998年7月から登録審査が厳しくなった。それまでは申請すればたいていのページは登録されていたが、今や審査をパスするのは至難の技。個人のホームページが登録されるのは申請の5%に過ぎず、「東大に合格するより難しい」のだそうだ。かくいう僕も過去に2度申請していずれもダメだった経験がある。ま、当時はホームページの内容も貧弱だったし、自分がYaphoo!の審査員(?)であってもパスさせなかっただろう。

ではホームページのコンテンツを増やして充実させればいいのかというと、そういうものでもない。既にYaphoo!に同じようなページが登録されている場合、ダメな場合が多い。たとえ、申請ページが登録済みの同じようなページより明らかに充実していて素晴らしくてもダメなのである。Yaphoo!の審査員はそこまでは見てくれない。僕がよく行くCGIに関するあるサイトは1日に2万件のアクセスがあるが、それでもYaphoo!には登録されていない。CGIの配布サイトって多いですからね。いくらアクセスが多くても、同じようなものではダメなのだ。

これで逆に分かるのは登録されているページにないオリジナルな内容なら登録されやすいということだろう。しかもそれは自己満足ではなく、訪れる人に役に立つページであることが条件となる。ページのレイアウトやデザインの善し悪しよりも内容なのである。現に「日本語全文検索エンジンソフトウェアのリスト」などは画像さえないテキストだけのページである。それでもクールサイトなのである。問題は中身だ。

「ヤフーは墓穴を掘っていませんか?」というページの趣旨は審査が厳しくなることによって登録サイトが少なくなり、刻々と変わるインターネットの現状に合わなくなるのではないか、ということ。こういう側面は確かにある。Yaphoo!は数ある検索エンジンの中で最も利用者が多く、株価も高い(1億円を超えた一時の勢いはない)。僕は検索エンジンソフトに興味があるので思うのだが、Yaphoo!のような登録型のエンジンは検索に慣れてくると、あまり使わなくなるのではないか。無作為にデータを収集するロボット型の方が自分が捜したいテーマを見つけやすいのである。だから僕は本当に自分が探したいキーワードを見つけようと思ったら、gooを利用する(infoseekでも構わない)。Yaphoo!は登録したサイトに検索キーワードがなかった場合、gooにキーワードを渡して検索させる仕組みを取っているが、それならば最初からgooで検索した方が速い。

Yphoo!は本で言えば目次、gooは索引なのである。漠然とした内容を示す目次より、ページに現れる言葉を網羅した索引(インデックス)の方が自分の捜したいキーワードに到達しやすい。ホームページでもサイト内検索を利用した方がコンテンツのリンクをたどっていくより速い。それと同じことだ。問題はgooの場合、キーワードのヒット数が多すぎ、FILE NOT FOUNDになる場合も多いということにあるが、これは絞り込み検索を工夫すれば、ある程度克服できるだろう。僕は登録型としてのYaphoo!の存在価値は認めるし、墓穴を掘っているとも思わないが、インターネット初心者向けではあると思う。Yaphoo!ではインターネットを十分に活用することはできない。(4月21日)

[BACK]

Shurikenを見直す

ハイパー日記システムで「映画とネットのDIARY」を書くようになって、こちらの更新が滞りがちである。あっちに書いちゃうと、コラムのネタってなくなってくるんですよね。こっちに書いた問題点がその後解決して、あっちに解決した経緯を書くということにもなる。例えば、ハイパー日記システムはその後、再インストールして正常に動くようになったし(Makefileのpublic_htmlをさくらインターネットの仕様であるwwwに書き換えたらうまくいった)、Namazuはkakasiのコンパイルで躓いた。こんなことを両方にだぶって書いてもしょうがないもの。まったく別の内容を書けばいいのだが、そんなにネタはころがってませんね。かといってこのコラムを削除すると、「全文検索ソフト(Perl版)徹底比較」で紹介しているAfri Splendid Searchのデモができなくなるし、映画評からリンクさせてるものもあるので都合が悪い。だぶらせて書かないためにはこちらには本当に書きたいものを書きたい時に書くというスタイルにするしかないようだ。今の表紙は月ごとに分けているが、これをやめてコラムのタイトルだけにすればいいのかもしれない。ちょっと考えてみよう。

さて、日記の更新はメールからできるようになった。ハイパー日記システム独特のコマンドを書いてメール送信すれば、更新される。独特のコマンドというのはSubjectにhnf:ADD、本文にPASSWORD:*****、DATE:(日付)、最後にENDを書く仕様。これをいちいち書くのはちょっと面倒だ(そうでもない?)。これらが自動的に挿入されるテンプレートを作っておけばいいのだが、いつも使っているOutlook Expressにはこれができない。そこで一太郎に付属するShurikenを使ってみたら、できるんですよね、これが。メールの宛先まで指定したテンプレートがいくらでもできる。しかもデスクトップにショートカットまで作ってくる。アイコンをクリックすれば、宛先も含めたテンプレートを書き込んだメールソフトが自動的に立ち上がるのだ。日記の更新についてはこちらを使った方が手間がかからない。

で、バカにしていたShurikenのインターフェースをよく見てみたら、これOutlook Expressより優れているようだ。受信したメールは引用部分など色分けがカスタマイズできるし、メールを書く際にも全角スペースが表示される。普通のエディタ感覚で書けるのだ。おまけに多分使わないけど、音声ファイルも添付できる。もちろん、一太郎のファイルならそのまま送れる。メール振り分け機能も当然ある。感心するのはメールサーバーにあるメール一覧を表示して必要なものだけ受信できること。また、受信したメールはテキスト形式で保存できる。ソフトウェア会社からの連絡(シリアルナンバー、パスワード)など重要な内容のメールは別のフォルダに名前を付けて取っておけるのだ。これは便利だ。インテリマウスのスクロールがちょっとカクカクするのは気になるが、機能的には申し分ない。

僕が今、インストールしているのは一太郎10付属のバージョン2.1。問題はOutlook Expressのメールをインポートする機能が見あたらないこと。これだと、今まで受信したメールと統合ができないので困る。(と思ったら、あった。説明ページもここにあったhttp://www.justsystem.co.jp/support/faq/shuriken2/fl2wi008.html)。Shurikenのホームページを見ると、Shuriken Proというバージョンもあり、こちらはもっと機能が多いようだ。Shuriken Proはジャストシステムの製品を持っていれば、価格3800円。ま、安いと言える。ちょっと使ってみて、使いやすかったらPro版の購入を考えようかと思う。(4月30日)

[BACK]



4月のコラムの冒頭に戻る