『月刊言語』1993年4月号同名論文元原稿
(『言語』掲載版は本稿そのままではありません→ 追記

国語電子辞書引き比べ



矢澤真人



1 二つの国語辞書


 「電子化された日本語辞書」には二つある。一つは、日本語入力FEPの辞 書で、ワープロ専用機やパソコンのワープロソフトで打ち込まれた仮名文字列を 漢字仮名混じり文に直すのに用いる。もう一つは、従来あった紙の国語辞書を電 子化したもので、主にEB(Electronic Book;電子ブック)規格の8pCD−R OMやEPWING規格の12pCD−ROMで提供されている。EB版CD− ROM辞典は書店に陳列されていることがあるので見かけた方も多いだろう。
 ここでは、CD−ROM版の国語電子辞書の利用法や使い勝手を紹介してい くが、国語電子辞書が紙の辞書や日本語入力FEPの辞書とどう関わっていくの かについても触れてみようと思う。

2 国語電子辞書は便利か


2-1 CD−ROM辞書の用途


 CD−ROMの国語辞書は、紙の辞書と比べて、@検索が迅速かつ徹底的で ある、A検索結果の再加工が容易である、B語釈からの検索が可能である、とい った特色がある。Aによって、ワープロで文章作成中に辞書の検索内容をそのま ま文章に張り付けることもできるし、ある一定の語形をもつ単語のリストを即座 につくり再加工することもできる。また、Bによって、語釈に「不定」とか「様 子」を含む語を集めることも、「ばらか」「ていぼく」「はる」といったキーワ ードから「海棠」という項目を探すこともできる。もちろんBの検索結果もデー タ化できる。
 語形からでも語釈からでも検索でき、さらに、辞書の内容を書き移す手間ま で省けるというと、何とも便利なもののように感じられるが、まだ、残念ながら その利点を十分かつ容易に活用できるシステムは整っていないし、電子国語辞書 としてふさわしい内容を持ったものもないようである。

2-2 国語電子辞典のタイトルと必要機器


 現在、国語電子辞典のタイトルは、岩波書店の『広辞苑』や三省堂の『大辞 林』・『三省堂現代国語辞典』など、EB版も12p版もほぼ同様のものがそろ っている *1 。漢字や意味を参照するだけなら、電子ブックプレイヤーを買うだけでいい 。『三省堂現代国語辞典』を含むEB版辞典がついている。画像や音声に対応し た機種ならば、挿し絵や『広辞苑』の鳥の鳴き声などを楽しむこともできる *2 。慣れると確実に書籍の辞書を引くのより早く引けるし、大きさも11p×16 pほど、高さも3.5pくらいであるから、文庫本の国語辞書を多少薄くした感じ である。書籍の『大辞林』がだいたい18.5p×24.5pで厚さが8pほどだから、 横置きの専有面積で2/5弱、体積だと実に1/6弱である。
とはいえ、ちょっと早く辞書を引くだけで機器も含めて数万円出す気にはなら ないだろうし、ちょっとした言葉集めなら逆引き辞典でも十分である。やはり、 Aが実現して初めて電子辞典の威力を感じることができるが、このためには、パ ソコンやワープロ専用機にCD−ROMドライブをつなげて利用しなくてはなく てはならない。

2-3 表記や意味を調べる


 国語電子辞書は、見出し語から検索する場合は「単語検索」を用い、語釈か ら検索する場合、つまり項目の解説中にあらかじめ埋め込まれたキーワードから 単語を割り出す場合には「複合検索」を用いる。ほかに「メニュー検索」や「複 合検索」もあるが、これらは各辞典によってさまざまな工夫がなされており、ま とめて2-6で触れる。
 単語検索で漢字を調べたり意味を調べたりする分には、EB版も12p版も ほとんど違いはない。表記情報や語釈は基本的に紙の辞書と同じだからだ。電子 辞書らしい機能として、本文から他の項目を参照する「参照検索」機能がある。(1) は、EB版『大辞林』の「あこうろうし」の項だが、「→」で示された「忠臣 蔵」や赤穂浪士の名前の「表」がここから参照できる。

 (1) あこう ろうし 【赤穂浪士】→ [4]
 一七〇二年(元禄一五)一二月一四日夜、江戸本所松坂町の吉良上野介()義 央()の邸を襲って主君浅野内匠頭()長矩()の仇()を報いた、四七人の元赤穂藩の 浪士。赤穂義士。
→忠臣蔵。
→[表]

 参照先の「忠臣蔵」の語釈には「普通は『仮名手本忠臣蔵』をいう」とある が、「仮名手本忠臣蔵」はその参照項目になっていない。「赤穂浪士」から「塩 谷判官」や「お軽・勘平」へは参照検索の道がつながっていないのである。
 また、類義語や反義語などは参照検索の必要性が高いが、必ずしも参照項目 になっているわけではない。例えば、「あつい」「ぬるい」「つめたい」「あた たかい」は互いの参照項目にはなってはいない。
 EB版プレイヤ−では、このお仕着せの参照しかできないので、「吉良上野 介」や「浅野内匠頭」などを参照したいときは、再び検索メニューに戻らなくて はならない。一方、パソコンやワープロ専用機に接続するドライブで用いる場合 は、検索ソフトによっては画面にある語をピックアップして検索できる。先の例 では、「元禄」「本所」「浪士」なども検索できるし、画面をいくつか重ねる機 能のあるものでは、複数の項目を同時に表示・参照することもできる。

2-4 本文を引用する


 さて、検索結果をデータ化するとなると、著作権との関係が問題になる。現 在のところ、検索結果を限りなくテキスト化できるのではなく、一画面に限ると か、連続しては一項目に限るとかいった制限が加えられている。また、ジャスト システムの『いろは』というソフトでは、著作権に考慮して、(2)のように、引 用文献の表示までを自動的に行う仕様になっている *3

 (2) わか め【若布・和布・稚海藻・裙蔕菜】→ [1][2]
褐藻類コンブ目の海藻。日本沿岸の干潮線下に生じ、養殖もされる。葉は柔ら かく粘滑で、羽状に分裂し、長さ六〇〜一〇〇、幅三〇〜四〇になる。茎状部の 基部に「めかぶ」と呼ばれる厚い胞子葉がつく。生()で、あるいは乾燥したもの を水でもどして食用とする。古名ニキメ・メノハ。[季]春。
(※三省堂「大辞林」より)

(3) (ワカメの図:省略)

2-5 言葉を集める


 単語検索には、「前方一致」(後方あいまい)と「後方一致」(前方あいま い)の二つのモードがある。接頭語の「いぬ−」がつく語を検索する場合は前者 、語末が「やか」で終わる形容動詞を調べる場合は後者を用いる。国語電子辞典 は逆引き辞典を兼用しているのである。
 また、条件検索は語釈を検索できるのでこれまでと違った辞書の利用が可能 になった。ただ、この条件検索の機能をつけたために、従来の紙の辞書の語釈の 問題点があらわになってしまった感がある。「不定」で検索してヒットしたもの だが、次の『大辞林』の記述のどちらが「いつ」でどちらが「いつか」だかおわ かりだろうか。どちらも「不定の時」を表すとあって、語釈から両語の違いは出 てこない。ところが、この「不定」の検索では、「どこ」や「どこか」がヒット しない。これは、(6)(7)に示すような用語の不統一によることがわかる。

 (4) 不定の時を表す。物事の行われたとき、あるいは行われるときがわか らなかったり、はっきりしなかったりすることを表す。
 (5) はっきりその時と指定できない不定の時や漠然とした時などを表す。
 (6) 不明の場所やきまっていない場所などを指し示すのに用いる。どの場 所。
 (7) 不特定の場所、はっきりしない場所をさし示す。

 このような用語の不統一は紙の辞書において希なことではない。「将棋」と 「王将」で検索すると、「穴熊」や「金櫓」「銀櫓」「美濃囲い」は出てくるが 「櫓囲い」が出てこない。『大辞林』に立項されてないのでなく、語釈に「王将 」ではなく「王」が用いられていただけのことである。これらが、語釈の検索で あらわになってしまうのである。

 しかし、条件検索に用いるキーワードが語釈に含まれる語すべてを対象とす るわけではない。これもあらかじめ埋め込まれた「お仕着せ」である。以前、紀 田順一郎氏が『広辞苑第3版』では「マリリン・モンロー」が「アメリカ」と「 女優」のAND検索では出てこないと述べられていたが、「映画」「女優」「性 的」「七年目の浮気」「お熱いのがお好き」がキーワードに選択されていたよう だ。部分的な「浮気」ではだめだし、キーワード以外の部分を含んだ「性的魅力 」でもだめ。語釈にない「紳士は金髪がお好き」や「変死」では当然引けない。

 (8) (Marilyn〜)アメリカの映画女優。性的魅力で有名。代表作「七年目 の浮気」「お熱いのがお好き」など。(1926〜1962)

 第4版では、「アメリカ」のほか新たに語釈に加わった「変死」や「一世」 「風靡」などの語もキーワ−ドにされたようだが、やはり「性的魅力」や「浮気 」では引けない。

 (9) (Marilyn 〜) アメリカの映画女優。性的魅力で一世を風靡。代表作「 七年目の浮気」「お熱いのがお好き」など。自宅で変死。(1926-1962)

 また、条件検索は、片仮名・平仮名・アルファベットのいずれかを用いるが 、第4版でも、平仮名と片仮名とで検索結果が異なることがある。例えば、「ス ウェーデン」では78件ヒットするが、「すうぇ−でん」では38件しかヒットしな い。「スウェーデン」と「じょゆう」では「バーグマン」もヒットするが、この 女優は「すうぇーでん」でははじかれてしまう。
 後発の『大辞林』はこの辺はちゃんと処理していて、「モンロー」は、「映 画」「女優」でも「映画女優」でもヒットするし、平仮名と片仮名とで検索結果 が異なることもないようである。しかし、語釈に縛られているという点では大同 小異で、「アメリカ」と「国立公園」では、「イエローストーン」「グランドキ ャニオン」「ヨセミテ」など、国立公園やその付近の地名があがるのに、「日本 」と「国立公園」ではなんと「紀伊半島」がヒットするだけである。

 どのような語を語釈に用いるか、語釈中のどの語をキーワードにするかは、 すべて編者次第である。従来の紙の辞書はその場その場の「語釈の妙味」で凌い できたようだが、ちゃんとしたシソーラスを元にした正確な意味記述がなされて いなければ、このような条件検索は全く意味をなさない。また、キーワード選定 も、語釈の中から行き当たりばったりに選ぶのではなく、時には語釈の本文では 削除した情報から補うとか、キーワードの階層を工夫するとかいったことが要請 されよう。本当は、ここが電子国語辞書の編者や編集担当者の見識と力量の見せ 所である。先に、検索が迅速で徹底的であると述べたが、機械は徹底的でも人の 方の事情によってはぼろぼろになってしまう。

2-6 データを引く


 電子辞書には、もう一つ、あらかじめ辞書の方で準備したジャンルに対する 検索もある。これには、凡例や画像、リストなどをまとめたメニューから参照す る「メニュー検索」と、決まった範囲のキーワードで本文を検索する「複合検索 」とがある。
 まず、メニュー検索を見よう。メニュー検索の中身は、ほぼ、紙の辞書の付 録を本文と結びつけたものといえる。EB版と12pの『広辞苑第4版』と12 p版『広辞苑第三版』、EB版『大辞林』のメニュー項目はそれぞれ次のように なっている。

 (10) EB版『広辞苑第4版』
(本文) (付属資料)
1 地理 1 凡例
2 歴史・風俗 2 略語一覧
3 理科 3 出典略称一覧
4 図鑑 4 序
5 表 5 西暦・和暦・天皇対照表
6 鳥の鳴き声

 (11) 12p版『広辞苑第四版』
○地理 ●日本・世界のベスト10:山 川 湖
     ●日本の都市(都道府県名→市名)
     ●世界の国名(地域→国名・首都)
     ●旧国名一覧(国名・対応する現県名):地理順 五十音順
○歴史・風俗 ●ノーベル賞受賞者一覧:文学・平和・経済学
                    物理学・化学・生理学医学
     ●歴代将軍一覧:鎌倉幕府 室町幕府 江戸幕府
     ●歴代首相一覧(首相名・在職期間)
●官制・職制一覧(日本歴史)
      ●歴代中国王朝 ●髪型のいろいろ ●紋章・紋所一覧
      ●結びのいろいろ ●楽器のいろいろ
○理科 ●星座一覧(星座名・略符号・学名) ●太陽系の星
     ●元素名一覧:五十音順 原子番号順 ●元素の周期表
      ●SI単位:基本単位・補助単位 接頭語 組立単位
○分野別文献資料一覧
○分野別図版一覧
○分野別表組一覧
○鳥の鳴声一覧
○色の見本一覧

 (12) 12p版『広辞苑第3版』
○凡例
○略語一覧
○出典略称一覧
○西暦−和暦対照表
○西暦から和暦
○和暦から西暦
○天皇
○分野別図版一覧
○色の見本一覧
○鳥の鳴き声一覧

 (13) EB版『大辞林』
1 凡例
2 アクセント
3 略号・記号一覧
4 出典略称一覧
5 言葉の知識
6 絵で引く大辞林
7 西暦から年号
8 年号から西暦

 これらはそれぞれに下位項目を持つ階層構造をなしている。12p版『広辞 苑第四版』でいえば、「地理」の下には「日本の高山ベスト10」から「旧国名一 覧(対応都道府県名)」までの項目が、「日本の高山ベスト10」の下には「富士 山」から「大喰岳」までの山のリストがあげられているのである。このリストか ら「大喰岳」の本文を参照することもできる。
 次に複合検索であるが、『大辞林』は、音訓・部首・総画・JISコードの 検索をつけて、漢語辞典として使えるようにしている。また、単語検索では複数 の条件をつけられないところから、見出し語に複数の語を持つ慣用句やことわざ などの検索に複合検索を当てている。
 一方、『広辞苑第4版』は、「慣用句」のほか、「人名」「地名」「作品名 」「季語」などがたてられている。検索は、選択肢から国名や時代などを選ぶ項 と自由にキーワードを入れる項とで行う。「日本」と「国立公園」の条件検索だ と「大台ヶ原山」しかヒットしないが、「地名」の複合検索では、国名「日本」 ・地域不選択・キーワード「こくりつこうえん」で、「赤石山脈」「吾妻山」「 伊勢」以下、26項目がヒットする。限られたジャンルではあるが条件検索の不 備を補う工夫として評価できよう。『広辞苑第3版』や『三省堂ワードハンター 』内の『三省堂現代国語辞典』などには複合検索はない。
 なお、漢字電子辞典の『漢語源』の複合検索には、音訓・総画・部首・JI Sコードなどの検索のほかに「漢字パーツ検索」というのがある。「上下」「左 右」「かまえ」など漢字の構成パターンと、漢字の部分的な形で検索するもので 、「春」なら、「さん(三)」「ひと(人)」「ひ(日)」でも検索できる。こ れも電子辞典にすることの意義をよくふまえた検索法であろう。
 現在の国語電子化辞典では、どれも品詞情報からの検索はできない。「副詞 」の条件検索では「副詞的用法」は引っかかるが、副詞そのものは出てこない。 品詞や動詞の格情報などは、複合検索にマッチしていると思うのだが。

3 今後の国語電子辞典


3-1 書籍化『広辞苑第x版』


 こうやって見てくると、『広辞苑第3版』は、とにかく既成のものを電子化 してみた「試作版」、『大辞林』は、国語辞典にふさわしくアクセントを音声化 し、キーワードもちょっと広く取った「増補修正版」、『三省堂ワードハンター 』はサブセット的な「試供版」、『漢語源』や『広辞苑第4版』は次なる可能性 を摸索した「改訂版」といった位置づけができそうだ。特に、大型辞書と小型辞 書の使い勝手が紙の辞書ほど違わないことを考えると、『三省堂現代国語辞典』 の位置は微妙であろう。他の辞書とドッキングさせるためのユニットとしては重 宝するだろうが。
 今後、紙の辞典の電子化ではなく、当初から電子化されることを予定した国 語辞典が出るに違いない。むしろ、国語電子辞典の本文部分を紙に印刷した、書 籍化『広辞苑第x版』が出るほうが自然であるような気さえする。

3-2 FEP辞書と国語電子辞典


 ワープロで文章を書く場合、手書きの時よりも辞書を字引に用いることが少 ないだろう。日本語FEPの辞書が勝手に漢字を出してくれるからである。
 FEP辞書の中心となっている部分は、(14)のように、読みと表記と品詞情 報を並べたリストである *4 。日本語入力FEPは、仮名文字列を適当に分析して、その読みで、辞書の 表記と照らし合わせていくのであり、まさに字引の役割を果たしている。

 (14) アッケ,あっけ,一般名詞
    アッケ,呆気,一般名詞
    アッケシ,厚岸,固有名詞
    アッケナ,あっけな,形容詞
    アッサク,圧搾,名詞サ変

 (14)の辞書のFEPでは、「あっけ」と入力すると「あっけ」と「呆気」が 出てくるが、「あっけない」と入力すると「あっけない」だけで「呆気ない」は 出てこない。仮名表記は無変換でも処理できるから、すべてというわけではない が、基本的には、FEPの辞書では一つの表記に対して一つの項をたてておく必 要がある。ワープロの宣伝などで、15万語辞書とか20万語辞書といったよう に、『広辞苑』や『大辞林』を凌ぐような威勢の良い数字が踊っているが、人名 や地名など固有名詞と単漢字を引くと、結局、7万語クラスの普通の小型辞書相 当、いや、一般語彙だけで見ると小型辞書の方が表記情報にしても語彙にしても 豊富だといえる。
 また、その登録語も選択基準が不明確で、語彙空間のバランスがとれていな いことが多く、不正確な語が登録されている場合もある。箭内敏夫氏の調査によ れば、「水(炊)飯器」「同音異議(義)」「穴(宍)道湖」「大衝(衡)村」 のような誤登録が見られたと言う(「電脳辞書の国語学1」「(同)6」『The basic 』1991年5月号,10月号)。
 紀田順一郎氏は、ワープロでは「達意の日本語入力に不足を感じることが多 い」いのは、「辞書の匿名性」が関係するとして、次のように述べている。

 (15)  そこには辞書編纂に必要な編者の人格性(思想や言語生活の体系) が存在せず、言語生活における定見を有しない係員が、かなり恣意的に既成の紙 辞書を孫引きしたり抜粋したりするだけという弊害が一向に改まっていないよう だ。
(「コンピュータと漢字文化」『しにか』1990年5月号)

 井上ひさし氏もワープロに関する悪い噂をあげる中で同様のことを述べてい る。

 (16) 七、「十二万語の辞書内蔵」などと謳っているが中身を見た人はいな い。その質も使ってみないと分からない。
八、また、その辞書をだれがどんな基準で編集したのかも不明である。そんな あやふやなものに自分の日本語を託すことができるものか。
(「ワープロは日本語を変えたか」『文藝春秋』1992年3月特別号)

 19期の国語審議会でも『ワープロ辞書』の不備が問題にされたが、そこで は「字種」「字数」「新旧仮名遣い」「送り仮名」など、主として漢字の使用法 が論じられたようだ(『日本経済新聞』1992/6/19朝刊)。
 しかし、問題は単に「漢字の数」やその正書法ではなく、「表記の問題では なく語彙空間の問題」(「座談会 未来のATOKの姿」『月刊JUST MOAI 』NO32における小林龍生氏の発言)なのである。日本語FEPを供給する側は、 すでにこのような認識をもち、FEP辞書の監修を外部の専門家に依頼するとか 、ユーザーの意見が十分に反映するシステムを作るなど、さまざまな形で「匿名 性」を打ち破り、FEP辞書に適切な「語彙空間」を実現させようとしている。
 同時に、CD−ROMの国語電子辞典とFEP辞典とを連携させる試みもな されている。分かち書きのない日本語は、あとからスペルチェッカをかけるとい った英語のような処理が容易ではない。むしろ、人の言葉と機械の処理とが最初 に交わる日本語入力FEPレベルで処理しておくほうが実際的である。字引と意 識せずに使っているFEP辞書と同じくらいの手軽さで、FEPのレベルで意味 や類語や特殊な表記などをCD−ROM辞典で参照する、こんなこともまもなく 実現するだろう。こうなると、必然的にFEP辞典とCD−ROM辞典の機能分 担が行われ、増やされる一方であったFEP辞書も再編成されることが予想され る。
 紙の辞典とCD−ROM辞典とFEP辞典、そして、出版社とソフトハウス 、さらに、編者と編集者とプログラマー。国語辞書を巡る状況もさらに融合化が 進むに違いない。


補注


*1  このほか、清水書院の『新国語辞典』のように、ハードディスクにインス トールして用いる形態の物も数種類出されている。
*2  12p版『大辞林』は音声に対応し、アクセントを実際に耳で聞いて確か めることができる。残念ながら、EB版は音声未対応である。
*3  ただ、この場合、フォントはカバーできないため、辞書本文では表示され ても引用では空白になる字が出てくることがある。
*4  このほか、後に述べるように、最近は「AI変換」のための意味素性や共 起情報なども組み込まれている。

追記


 『月刊言語』22-5掲載の同名論文は、紙面の関係上、本稿を約2/3程度にに 縮めたものです。削除した内容の一部(主として第3章)は、『日本語論』2-4 掲載の「道具としての国語辞書」で改めて触れたが、電子化辞書の内容に関わる 部分の一部は掲載されていません。電子化辞書もすでに改訂版が出され、内容的 にそぐわない部分もありますが、初期の電子化辞書の様子を示す部分もあると考 え元原稿の方を示します。 1996/12/18 矢澤