国語辞典が最も頻繁に用いられるのは、「字引」の用途である。しかし、ワ
ープロで文章を書く場合には、字引として国語辞典を用いることが少なくなる。
ワープロソフトの日本語FEP(かな漢字変換プログラム)が勝手に漢字を出し
てくれるからである。ど忘れした漢字をひく程度ならば、手書きの場合でも、紙
の国語辞典をめくるよりも、常に電源が入れてあるパソコンのキーボードを打つ
方が早く、手間もかからない。
国語辞典を「道具」として捉えることは、国語辞典の仕組みを知るだけでな
く、それがその用途にふさわしい道具かどうかの検討も含まれてくる。ここでは
、国語辞典と日本語FEP辞書とを比較することを通じて、それぞれの「道具」
としての特性を考える
*1
。
まず、両者の構成を見てみよう。
国語辞典の項は、ほぼ、次のような構成になっている。
@a 見出し語【表記情報】旧仮名《品詞》語釈。言い替え語。「用例」
b くう【食う・×喰う】くふ《他五》食物を、かんで飲み込む。食べる
。‥‥「同 じ釜の飯を−う」 『学研』
意味を調べる時には、語釈ばかりでなく、言い替え語や用例を参照し、表記
を調べる時は、表記情報を参照する。この表記情報が単に「漢字表記」について
の情報だけなのか、標準的な表記についての情報も含んでいるのかは、凡例で確
認しておく必要がある。国語辞書はみな同じように見えるが、それぞれ様々な工
夫が施されている。道具として使いこなすには、凡例でその辞典の仕組みを心得
ておくことが欠かせない。『例解』のように、「標準表記」についての情報が実
字で示した用例からも得られるようにしたものもある。
一方、日本語FEP辞書は、読みと表記と品詞情報を並べたリストを基本と
している。
A アッケ,あっけ,一般名詞
アッケ ,呆気,一般名詞
アッケシ ,厚岸,固有名詞
アッケナ ,あっけな,形容詞
日本語FEPは、かな文字列を文節に区切り、それぞれの単語の読みを辞書
の表記と照らし合わせていく。字引をひくのとほぼ同じ作業をしているのである
。この辞書でいうと、「あっけ」から、ひらがな表記と漢字表記の「呆気」が出
てくる。「あっけない」からは、漢字表記が登録されていないので、ひらがな表
記しか出てこない。これも、「あっけ/ない」と文節の区切りを変えてやれば、
「呆気/ない」を出すことができる。
国語辞典にも日本語FEP辞書にも品詞情報は含まれているが、日本語FE
P辞書の品詞情報は、必ずしも国語辞典に示された品詞と一致はしない。「見る
」や「植える」などの上一段や下一段動詞は、日本語教育で見られるように、「
見」「植え」を語幹とする「一段動詞」として登録されていることが多い。最近
では、いわゆる「AI(Artificial Intelligence)変換」のために、動詞の格体
制や生物(+animate)とか人(+human)といった名詞の意味素性、さらには「暑い
/夏」「熱い/お茶」「厚い/本」といった共起情報や、「家庭/教育」と「教
育/課程」といった接続順序情報、歴史の文章では「近世」、天文学では「金星
」を出やすくする分野別情報などを組み込んだものもある。
次に採録語の語数や語種から比べてみよう。日本語FEP辞書では、無変換
確定で処理できるかな表記は別として、基本的に一つの表記に一つの項が立てら
れる。ワープロの宣伝などで、15万語辞書とか20万語辞書といったように、
『広辞苑』や『大辞林』を凌ぐような威勢の良い数字が踊っているが、固有名詞
や単漢字を除く一般語彙で見ると、6〜7万語クラスの普通の小型国語辞典くら
いだろう。
語種の面でも、国語辞典は、固有名詞が少なく旧国名や都道府県程度である
のに対し、日本語FEP辞書では、地名・人名・企業名・商品等の固有名詞が多
数採録されている。
「字引」として使うのなら、これらの固有名詞が豊富に採録されている日本
語FEP辞書のほうが優れていると言える。用字用語辞典でもかなうものは少な
い。
国語辞典は用例収集や用法の分類・解釈に時間がかかる。初版の場合、作成
に十年を越えることもしばしばであるし、改訂も7〜8年置きである
*2
。どうしても時事的な語の採録は遅れがちになるし、流行語や外来語、語形や
意味・用法の変化などは、定着を見極めてから採録されることが多い。大型辞書
の『大辞林』(1988)で採録された「焙煎」も小型辞書の『角川』や『福武』『例
解』などでは採録されていない。「ハイレグ」も『例解』と『集英』『新選』く
らいにしか立項されていない。パソコンやソフトを「起動する」ことを表す「起
ち上げる」は、『集英』や『例解』、『学研』、『新選』といった最新の辞書で
も採録されていない(『新選』では、「立ち上がり」の項に言い換え語として「
立ち上げ」を載せるが、立項はしていない。)。一方、国語の教科書に出てくる
こともあってか、明治期のよく用いられた「赤ゲット」や「透綾」「れこ」など
はいずれの国語辞典でも採録されている。江戸期以前は古語辞典で、明治期以降
は国語辞典が受け持つのだから当然といえば当然であるが。
一方、日本語FEP辞書は、構想には数年かかっても、語釈がないぶん比較
的短期間に作成される。バージョンアップもほぼ2〜3年ごとである
*3
。こまめに改訂できるところから、時事的な語彙も採録できるし、外来語や流
行語、新しい語形にも対応できる。なにより、単語登録機能を使って、「チン」
を「サ変名詞」で登録して、「レンジでチンする」とか「チンをした後で」など
といった言い方に対応させることもできるのである。
「字引」で特に問題となる標準表記について触れておこう。
先に見たように、国語辞典は見出し語の下に表記情報を示しているが、漢字
表記を列挙するだけのものや、漢字表記にはそれなりの配慮を払うものの、かな
表記、特にカタカナ表記に関しては何も注記しないものが少なくない。「たばこ
」の漢字表記は「煙草」「烟草」「莨」などが示されているが、ひらがな書きは
見出し語だけ、「タバコ」は触れられもしないことが多い。動植物名の多くも、
「いちょう【〈銀杏〉〈公孫樹〉〈鴨脚〉】イチョウ科の落葉高木。」のように
、見出しはひらがな、漢字表記は列挙、種別表示はカタカナというように一つの
項に表記を混在させておきながら、その使い分けをどこでも示さず、用例も「−
」で略号表記するといったことがしばしば見られる。『例解』や『新選』『学研
』のように、標準表記をちゃんと注記するものがないわけではない。しかし、こ
れらでも、カタカナ表記に関しては、触れていないことが多い。
日本語FEP辞典では、標準表記が国語辞典よりも重要視される。以前は、
「かな漢字変換」という言葉に表されるように、かなを漢字に直せばいいという
レベルで、候補の順序もコード順かなにかであった。しかし、「語」としての表
記が意識されるにつれて、ひらがなやカタカナ表記も登録されるようになり、さ
らに、AI変換などで自動変換がどうにか実用に耐えるようになってくると、同
音異義語ばかりでなく、一語の異表記の優先順位にも注意を払わねばならなくな
ってきた。実際の表記調査を踏まえて配列を考えるといった機運もあり、この面
では早晩に国語辞典を凌ぐことが予想される。
こうしてみると、通常私たちが使う「字引」としては、日本語FEP辞書の
ほうが優れているようだが、次のような問題点もある。
まず、第一は、採録語彙数の絶対的な不足である。7万語辞書といっても、
固有名詞を除く語彙は2万〜3万語クラスの国語辞典なみだろう。日常の語には
不自由しないが、漢字さえも浮かばないような単語だと採録されていない可能性
が高い。
第二は、採録語彙の偏りである。日本語FEP辞書は、ビジネスユーザーを
対象とするのか、家庭生活や歴史、文学といった面の百科語が手薄である。この
一方で、ビジネス用語や理学・工学系の語は、国語辞典にない語も結構採録され
ている
*4
。中学校の教科書で太字となっている用語の採録はあまり積極的でないのに、
パソコン関係の用語は相当な専門語でもいち早く採録されるのである。
第三に、採録語彙数や語種にまして問題なのが、語彙選定基準である。ほと
んどの国語辞典は、国語学者や国文学者、教育者などを監修者や編集者としてい
る。これを権威付けと笑うことは簡単であるが、監修者や編集者は、内容の質を
保証するとともに、それが一企業の恣意的な産物ではなく、公共の産物であるこ
とを保証しているのである。
これに対し、日本語FEP辞書の多くは発売元が示されるのみであり、語彙
の選定基準も不明確で、時には、不正確な語が登録されている場合もある
*5
。パソコン関係の用語が多かったり、関係者の名前が登録されていたりするの
は、いまだに内輪意識で公共意識に乏しいからである
*6
。
一昨年の19期の国語審議会でも『ワープロ辞書』の不備が問題にされたそ
うだ。しかし、そこで論じられたのは、「字種」「字数」「新旧仮名遣い」「送
り仮名」など、主として漢字の使用法についてであったようだ(『日本経済新聞
』1992/6/19朝刊)。日本語FEPの関係者は、すでに「漢字の数」や「その表
記の問題ではなく語彙空間の問題」
*7
だと自覚し、実際に、適切な「語彙空間」が実現されるように、ユーザーの意
見を反映させるシステムを作ったり、内容の監修を外部に依頼することも行われ
ている。これまで、日本語FEP辞書は国語辞典の成果を一方的に利用するだけ
であったが、自らも日本語の実態調査に臨むといった、積極的な取り組みを示し
ているところもある。
日本語入力FEPは、人間が中身を見るものではなく、採録語数が少なくて
も、異なった分析をしても、結果として正しい表記が得られればそれでいいので
あって、内容を単純に国語辞書と比べることはできない。しかし、両者は「語彙
空間」の適切な拡張をめざすという点では共通する。他方から一方的に成果を利
用する現状から、相互に利用する形を経て、両者が融合していく形へ進んで行く
ことが予想される。すでに、紀田順一郎氏や箭内敏夫氏のように、国語辞書と日
本語FEP辞書との双方を踏まえて日本語を論じる方も現れているが、今後ます
ますこの方面の議論が必要とされ、盛んになっていくだろう。
*1
以下、本稿で参照した小型国語辞書とその略称を示す。
『学研現代新国語辞典』1994:『学研』
『岩波国語辞典第四版』1986:『岩波』
『現代国語例解辞典第二版』(小学館)1993:『例解』
『角川新国語辞典九十七版』1991:『角川』
『福武国語辞典』1989:『福武』
『集英社国語辞典』1993:『集英』
『新選国語辞典第七版』(小学館)1994:『新選』
*2
例えば、『新選』は第六版が1987年で第七版が1994年、『例解』は初版が1985
年で第二版が1993年、『岩波国語辞典第四版』(1986:『岩波』)は第三版が1979
年で第四版が1986年となっている。
*3
代表的な日本語FEPの一つであるATOKでみると、「ATOK6」が1987
年で「同7」が1989年、最新の「同8」へは特に時間がかかっているがそれでも1993
年である。
*4
そうかと思うと、ある日本語FEP辞書では、「哀婉」という語まで登録さ
れていた。これは『広辞苑』『大辞林』クラスで採録され、『浄土和讃』などか
ら例を示すような語である。
*5
箭内敏夫氏の調査によれば、「水(炊)飯器」「同音異議(義)」「穴(宍
)道湖」「大衝(衡)村」のような誤登録が見られたと言う(「電脳辞書の国語
学1」「(同)6」『The basic』1991年5月号,10月号)。
*6
この辺の事情をつとに指摘したのが評論家の紀田順一郎氏である。紀田氏は
、ワープロでは「達意の日本語入力に不足を感じることが多」いのは、「辞書の
匿名性」が関係するとして、次のように述べている。
そこには辞書編纂に必要な編者の人格性(思想や言語生活の体系)が
存在せず、 言語生活における定見を有しない係員が、かなり恣意的に既成の紙
辞書を孫引き したり抜粋したりするだけという弊害が一向に改まっていないよ
うだ。
(「コンピュータと漢字文化」『しにか』1990年5月号)
井上ひさし氏もワープロに関する悪い噂として同様のことをあげている。
七、「十二万語の辞書内蔵」などと謳っているが中身を見た人はいない。
その質も使ってみないと分からない。
八、また、その辞書をだれがどんな基準で編集したのかも不明である。
そんなあやふやなものに自分の日本語を託すことができるものか。
(「ワープロは日本語を変えたか」『文藝春秋』1992年3月特別号)
*7
「座談会 未来のATOKの姿」における(株)ジャストシステムの小林龍
生氏の発言(『月刊JUST MOAI』No32)。