Essay IV

写本の電子化と異体字・俗字の処理

石井公成

 敦煌の仏教写本を扱う場合、悩まされるのが異体字・俗字の問題である。

 池田温『中國古代寫本識語集録』(大蔵出版)の凡例が、「異体字や俗字、草体は通用の楷書字体を用い、特別の場合(難識、略体通用等)原形を摸す。字体は旧字体によったが、印刷の都合で新字体も一部混用する」と記し、張涌泉『敦煌俗字研究』(上海教育出版社)が序と目次以外は、索引も含めてすべて手書き原稿のオフセット印刷であるのは、書物というものの性格および印刷事情の制約によるものであってやむをえないが、異体字や俗字の用法は、写本の成立時期、筆写した人物の人間像、書写の系譜などを推測する際、きわめて有力な判定材料となりうる。
このため、電子化に当たっては、異体字や俗字についても、他の諸情報と関連づけた形で自在に処理できるようにしておくことが望ましい。

 すなわち、異体字や俗字を細かく区別する一方、必要な時にはそれらを区別せずに代表的な字体によって統合して扱うこともできるようにしておき、さらに写本の紙質・形式・書体その他の書誌情報や内容に関する様々な情報と連動させつつ様々な操作ができるようにするなど、柔軟に処理できるようにしておくことが望まれるのである。

 たとえば、亡き姉の追善のために『大般涅槃経』を書写した李季翼が、北魏永平五年(512)五月五日に巻三十二を書写し終わってその末尾に記した題記には、「大般涅槃經卷卅二……沈溺者莫不wpe4.gif (924 バイト)之以渡wpe5.gif (919 バイト)(Pelliot 2907)とあり、「生死の流れに沈溺する者は、如来の教えにすがって彼岸に渡らないことがない」と述べて、以下、亡き姉の浄土往生を願っている。

 この「岸」の異体字(wpe5.gif (919 バイト)(#AtMark#)67057)は、諸橋轍次『大漢和辞典』にも収録されていないが、仏教文献にはしばしば見られるものであり、区別しておきたい字の一つである。

 こうした字を適切な情報づけを行なって入力しておけば、「六朝における北地の文献で、親族の追善のためになされた写経の後記において、「岸」の種々の異体字を使っている例」などという指定による検索が可能になる。

 そうなれば、「この異体字は、九世紀以前は、写経の後記において、これこれの筆でこれこれの書体で書かれていることが多く、それも必ず祈願の部分中で用いられている」などというように、その字をめぐる生きた状況も明らかになってこよう。

 いわゆる正字を無暗と有り難がって異体字・俗字と呼ばれる字を軽視するのは、近年の木版本や活字本しか知らず、漢字文化圏の人々が漢字にこめてきた切実な思いを無視するものである。

 ここで大事なのは、様々な情報づけを行なう際は、後で容易に変更できる方式にしておくことであろう。
 これは、「某写本については、これこれの材質の紙に鹿毛の筆で書かれたものと判定していたが、顕微鏡検査と化学検査の結果、木ペンで書かれたものと改める」などというように、研究の進展によって判断が変わっていく可能性があるためである。

 このような情報づけを行なうには、インターネットにおける次世代の国際標準規格である XML(eXtensible Markup Language) によるタグ付けが有効であろう。

 今後は、諸国の東洋関係の写本研究者で協議し、写本の大きさ、形式の分類、紙・絹布・木簡などの材質の違い、隷書・楷書・草書その他の書体の違い、兎毛・鹿毛・狸毛・木ペンなど筆の材質の違い、宮廷写経・自分の勉強用の経論の抄出や手控え・講義の筆録・庶民の手紙といった文献の性格の違いなどに関する情報づけの方式を、共通化できるところは共通化してゆく必要があると考えられる。

 個々の研究者は、そうした共通化によって国際的な情報交換を可能にした上で、書写した人物の年齢、某地への移動や某戦乱の前か後か、お世辞か皮肉か、その他、その分野の研究に打ち込んできた人間でなければできない、内容に踏みこんだ独自な読み込みを、情報として電子テキストに盛り込んでゆけばよいのである。

 そうした個性的な読込に基づく情報づけは、むろん外して扱うこともできる。

 これまでのコンピュータは、ハード面でもソフト面でも、漢字を扱うには制約が多かったが、今後は漢字研究のための強力な道具に転じることだろう。

ikosei(#AtMark#)komazawa-u.ac.jp kosei(#AtMark#)ceres.dti.ne.jp

[UP] [NEXT]