Essay V

出土文字資料のデジタルテキスト化をめぐって

小口 雅史

 近年の日本古代史研究においては,考古学との緊密な連係が不可欠になっている。
その一つの理由は,もはや日本古代の同時代史料が,まとまった典籍や古文書として新出することはほとんど期待できず,史料の追加が期待できるのは,考古学的成果によって裏付けられた遺跡から出土する木簡や漆紙文書,あるいは墨書土器などに限られるからである。
実際,こうした新たな文字資料は,近年の発掘技術の進歩とともに急速に増加しており,日本古代史の研究にとってその意味はますます重くなってきている。

 これらのうち漆紙文書は,当時の古文書の反故が,たまたま漆の壷の蓋などに再利用されたため,漆の付着によって保護されて現在に残ったものであるから,これまでの古文書研究の成果が適用しやすいものである。
もっとも発掘によって発見されたものであることには変わりないから,当然,その解読に当っては考古学的成果を十分ふまえる必要があることは言うまでもない。

 木簡は,ある意味で紙の代用品とも言えるものであるから,やはり従来の古文書研究の成果の適用可能範囲にかかっている。
しかし古文書に比して記述は断片的であり,その木簡1点だけ見ていても,正確な解釈は困難である場合が多い。
考古学的成果の援用はもちろんのこと,形状の分類や,類例の集成が大きな意味をもってくる。

 墨書土器は,その土器に書かれた墨書の意味を知ろうとする時,その土器だけでは,正確な理解はさらに困難である。
墨書は1字だけであることが多く,せいぜい多くても数文字しか書かれていない。出土した遺構の性格を考古学的成果によって知るだけでなく,記述された土器の部位や土器の特徴を識別し,それと文字を組み合わせた類例の集大成が絶対に必要である。

 というわけで,出土文字資料の中では,墨書土器のデジタル集成化が急務であることはお分かりいただけるであろう。
何しろ漢字1文字しか書かれていないわけであるから,その意味を知ろうとするのは大変である。
どういうところからどういう文字が出土しているのか,もはや全国規模では相当な墨書土器が出土しているのであるから,是非ともデジタル化して検索を容易にし,研究に利用してきいたいものである。

 集成作業自体については,県を単位とするレベルでは,すでにいくつかなされており,貴重な成果として高く評価されている。
しかしながら残念なことにそれらはすべて冊子体での出版物であり,デジタル資料集ではない。
こうした1文字だけの資料を研究に利用するためには,デジタル化されることが急務であることは先にも述べたとおりである。

 私が古代部会長として,古代分野の編纂責任者をしている『青森県史』でも,古代資料編の2巻目は「北方出土文字資料集成」となっていて,北方世界に関する出土文字資料をすべて集めて刊行しようとしている。
近年の研究状況をふまえて編纂準備段階で私が企画したものであるが,幸いに行政当局の理解を得ることができ,正式な企画として認められている。
出版予定はまだだいぶ先ではあるが。ただしデジタル出版については現時点では私の立場からは,残念ながら何とも言えない。

 しかし私としては,これまで繰返し述べてきた理由によって,出来ることなら,是非ともデジタル化したものを付録として添付したいと思っている。
それが実現すれば,北方世界の歴史の解明にとって重要な足場になるであろうし,そのデジタル化技術は,今後の古代史研究全体の基礎作業としても十分役立つものとなるであろう。

 ただしことはそう容易ではない。
その最大の理由は,墨書土器の中にはかなり読みにくいものが多く,通常の字体には収まらないような不思議な文字が多いことが挙げられる。
もちろん,場合によっては文字ではなく記号である可能性が高いものもある。
明らかに記号と解釈できる場合もあるが,記号か文字かにわかに判断できない場合も多い。
そこで資料集を出版する場合には,その文字の写真を併せて掲載することが望ましいのである。

 実はデジタル化は,この問題の解決にとっても重要である。冊子体で出版しようとすれば,掲載できる写真の数はかなり制限される。
しかしデジタル出版となれば話は違う。
話が極端に過ぎるかもしれないが,墨書土器は美術作品ではないから,画質は問われない。
もちろん白黒ハーフトーンで十分である。
1文字であるからサイズも小さくてよい。
したがって,デジタル出版ならばすべての墨書についてその写真を掲載することすら可能なのである。
もちろん現実問題として,出土した文字のすべての写真を集めてまわることができるのかという問題はここでは脇においている。

 デジタル写真とデジタルテキストを見やすく配置してCD−ROMにおさめて出版すれば,これは学界の慶事である。
じつは『青森県史』は2001年1月1日をもって第1巻目を刊行することを目標としているが(その中の1冊が私が責任者である古代資料編の第1巻であって,現在,果して約束を守れるかどうか苦衷の最中にある),このCD−ROMが実現すれば,まさに21世紀の県史にふさわしいものになるのだが。

 それはともかくとして次の問題は,微妙な字体をデジタルテキスト化できるのかと言う点である。
日本史史料のデジタルテキスト化に当っては,おおきく分けて二つの立場があるであろう。
一つはデジタルテキストは出来るだけシンプルにして,JISの第2水準の文字の中におさめ,原史料の状態は,写真(影印)で示せばよいというもの。
他方は,できることならデジタルテキストの方でも原史料の状態を忠実に再現したいと言うものである。

 これはどちらが良くてどちらが悪いと言うものではなく,それぞれ一長一短である。
検索の便を考えれば,前者の立場も当然あり得る。
もっともそれならそうした二つのテキストを両方作ればよいではないかと言う意見もあろう。

 その当否はさておき,そもそも後者のテキストは実現できないではないか。
中途半端なものならいっそシンプル化した方が良いというのが,これまでの技術担当者の意見であった。

 そうした状況を打開してくれるのが,われらが『今昔文字鏡』である。
その理由は会員の皆さんにあえて説明する必要はないであろうから,説明はしない。
余談になるが現在の態勢は私ども古代史研究者に取って非常に有難いものであることは言うまでもない。
ただかなりの作業なので,これを現在の態勢でいつまで維持できるかいささか心配しているが,杞憂であろうか。

 それはともかく私にも,お願いして登録してもらった出土文字特有の字体がある。
北方世界の土器にしばしば刻まれている「wpe1.gif (902 バイト)」という文字である。これは「夷」の異体字とみなされるものであるが,「夷」という字体で出土したものは1例もなく,すべて「wpe1.gif (902 バイト)」の字体で登場するところがミソである。もちろんこの「wpe1.gif (902 バイト)」字を「夷」とみなさない意見もある。ただ私としては多くは「夷」の異体字であると見てよいと思っている。

 ただし平城宮など都の周辺で出土するものの中には,「大」「夫」「wpe1.gif (902 バイト)」「秦」などとセットででるものが有り,あるいは一部は記号かもしれないとは思っている。

こうした研究のためにも,できれば字体を自由に利用してデジタル化したいのである。
というわけで『今昔文字鏡』に対する期待はたかまる一方である。

 もちろんむやみに字体をふやすだけではなく漢字のシソーラスも必要であろう。
しかもそれは時代や使われる場所によって異なるであろうから,それこそ大変な作業である。
それだけで相当の年数がかかることは重々承知している。
そうした問題があることは承知の上での発言であることを御理解頂きたい。

[Fri, 03 Jul 1998 ]

E-mail : oguchim(#AtMark#)i.hosei.ac.jp

[UP]  [NEXT]