『都市芸研』第十八輯/中国古典戯曲研究のための曲牌・音韻データベースの開発

Top/『都市芸研』第十八輯/中国古典戯曲研究のための曲牌・音韻データベースの開発

中国古典戯曲研究のための曲牌・音韻データベースの開発

千田 大介

はじめに

中国古典戯曲研究は文学史研究の一環として立ち上がったため、元雑劇や文人の手になる明清伝奇など定評のある名作を対象とする美文学的な研究や、故事の材源・変遷などに関する研究が主流を占めてきた。一方、近年では、戯曲の声腔や上演とそれを取り巻く社会環境などを解明する、演劇史的な研究も増加しており、さまざまな新たな研究成果が生み出されている。

そうした中にあって、筆者の興味は、明清代の通俗的な戯曲作品の検討を通じて、中国の庶民の心性に根ざした通俗文学のあり方を考究することにある。これは、従来の文学的研究と新たな演劇史的研究との間を媒介することにもなろう。

通俗的な戯曲を研究する上で重要になるのが、弋陽腔系伝奇である。弋陽腔は明代南戯四大声腔の一つである。古くは海塩腔、明代後期には崑山腔から発展した崑曲が士人・文人に尊重されたのに対して、弋陽腔は市民・庶民に支持され通俗的な風格を持っていた。明の顧起元の『客座贅語』にいう。

大宴会では南戯が用いられた。初めは二つの声腔しかなた。一つは弋陽腔、一つは海塩腔である。弋陽腔は、地方の言葉を交え、各地から訪れた人物が好んで見る。海塩は多くが官話で、両京の人が用いる。後にはまた四平腔があったが、弋陽腔をいささか変えて、分かりやすくしたものである。今はまた崑山腔があり、海塩腔よりもさらに清らかで温柔、情緒纏綿たるものである。*1 (巻九p.303「戲劇」)

この記事は、万暦前後の南京の状況をもとに書かれているが、弋陽腔が通俗的な性格を持っていたことがわかる。弋陽腔は各地に伝播して方言と結びつくことで四平腔のほか、太平腔・池州腔などの諸声腔を生む。また明代中期に北京に伝播し、万暦年間には大々的に行われるようになり、やがて宮廷演劇にも取り入れられた*2。清代になると、明代まで正式な宮廷演劇であった雑劇が廃され、弋陽腔が崑曲とともにその地位を受け継ぎ、北京の市中でも弋陽腔(京腔・高腔)が盛行した。

一方、清代中期には弋陽腔系の諸腔から発展した新たな声腔が勃興し、乾隆五十五(1790)年の三慶班北京進出によってもたらされた徽調が、崑曲・弋陽腔との競争・融合を繰り広げた後に、京劇へと発展する。また、弋陽腔の流れを汲む高腔系の地方劇種が、現在でも多数、演じ続けられている。

多くの伝統劇種の源流でもある弋陽腔の古い戯曲テキストとしては、明代万暦年間に南京の書肆・富春堂が刊行した一連の伝奇が伝わっている。現在の高腔系地方劇などで演じられているものも多く見られ、戯曲史研究において、極めて重要な資料であるといえる。その一方で、『明清以来俗字譜』の材源の一つとなっていることからも分かるように、俗字が多用されており本文の校訂は不十分、印刷の状況も芳しくなく、挿図も極めて粗雑な通俗的テキストであり、そのためか整理・翻刻されていないものも多い。しかも、序跋を伴わず著者も明記されず、成立年代・地域性と言ったメタ情報に乏しいという問題がある。

富春堂本『劉玄徳三顧草廬記』

メタ情報の不足は、テキストの分析によって補うほかないが、その際に有効なのが曲律研究、および語彙・押韻などの情報から地域性や年代を読み取る言語学的方法であると思われる。しかし曲律については、元雑劇などで用いられる北曲は鄭騫『北曲新譜』などがありほぼ整理されているものの、南曲については工具書すらも十分に整備されているとは言いがたい。また、言語学、特に音韻学的な研究は専門性が高く、他分野の研究者にとっては敷居が高い。

筆者が研究代表を務める科研費研究『中国古典戯曲の「本色」と「通俗」~明清代における上演向け伝奇の総合的研究』では、かかる問題点をICT技術の応用によって解決ないし改善することを目標の一つとして、研究を進めている。本稿はそうした試みについて、現時点における中間的な成果を報告するとともに、課題を整理したものである。

Ⅰ.曲律情報の整理

曲律把握の必要性

前述のように、富春堂本の弋陽腔伝奇はまだ翻刻されていないものが多く、それらを整理・校訂し翻刻することが、まず研究の第一歩となる。その際に問題になるのが、曲牌の整理である。

富春堂本は粗雑なテキストであるため、曲牌についても、【前腔】(曲の二番に相当)や〔合〕(合唱されるコーダ部分)などが必ずしも標示されていないし、曲辞も句切りされていなかったり、されていても誤っていたりする。このため、曲譜などを参照して整理する必要がある。

長短句の曲牌の組曲形式である聯曲体の中国古典戯曲の音楽は、金末元初の北京・山西地域に起源し雑劇で用いられた北曲と、南宋時代の浙江に起源し明清代の戯文・伝奇で用いられた南曲の二種に大別される。このうち北曲は、曲牌と、その宮調(調性)ごとの配列が厳密であるため、前述のように既に十分に整理されている。

一方南曲は、明の徐渭が『南詞序録』で「もとより宮調がなかった」*3と言っているように、宮調や曲牌の配列はそこまで厳密ではなかった。南曲の曲譜は歴代、数多く作られているが、前述のように決定版といえるものはなく、複数の曲譜を閲覧・対照する必要があり、非常に手間がかかる。

戯曲を自ら作る際のテンプレートとしての意味を有する曲譜は、多くが文人層に受容された崑曲などを前提に作られており、南曲の諸声腔の間には台本の互換性があったとされるものの、弋陽腔伝奇の翻刻や分析に用いる際には、注意が必要である。弋陽腔の曲律に関しては、最終的に翻刻された弋陽腔伝奇から個々の曲牌を抽出・比較検討しなくてはならないが、現在は既存の曲譜を参照しつつ伝奇の翻刻とその電子テキストの蓄積を進めていく段階にあると考える。

また、韻律に基づいてテキストの地域性を導きだす手順は、ごく大まかにいえば、まず、押韻・韻律など韻文としてのスタンダードに合致しない例を抽出し、その上で、イレギュラーが生じた原因を韻書や方言音などを参照して検討する、ということになる。従って曲譜を整理して曲律を把握することは、将来、本格的に音韻学的な分析を行う上でも避けて通れない作業である。

中国古典戯曲データベースとは

中国古典戯曲のデジタル化・データベース化は、経書・史書などに比べて、格段に難易度が高い。歌詞と科白のみならず、詩や詞、民歌の吟唱などもあるし、長短句の曲は歌詞の間に科白が挟み込まれたり、各句の字数を増やすことが許容されていたりと、文体が極めて複雑で、しかも、曲律を分析するには同一の曲牌を抽出する必要があるので、単に底本の文字サイズなどの物理的書式を電子テキスト化するだけでは対応しきれない。

こうした問題を解消した専門研究データベースとして、筆者が中心となって中国古典戯曲データベース(http://ccddb.econ.hc.keio.ac.jp/wiki/ 以下、CCDDB)の構築を進めている。CCDDBは、Wikipediaにも使われているMediaWiki?システムによって構築している。ページの作成・編集が容易で、さまざまなテンプレート・プラグインが用意されており、かつインターフェイスがなじみ深いことから採用した。戯曲の全文データのみならず、戯曲論著や関連する筆記小説などの全文データ、人名・作品名・白話語彙などの解説および工具書索引など、多様なコンテンツから成り立つ。

中国古典戯曲データベース

当然のことながら、CCDDBでは曲牌に関する情報も、コンテンツに含むことを当初から計画しており、2020年1月に初期的なデータ構築作業を行った。以下、それらコンテンツの構築とデータベースのスキーマについて解説する。

提供する情報

CCDDBではMediaWiki?の特性を生かして、個々の曲牌ごとのページを作成し、そこに曲牌や曲律に関する情報を掲載するとともに、カテゴリー分類を与えることで、分類検索を実現することになる。このとき、個々の曲牌ページに何を掲載するのかを、まず考える必要がある。

理想は、曲牌の句数・字数・押韻などの解説を全て掲載することだが、それは曲律辞典を作成する作業に等しく非現実であり、既存の文献をデジタル化して、効率的に研究に有用なコンテンツを作る必要がある。

かかる見地から検討した結果、曲牌情報として以下の三点を掲載することとした。

  • ①曲牌の異称・句数などの情報
  • ②曲譜・工具書の掲載箇所情報
  • ③著作権保護期間が満了した曲譜の電子テキスト

①であるが、北曲については情報がほぼ固まっているので、入力・作成は比較的容易である。南曲については、そのような情報を掲載する曲譜から抄録する。

②について、本来であれば曲譜の影印を掲載したいところであるが、原本の所蔵者の許諾を得る必要がある。著作権保護期間内の工具書等も、許可なく電子テキスト化して掲載することはできない。そのため、ひとまず曲牌の各曲譜・工具書における収録箇所の情報を掲載する、いうなれば電子版の曲牌索引を構築することとした。現時点で、以下の曲譜・工具書の情報を収録している。

  • 『中国曲学大辞典』(齊森華・陳多・葉長海主編、浙江教育出版社1997年)
  • 『崑曲曲牌及套数範例集』(王守泰、上海文-芸-出版社1994~7年)
  • 『南北詞簡譜』(台湾学海出版社1997年影印本)
  • 『九宮大成南北詞宮譜』(『善本戯曲叢刊』所-収-影印本)
  • 『南詞定律』(『続修四庫全書』所-収-影印本)
  • 『欽定曲譜』(『文淵閣四庫全書』本『御定曲譜』、岳麓書社2000年『康熙曲譜』排印本)
  • 『九宮正始』(『善本戯曲叢刊』所-収-影印本)
  • 『南詞新譜』(『善本戯曲叢刊』所-収-影印本)
  • 『南九宮譜』(『善本戯曲叢刊』所-収-影印本)
  • 『旧編南九宮譜』(『善本戯曲叢刊』所収影印本)

このほか、『新定十二律京腔譜』の目録も入力済みだが、同書は従来の宮調分類を廃して十二律に再分類しているため、整理にはいましばらく時間がかかる見込みである。

③については、排印本が出版されている『欽定曲譜』(『康熙曲譜』・『御定曲譜』)、呉梅『南北詞簡譜』を全文委託入力し、整理・整形した上で掲載した。

コンテンツの構築と曲牌の整理

曲牌については、まず名称や宮調の同定作業を行う必要がある。曲牌には、南北曲で同じ名称が用いられているものが多く、また他の宮調の曲牌を借りて用いるものがあったり、同じ名称でも宮調が異なると違うスタイルであったりするし、異称も数多い。北曲に関しては、前述のように決定版と言うべき曲譜が存在しているが、南曲に関しては、まずさまざまな曲譜や工具書に掲載される曲牌の名称を整理することから始めなくてはならない。

これは曲譜や工具書の目次情報を電子テキスト化し、データベース化することで、上述②のコンテンツ構築と同時に行った。まず、歴代主要曲譜の目次を、中国企業への委託によって、あるいは手作業で電子テキスト化した。影印本の巻首目録の場合は、掲載巻・葉が記載されないため、それらを補った。さらに宮調分類などの情報を曲譜・工具書ごとに付加した上でデータをマージし、曲牌名と宮調の同定作業を行った。

ここで問題になったのは、やはり南曲曲牌の同定と分類である。南曲の曲牌は、套曲(組曲)の冒頭に置かれる「引子」、套曲の本体を構成する「過曲」、末尾に置かれる「尾声」の三種に分かれ、また過曲には「正曲」と、複数の正曲を組み合わせて作られた「集曲」がある*4

これらのうち、とりわけ集曲の名称は、曲譜によって一定していない。例えば商調【猫児出隊】は、【琥珀猫児墜】の前半と【出隊子】の後半を組み合わせた集曲だが、『南北詞簡譜』は【双猫出隊】に、『南詞新譜』は【猫児呼出隊】に作る。集曲は一般に、素材となった曲牌の名称を組み合わせて命名されるが、その際に、聞こえや字面が良くなるように適宜、曲譜の編者が書き換えてしまうために、このようなズレが発生する。これらは、各曲譜に収録されている曲牌を一々対照して同定していった。

集曲については、元となった曲牌の情報を、『南詞定律』・『南北詞簡譜』によって補ったが、曲譜によって解釈が異なるものも見受けられるので、注意が必要である。

南曲に関して、もう一つ問題になるのが、宮調の確定である。北曲については、ある曲牌が複数の宮調で使われる場合、曲譜に「借正宮」(正宮より借りる)、「亦入中呂」(また中呂に借用される)というように注記されており、本来の宮調が明らかであるのだが、南曲の曲譜では貸借関係の解釈が曲譜によってまちまちで確定が難しい。また、仙呂宮と双調の曲牌は共用されるものが多く、多くの曲譜が「仙呂入双調」の宮調分類を建てているが、ある曲牌がいずれに属するのかは、やはり曲譜によって相違している。

【黑蟆序】曲牌ページ

この問題には、曲牌ページの名前空間と、カテゴリー分類とを分離することによって対応した。【黑蟆序】を例に取れば、CCDDBのページ名は「南曲/黑蟆序」とし、ページには宮調ごとに曲譜索引などを掲載する。その上で、ページに、

[[Category:南仙呂宮/過曲/正曲/黑蟆序]]
[[Category:南雙調/過曲/正曲/黑蟆序]]
[[Category:南仙呂入雙調/過曲/正曲/黑蟆序]]

三種のCategoryタグを記載する。それぞれの曲牌カテゴリーのページには、「相關項目」として、曲牌ページへのリンクを張った。更に、「南仙呂宮/過曲/正曲」・「南仙呂宮/過曲」・「南仙呂宮」……などのカテゴリーページを作成し、それぞれ上階層のCategoryタグを記述しておくことで、

南仙呂宮→南仙呂宮/過曲→南仙呂宮/過曲/正曲→南仙呂宮/過曲/正曲/黑蟆序

と、カテゴリーの分類をたどって当該曲牌ページにたどり着くことができるようになる。

「南仙呂宮/ 過曲/ 正曲」カテゴリーページ

これに対して北曲は宮調が明確なので、例えば「北中呂宮/朝天子」のような名称でページを作成し、それぞれのページを宮調にカテゴライズしている。

曲譜の電子テキスト化

曲譜の電子テキスト化は、『欽定曲譜』(『康熙曲譜』嶽麓書社2000年排印本)・『南北詞簡譜』(王衛民編校『吳梅全集』河北教育出版社2002年所収排印本)を底本に、北京創新力博社に論理構造をマークアップしたXMLドキュメントとして入力委託した。

このとき問題となったのが、ルビの処理である。曲譜では、曲辞に四声などの情報をルビとして付しているが、創新力博社のデジタル化システムはルビの入力に対応していない。同社は『文淵閣四庫全書』電子版を作成した書同文社の技術者が独立して設立した会社で、同改定版の追加入力作業なども担当しているが、『四庫全書』電子版所収の『御定曲譜』にはルビ部分が入力されていない。中国国内にこの種のテキストを入力するニーズがほとんどなく、コストが見合わないために対応していないとのことである*5

『文淵閣四庫全書』本『御定曲譜』

このため、これらの曲譜の入力にあたっては、本文を一行、ルビを一行、交互に入力し、ルビ行のルビの付いていない文字にあたる部分には全角スペースを入力する、という形でデータを入力してもらった。以下は、『欽定曲譜』の北黄鍾宮【酔花陰】の例である。委託入力した結果は以下のようになる。

<曲文>无始之先道何祖<押韻>韵</押韻>太极初分上古<押韻>韵</押韻>两仪判<押韻>句</押韻>混元舒<押韻>韵</押韻></曲文><換行 />
<聲調>平上平平去平上 去作平平平去上 上平去 去平平</聲調><換行 />

これを、EmEditor?の正規表現置換によって、本文行の文字にルビ行の対応する位置の文字をrubyタグで付加していった。各行の文字数は20~30字程度なので、スクリプトを組むまでもなく対応できる(以下は繁体字置換済み)。

<ruby>無<rt>平</rt></ruby><ruby>始<rt>上</rt></ruby><ruby>之<rt>平</rt></ruby><ruby>先<rt>平</rt></ruby><ruby>道<rt>去</rt></ruby><ruby>何<rt>平</rt></ruby><ruby>祖<rt>上</rt></ruby><押韻>韻</押韻><ruby>太<rt>去</rt></ruby><ruby>極<rt>作平</rt></ruby><ruby>初<rt>平</rt></ruby><ruby>分<rt>平</rt></ruby><ruby>上<rt>去</rt></ruby><ruby>古<rt>上</rt></ruby><押韻>韻</押韻><ruby>兩<rt>上</rt></ruby><ruby>儀<rt>平</rt></ruby><ruby>判<rt>去</rt></ruby><押韻>句</押韻><ruby>混<rt>去</rt></ruby><ruby>元<rt>平</rt></ruby><ruby>舒<rt>平</rt></ruby><押韻>韻</押韻>

簡体字から繁体字への置換とチェック、XMLタグからHTML5のclassタグへの置換などを経て完成した曲譜の全文テキストは、曲譜として閲覧するほか、各曲牌ページに埋め込む必要がある。

このため、各曲譜は、曲牌ごとに「南北詞簡譜/卷五/南正宮/過曲/醉太平」のような名称のページを作成し、各ページには前後の曲牌、上位分類である宮調名へのナビゲーターを、headerテンプレートによって以下のように埋め込んだ。

<noinclude>
{{header |title = 南北詞簡譜/卷五/南正宮?|section=南北詞簡譜/卷五/南正宮/過曲/醉太平|previous = 南北詞簡譜/卷五/南正宮/過曲/白練序?|next = 南北詞簡譜/卷五/南正宮/過曲/雙鸂鶒?}}
</noinclude>

これによって、各曲牌の曲譜・解説を、底本の掲載順に閲覧することができる。

また、MediaWiki?では、別のページの内容を、ページの一部として組み込む機能がある。曲牌ページには、この機能を用いて、以下のように記述して各曲譜の当該曲牌ページを組み込む。

{{:南北詞簡譜/卷五/南正宮/過曲/醉太平}}

このとき、元のページで<noinclude>タグで括ってあるカテゴリーやナビゲーターなどの部分は、読み込み先では表示されない。

また、曲牌名は、CCDDBのトップページから検索できないと使い勝手が悪い。このため、各曲牌名のページを、曖昧さ回避ページとして作成し、そこから南北曲の各曲牌ページへのリンクを張ることとした。曲牌の異称についても、曖昧さ回避ページを作成して対応している。

戯曲作品からの曲牌の抽出

CCDDBには『元曲選』・『六十種曲』などの戯曲全文データを登録済みである。これらから、曲牌を抽出して比較・対照できるようにすることで、戯曲研究を相当に効率化することができよう。

CCDDB『元曲選』本『漢宮秋』雑劇第一折

戯曲全文データは、抽出・埋込の可能性を考慮して、データを構築している。すなわち、本文データは、詩・白・曲などの文体ごとに細分化したページとして登録しておき、雑劇の折、伝奇の齣ページでは、それらのページを組み込んでいる。例えば、『元曲選』本『漢宮秋』雑劇第一折は、以下のようにページを組み込んでいる*6

{{:元曲選/漢宮秋/02第一折/01題}}
{{:元曲選/漢宮秋/02第一折/02詩}}
{{:元曲選/漢宮秋/02第一折/03白}}
{{:元曲選/漢宮秋/02第一折/04詩}}
{{:元曲選/漢宮秋/02第一折/05白}}
{{:元曲選/漢宮秋/02第一折/06曲}}
{{:元曲選/漢宮秋/02第一折/07曲}}
……

このとき、「元曲選/漢宮秋/02第一折/06曲」などの曲牌のページには、Category:北仙呂宮/點絳唇などのようにカテゴリーを設定してある。このため、「北仙呂宮/點絳唇」カテゴリーを開くと、「元曲選/漢宮秋/02第一折/06曲」を含め、【點絳唇】のページへのリンクが全て表示される。また、曲牌ページもしくは曲牌カテゴリーの「相關條目」以下の「曲牌集成」で始まるリンク、例えば「曲牌集成/北仙呂宮/點絳唇」をクリックすると、当該曲牌を抽出し埋め込んだページが表示される。なお、曲牌名の後に「/2」などのように付しているのは、【么】を表す。

「曲牌集成/ 北仙呂宮/ 點絳唇」ページ

執筆時点で曲牌カテゴリーを埋め込んでいるのは、『元曲選』・『元曲選外編』など北雑劇に留まっている。南戯伝奇の場合、「南曲/曲牌」にカテゴライズするのは比較的容易だが、同名異種曲牌がないまぜになってしまう。一方、多くの南戯伝奇では宮調が明記されないので、「宮調/種別/曲牌」にカテゴライズしようとすると、同定作業が煩瑣になる。折衷的に、「南曲/曲牌」ページ内の大見出しごとに分類する方法が、作業量がそこまで厖大にならずにある程度の目的が達成できるので妥当であると考えている。このほか、特に明代中期以前の古い伝奇では、正曲の曲牌名が書かれていても、曲譜では集曲に分類されている、というようなケースが見受けられる。こうした例では、実際に曲辞を検討しないとカテゴライズできず、徐々に修正していくほかなかろう。

今後、更に検討を進めて、南戯伝奇や富春堂本伝奇についても、できるだけ早くカテゴリーによる曲牌抽出を実現したい。

Ⅱ.音韻の分析に向けて

既存の音韻関連サイト

韻律のイレギュラーな箇所を見付けた場合、あるいは翻刻していてどれが韻字なのかが分明でない場合には、韻書にあたったり、方言音を調べたりすることになる。こうした作業は、情報化によって効率化することができよう。

漢字の音韻情報を検索できるWebサイトは、既にいくつか存在している。そこでまず、それらを簡単にレビューし、特に戯曲研究における利用という面から、利点と問題点について考えてみたい。

小学堂 http://xiaoxue.iis.sinica.edu.tw/

小学堂

台湾大学中文系・中央研究院歴史言語研究所などが共同運営する「小学」サイトで、22万以上の字形データ、134万以上の字音データ、および36万項目以上の工具書索引などを収録する。

左上の検索ボックスの「字形」に漢字を入力して「確定送出」をクリックすると検索結果が表示される。「相關連結」以下に、ヒットした子データベースの一覧が表示されるので、必要なものをクリックする。また、「相關索引」以下には、字書類の当該漢字掲載ページ一覧が表示される。

韻書については、「相關連結」で「韻書集成」をクリックすると、『広韻』・『集韻』・『礼部韻略』・『中原音韻』・『中州音韻』・『洪武正韻』の音韻情報が一覧表示される。表示項目は、左の検索ボックス下で増減できる。古典戯曲関連の韻書の底本は以下の通りである。

  • 『中原音韻』(『中国古典戯曲論著集成』所収本)
  • 『中州音韻』(『嘯余譜』所収本)
  • 『洪武正韻』(『文淵閣四庫全書』本)
「戲」の「韻書集成」

「中原音韻」などの韻書をクリックしてもよいが、表示される情報は同じなので、複数の韻書を比較表示できる「韻書集成」の方が便利である。

現代音に関しては、官話・晋語・呉語・徽語・贛語・湘語・閩語・粤語・平話・客語・其他土話などの子データベースに分かれている。調べたい方言をクリックすると、当該方言区内各地の方言音が表示される。『漢語方音字匯』はじめ、中国・台湾・日本などの方言研究書や論文、新編地方志の方言志などから、網羅的にデータを収集している。「方言点」をクリックすると、GoogleMap?でその場所が開く。

「戲」の「呉語」

小学データベースという性質上、検索に際して、異体字は厳密に区別される。このため「爲」の検索結果は「為」に比べてだいぶん少ないし、Unicodeのコードセパレート文字である「説」では一件もヒットしない。これは、Unicodeに収録される異体字のうち、CNS(Big5)コードの代表字形である「為」・「」が優先されていることを意味する。また、簡体字を検索すると自動で繁体字に変換されるが、例えば「」は「發」に変換され「髮」が検索されないように、繁体字の複数文字に対応する簡体字は上手く検索できない。入力に際しては台湾の繁体字IMEを使用するなど、字形に注意する必要がある。

マニュアルは、子データベースごとに用意されており、画面上方の「使用説明」からPDFをダウンロードできる。

データベースの構築・運営主体がはっきりしていて信頼性が高く、またデータの収集も幅広いので、漢字の音韻情報を調査する際には、まず本サイトを検索すべきである。問題点としては、カテゴリごとに子データベースを独立させる設計は直感的でなく、またインターフェイスもいささかこなれていないため、時に使いづらさを感じる。データベースのレスポンスもあまり良くない。こうした点については、今後の改善に期待したい。

戯曲研究における有用性であるが、複数漢字を検索して結果を比較する、というような使い方が想定されていないため、どうしても複数回検索して、その結果をコピーしておいて比較する、というような作業をしなくてはならない。また方言音を詳細に検索できる反面、子データベースの範囲を超えて、例えば、近世音と呉語・閩語の方言音を比較する、というような使い方も難しい。いささか「小学」の専門性が強すぎるといえよう。

漢典 https://www.zdic.net/

オンライン漢字辞典として知られる漢典は、また漢字の音韻情報についても幅広く収録している。

漢字を検索して表示した後で、漢字と基本情報の下のタブを左に移動し「音韻方言」をクリックすると、当該文字の各国の読音、広東各地の方言音、近代音、中古音、上古音が表示される。その下には官話・方言音などのリンクが並んでおり、クリックすると、当該ジャンルの音韻情報が詳細に表示される。ただし、「版権声明」ページには、前述の小学堂のデータを使った旨、書かれており、これら音韻・方言音情報は、漢典が独自に入力・整理したものではないことがわかる。

漢典:「戲」の「音韻方言」

「音韻方言」での異体字の検索結果だが、「為」であれば全ての方言区にヒットするが、「爲」・「」の場合は晋語・贛語がヒットしない。また、「説」の検索結果では上古音しか表示されないが、「」は全て表示される。簡体字「」でもリンクは全て表示されるが、その上の読音の一覧がほとんど表示されない。簡体字「」の検索結果は「發」と同じだが、「髪」へのリンクも表示される。元の小学堂のデータと簡体字との関連付けが不完全なようで、中国大陸の簡体字サイトでありながら、少なくとも「音韻方言」データを検索する際には、台湾繁体字で入力・検索するべきである。

漢典は、『漢語大詞典』を無断掲載して訴えられた過去があり、またWebサイト登記情報から広東で運営されているサイトであるとわかるものの、掲載内容の学術的正確さを担保しうるような運営主体であるのか、説明がWebサイト上に見あたらず、完全に信頼を置くことは困難である。ただ、全体が一つのシステムとして作られているので、インターフェイスは小学堂よりも直感的で使いやすい。

戯曲研究での有用性については、小学堂と同様である。

韻典網 http://ytenx.org/

台湾の音韻サイト。同サイトを運営する郭家寶氏は、ITエンジニアである。『広韻』・『中原音韻』・『洪武正韻牋』・『分韻撮要』・『上古音系』を収録するが、いずれもネットで入手可能なテキストデータに基づいている。

韻典網の特筆すべき点は、漢字七文字まで一括検索できる点である。このとき、通常の検索では、一文字ごとに各韻書の検索結果が並ぶために少々見にくいが、「高級檢索」で検索対象を韻書一種類のみに絞り込んで検索するとだいぶん見やすくなる。

韻典網:複数字の検索結果

また、異体字の同一視検索機能を備えているので、簡体字・繁体字やコードセパレート文字、どれで入力しても同じ結果が得られるし、「」を検索すると「發」・「髪」両方の検索結果が表示される。

収録韻書は少ないものの、古典戯曲で使われる『中原音韻』・『洪武正韻』が入っているので、それらを検索する際には重宝しよう。

なお、以下の音韻サイトもオンラインフリーテキストに基づいて作られており、韻典網と大差ない。それぞれに特徴はあるものの、単漢字検索にしか対応していない。

古典戯曲研究に有用なシステム

以上のレビュー結果もふまえつつ、古典戯曲研究に有用な漢字音表示システムはどのようなものであるのか、考えてみたい。

曲牌の押韻や韻律を調べる用途では、単漢字検索は非常に手間がかかる。曲牌の全文を貼りつけて、それに音韻情報を付加してくれるようなシステムの方が、韻目や方言音を比較対照できるので、役に立つ。また、情報が細かすぎても音韻学の専門家でなくては対応しきれないので、韻書の声調や韻目、各方言区の代表的方言音程度がまとめて表示されるのが望ましい。

こうした要件を満たすために、漢字を音韻情報に変換するテーブルを作成するベースには、『漢語方音字匯』が好適であると判断した。同書は、中古音と20種の方言音を掲載しているが、細かすぎず、かつブラウザで一覧表示することが可能な情報量であると思われる。そこで『漢語方音字匯』の全文を委託入力し、簡体字を繁体字に変換して、テーブルを作成した。それを元に、科研費研究の分担者である師茂樹氏が、音韻表示システムのプロトタイプとなるjavaスクリプトを作成した。

#ref(): File not found: "c13.png" at page "『都市芸研』第十八輯/中国古典戯曲研究のための曲牌・音韻データベースの開発"

このプロトタイプを元に実際に検索して検証した結果として、テーブルの拡張という課題が見えてきている。

音韻表示システムプロトタイプ

まず、『漢語方音字匯』の収録文字数は3,000字に過ぎず、音韻情報を表示できない漢字が多すぎる。Big5の約12,000字は網羅しないと、実用的とは言いがたい。収録文字を拡張する方法としては、『広韻』韻部に基づいて文字を増やすことが考えられる。しかし、普通話や北方の方言などで消滅している入声については、この方法では上手く拡張できない。Unicodeコンソーシアムが提供するUnihanデータのピンインと『漢語方音字匯』の北京音とをキーとしてマージする、といった作業が必要になろう。

もう一つは、収録韻書の拡張である。『中原音韻』・『中州音韻』・『洪武正韻』などの韻目・小韻・反切程度は表示できるようにしたい。このときに問題になるのが、漢字に複数の読音がある場合、それを現代中国語の発音と対応させなくてはならない、という点である。これは、ある程度手作業で対応するしかあるまい。

これまでの幾つかの科研費研究プロジェクトを通じて、『中原音韻校本』・『洪武正韻』八十韻本・『音韻輯要』・『韻学儷珠』などを全文入力済みであり、それらについても音韻テーブルに追加していきたい。

音韻表示システムは、音韻テーブルがある程度拡張できた段階で、公開する予定である。音韻情報を読み解くのに、音韻学の専門的知識の蓄積が必要であることは論を俟たない。だが、音韻表示システムの支援によって、音韻学にさほど詳しくなくても、地域性などのあたりをつけることができるようになるものと期待している。

ところで、韻書を音韻テーブルに利用する際には、異体字を一般的な字形に置き換える必要があるが、閲覧・研究用のデータとしては原状をなるべく忠実に保った方がよかろう。このため、テーブルとは別に韻書の全文データについても、整理が完了したものから順次、CCDDBに登録していきたい。

おわりに

以上、弋陽腔伝奇の翻刻・分析を念頭に、その作業をICT技術で効率化する試みについて、概略を紹介してきた。古典戯曲は地域文化に根ざした通俗性を帯びることが面白いが、それは研究を進める上での難しさをももたらしてる。

中国古典戯曲データベースの構築は、まだまだ道半ばである。入力を完了していながら整理・公開が追いついていないテキストデータが多々あるし、ミスも多々見られる。

CCDDBのページは、師茂樹氏作のperlスクリプトによってテキストデータを一括アップロードして作成しているが、2020年1月の曲牌・曲譜関連コンテンツの更新では、10,000を越えるページを一括登録した。このため、MediaWiki?システムが全てのカテゴリーをリンク処理し、表示できるようになるまでに一週間ほどを要し、デバッグをリアルタイムで進められなかったこともあり、曲牌ページやカテゴリーにはデータ処理時のミスに伴う不具合や、誤字・誤記などが目に付く。

今後とも新規コンテンツの登録や音韻テーブルの拡充などとあわせて、ブラッシュアップ作業を進め、新たな戯曲研究の地平を切り拓くことが可能なデータベースへとCCDDBを育てていく所存である。

※本稿で参照したWebサイトは、いずれも2020年2月20日に最終確認したものである。

※本稿は日本学術振興会科学研究費補助金「中国古典戯曲の「本色」と「通俗」~明清代における上演向け伝奇の総合的研究」(平成29~令和2年度、基盤研究(B)、課題番号:17H02327、研究代表者:千田大介)による成果の一部である。

参考文献

  • 『南詞序録』、明・徐渭、『中国古典戯曲論著集成』(中国戯劇出版社、1959年)巻三所収本
  • 『客座贅語』、明・顧起元、中華書局、1987年
  • 『万暦野獲編』、明・沈徳符、中華書局、1958年
  • 『漢語方音字匯』、北京大学中国語言文化系語言学研究室編、王福堂修訂、語文出版社2003年、第二版重排本
  • 佐藤仁史・千田大介・師茂樹2019 「2018年度夏期中国視察報告:北京創新力博社 北京本社」、『漢字文献情報処理研究』第18号、pp.149-157

*1 大會則用南戲,其始止二腔,一為弋陽,一為海鹽。弋陽則錯用鄉語,四方士客喜閱之。海鹽多官語,兩京人用之。後則又有四平,乃稍變弋陽而令人可通者。今又有崑山,校『海鹽』更為清柔而婉折……。
*2 『万暦野獲編』補遺巻一p.798「禁中演戯」参照。
*3 p.240。
*4 集曲は引子や北曲にもあるが、数は少ない。
*5 佐藤仁史等2019、p.157参照。
*6 アラビア数字を入れているのは、ページ名の重複を防ぐためである。複数の楔子を有する雑劇もあるため、折レベルにも入れている。