資料横断的な漢字音・漢語音データベース
最終更新日:2023.3.5
更新情報
- 2023.3.5 研究集会「古辞書・漢字音研究とデータベース2022」を行いました。
- 2023.2.22 Bibliography_20230222.mdファイルのうち「30-010-01,阿弥陀経西本願寺」の誤植を訂正しました。
- 2023.2.15 研究集会「古辞書・漢字音研究とデータベース2022」(2023年3月4日(土曜)9:45~17:00)を行います。
- 2023.2.5 Bibliography_20230205.mdファイルのうち「20-001-01,大般若波羅蜜多経_根津美術館」の「字音情報」項目を更新しました。
- 2023.2.4 資料横断的な漢字音・漢語音データベース(30文献版)を公開しました。
- 2022.3.10 シンポジウム「古辞書・漢字音研究と人文情報学」にて報告を行いました。
- 2021.5.27 資料横断的な漢字音・漢語音データベース(23文献版)を公開しました。
- 2021.5.16 日本語学会春季大会にて報告を行いました。
データベースの概略と目的
本データベースは、平安・鎌倉期~近世までの文献資料に現われる漢字音・漢語音を、字音注記(仮名注、声点、反切、類音注等)に即して検索可能とするものである。
漢字音史研究においては個別具体的な文献資料に基づいて高度な成果が生み出されてきたが、多様な研究成果を横断的に見通して俯瞰的な視点から整理し新たな研究領域を見いだす動きには乏しい面があった。そこで本研究では次の三つの多様性を俯瞰的な視点からの整理に必要な観点と見定め、DBの設計を行った。
- 漢文直読・訓読資料、和化漢文資料、和文資料など文献資料の位相差による漢字音・漢語音の位相的多様性
- 単漢字単位と漢字連接単位という異なる単位における字音の単位的多様性
- 中国語原音およびそれを受容した日本語社会における平安・鎌倉期から近世期までの字音・漢語音韻史の通史的多様性
本データベースが格納するデータ数(2023年2月4日現在)は次の通りである。
- 字数…86875
- 漢語数…49102
- 声点数…44577
- 仮名音注数…70465
- 反切数…1787
- 類音注数…434
本データベースは「資料横断的な漢字音・漢語音データベース構築・公開に向けた基礎的研究」(2019~2021 年度科学研究費助成事業・基盤研究C・研究課題番号:19K00650、研究代表者:加藤大鶴、研究分担者:石山裕慈・佐々木勇・高田智和)の一部である。
採録される文献
2023年2月4日現在、30資料を公開している。下記の文献リストでは資料番号,文献名_所蔵_分類の形式で示す。1つの所蔵先に同名の文献が複数ある場合のみ「分類」を示した。
資料番号はAA-BBB-CCの形式で示す。AAは時代を表し、10が上代、20が平安、30が鎌倉、40が室町、50が江戸を示す。BBBは文献番号、CCは諸本を示す。
- 20-001-01,大般若波羅蜜多経_根津美術館
- 20-002-01,医心方_半井家旧蔵
- 20-002-02,医心方_仁和寺
- 30-005-01,荘子_高山寺_甲
- 30-005-02,荘子_高山寺_乙
- 30-006-01,世俗諺文_天理大学図書館
- 30-008-01,遊仙窟_金剛寺
- 30-008-02,遊仙窟_醍醐寺
- 30-010-01,阿弥陀経_西本願寺
- 30-011-01,浄土論註_西本願寺
- 30-012-01,群書治要_金沢文庫_経部
- 30-013-01,尾張国郡司百姓等解文_早稲田大学図書館
- 30-013-02,尾張国郡司百姓等解文_東京大学史料編纂所
- 30-013-03,尾張国郡司百姓等解文_真福寺
- 30-015-01,浄土三経往生文類_西本願寺
- 30-016-01,新猿楽記_尊経閣文庫_古抄本
- 30-016-02,新猿楽記_尊経閣文庫_弘安本
- 30-017-01,色葉字類抄_尊経閣文庫_三巻本
- 30-018-01,三帖和讃_専修寺
- 30-019-01,一念多念文意_東本願寺
- 30-020-01,尊号眞像銘文_法雲寺_略本
- 30-020-02,尊号眞像銘文_専修寺_広本
- 30-021-01,西方指南抄_専修寺
- 30-022-01,唯信鈔文意_専修寺_正月十一日本
- 30-022-02,唯信鈔文意_専修寺_正月二十七日本
- 30-023-01,唯信鈔_専修寺_平仮名本
- 30-023-02,唯信抄_西本願寺
- 30-023-03,唯信鈔_專修寺
- 40-016-03,新猿楽記_尊経閣文庫_康永本
- 50-029-01,浄土三部経音義_龍谷大学図書館
データベースの構成
本データベースは、字音資料の作成年代やジャンルを横断して漢字音・漢語音を記述できるよう簡便な構成とした。データ項目は以下の16項目である。
- 資料番号:資料ID
- 資料内漢字番号:漢字の資料内出現順の通し番号
- 資料内漢語番号:漢語の資料内出現順の通し番号
- 単字:音注が付された漢字
- 漢語:音注が付された漢字を含む漢語
- 漢語内位置:漢語内での単字の位置。例えば1文字目ならば”1”。
- 単字長:単字の拍数(この項目はほとんど入力できていない。今後の検討課題である)
- 声点:単字に対する四声(平上去入)、六声(平平軽上去入軽入)及び清濁
- 声点型:漢語に対する声点の組合せ。声点がない単字については*で表す。
- 仮名注:仮名表記による字音注(仮名反切を含む)
- 仮名型:漢語に対する仮名注の組合せ。仮名注がない単字については*で表す。
- 反切:単字に対する反切注
- 類音:単字に対する類音注
- その他:声点、仮名注、反切、類音以外の音注
- 出現位置:資料内の単字・漢語の所在
- 備考:注記すべき事柄
データセット
リンク
今後の予定
現在公開している文献資料に、近世以降の文献資料からのデータを追加し、時代通覧性・位相横断性の高いデータベースを構築中です。適宜、公開いたします。
連絡先
- データに不備・不具合などありましたら、ご連絡いただけますと幸いです。ご連絡は、このサイトの管理人である加藤大鶴(katou■atomi.ac.jp、■は@に読み替えてください)宛にお願いいたします。
- データを研究に利用される場合は、「資料横断的な漢字音・漢語音データベース」利用を明記の上、ファイル名のバージョンも記してください。例)"PHSJ_data_all_20230129"ならバージョン"20230204"