- トップ
- 本計画について
本計画について
文部科学省の大規模学術フロンティア促進事業として、平成26(2014)年度から令和5(2023)年度までの十か年で実施した「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」(歴史的典籍NW事業)の成果をさらに発展させる後継事業として、「データ駆動による課題解決型人文学の創成~データ基盤の構築・活用による次世代型人文学研 究の開拓~」(国文研DDHプロジェクト)を、令和6(2024)年度から令和15(2033)年度までの十年計画で実施しています。
-
本計画の目的
本事業では、国内外機関等との連携による更なる画像データの拡充、画像データのAI利活用等によるテキストデータ化、データ分析技術開発の推進など、国文学を中心とするデータインフラを構築し、様々な課題意識に基づく国内外・異分野の研究者との共同による大規模データを活用した次世代型人文学研究を開拓することを目指しています。
-
日本語の歴史的典籍のデータ駆動の意義
日本に現存する最古の歴史書である『古事記』は、今からさかのぼること1300年。1000年以上の連続性をもって、単一の国に書冊が残存するということは、世界的に見ても稀な事象といえます。書物に記されている歴史的データには、気候変動や災害を含む地球環境史の記憶から、多文化共生への知恵、心の問題への対処のあり方、危機に直面した社会の再生記録など、人間社会の形成に関わるさまざまな記録が含まれています。
しかし、和紙という媒体特性のため図書館や研究機関の中に保管され、各分野の専門研究者以外の目に触れる機会は少なく、そこに記録された情報の包括的な利用や分析は困難でした。
そこで、これまで目に触れる機会の少なかった日本の書物に蓄積されている膨大な情報をデータ化し、異分野の研究者はもちろん、国内外の誰もが必要な情報を速やかに取り出すことができ、利用できる環境の構築を目指して進められてきたのが歴史的典籍NW事業です。歴史的典籍NW事業によって、30万点に及ぶ日本語の歴史的典籍の全冊画像を、Web環境さえあればオープンデータとして利用できる環境が整備されつつあります。
本計画では、30万点の全冊画像データの構築を基盤に、さらにデータ集積の範囲を明治時代にまで拡張。国立国会図書館で公開されている近代書籍データと連結することで、1000年に及ぶ通時的なデータにし、機械可読型に整備して自然科学・社会科学分野といった他分野の研究者への利活用を進めていきます。
-
新たな研究視点 -たとえば、書物が含むマテリアル情報-
長年、書物は文字情報を保存するのみだと考えられてきましたが、マテリアルとしての書物には、時には植物のDNAが保存されており、人間が関わることで毛髪、手垢等の人間由来の成分も保存されていることがわかってきました。マテリアルとしての書物情報は、人間史の分析データとして利用されることが期待されています。書物を多角的、総合的な観点で見直し、研究を進め、マテリアル解析等の情報等をも付加してデータを高度化することで、地球環境史と人間と社会の営みを解明し、現代社会の直面するさまざまな課題を解決するための世界規模のエビデンスデータとなることが期待されています。
-
本計画の4つの実施内容
上記の事柄を達成するための具体的な実施内容は以下のとおりです。
項目 研究テーマ 1データインフラストラクチャの構築 - 1.データ駆動型システム開発
- 2.デジタル画像データの拡充
- 3.テキストデータ作成
- 4.連携機能の強化・拡張 ほか
2コンテンツ解析からの展開 - 1.典籍防災学の拡充
- 2.文献観光資源学の推進
3マテリアル分析・解析 - 1.マテリアル分析・解析技術の高度化の推進
- 2.マテリアルデータのメタデータとしての整備
4人文系データ分析技術の開発 - 1.メタデータ付与に関する汎用的仕組の開発及び国際標準に準拠したテキストの構造化
- 2.TEIフォーマット作成及びツール開発
- 3.画像検索・解析技術の精度向上と可視的把握技術の確立
-
本計画の年次スケジュール
文部科学省Webサイト「大規模学術フロンティア促進事業の年次計画」
https://www.mext.go.jp/content/20240628-mxt_gakkikan-000035679_1.pdf -
「データ駆動による課題解決型人文学の創成」パンフレット
本プロジェクトに関するお問合せはこちらまでメールでご連絡ください。
- メール送付先:htddpsinfo★nijl.ac.jp
- 担当:プロジェクト総括係
- ※スパムメール等対策のため、E-mailアドレスには、「@」の代わりに「★」を入れております。
メール送信の際は、「★」を「@」に換えて送信してください。