「民俗資料」の収集保存基準と検索名称の開発:工場部品から日記まで

横浜フォーラム2023「フランスから考える民俗資料の収集保存と活用方法」【発表報告】

報告2「民俗資料のメタデータと情報化保存の可能性」:本間浩一

投影資料 pdf 4.2 MB[240122改訂版]
配付レジュメ pdf 624 KB

発表スライド1
スライド1
 慶應義塾大学システムデザイン・マネジメント研究所の研究員の本間です。よろしくお願いします。
 私は民俗資料の専門では全くありませんのでその内容的なところについて少しとんちんかんなことを言ってしまうかもしれません。おそれいりますがご了承いただき、教えていただいた方がいいこともあろうかと思います。よろしくお願いします。

発表スライド2
スライド2
 今日の話の流れです。何のためのメタデータを使うのかというところを確認した上でメタデータ整理の博物館の領域における大きな流れを簡潔に。ここは皆さん他でもお聞きになっていることだと思います。おそらくそれは主に大規模な施設での整備状況につながることだと思います。今回ここで扱いたいのは地方博物館や小規模館、しかも量産品や用具製品というかなり絞られたところのお話になりますのでそこについては実際にどんなデータがあるのか、本当に同じ資料がたくさんあってそれが複数の館で横断して検索できるのかということを、試行としてワークゼロと呼んでいますけれども、まずはとにかく実際に検索してみた結果をいくつかお見せしたいと思います。
 最後に今後この研究3年間の中で、まだワークゼロしかできていませんが、皆様にご協力いただいてそれぞれのヒアリングもさせていただいて詳細化を図っていきたいというお願いを最後にいたします。

発表スライド3
スライド3
 まず目的の確認です。ここで扱う民俗資料は「学術的な評価が得られず死蔵につながりやすく一部で資料の廃棄や譲渡が始まっているという対象」に絞っています。そして「地方博物館や小規模館による連携と役割分担、複数館の学芸員の機能分化」が議論できるようにするために現実はどうなっているのかの確認を現時点ではやっています。

発表スライド4
スライド4
 まず博物館の領域におけるメタデータの整備の流れです。いろいろな標準化が進んでいるということは皆さんのお耳にも入っているかと思います。標準というのはかなり“理想的“な枠組みの議論になっています。一方、”実装“としてそれがオンラインでオープンアクセスで皆さんが検索できるような実例が増えてきています。この2つは平行はしています。けれどももともとは別の話ですのでそこを識別しながらお話を進めてまいります。

発表スライド5
スライド5
 私がこの博物館の領域で皆さんにお話を聞いたときに一番よく出てくるのはダブリンコアという言葉でした。これが制定されたのがかなり前のことになりますけれどもこの15の基本要素を見ていくとそんなに突飛と思われる項目はないでしょうし、おそらくこれをある程度意識されてそれぞれの館のデータを作られている方が多いのではないかなと思います。

発表スライド6
スライド6
 博物館の領域でいうとICOMの国際ドキュメンテーション会議CIDOCが決めた情報カテゴリーの定義というのが出ていて、そこに大分類22種、中分類74種のメタデータ記述というのはどんな記述をするのかというのが謳われています。おそらくこの中身の本当に細かいところまで博物館の現場の方々が理解して咀嚼する必要は私はないのではないと思います。

発表スライド7
スライド7
 今回参照させていただいたデータの中でいくつかは早稲田システム開発が作られている I.B.Museum SaaS を使われていらっしゃいます。こちらのシステムでは先ほど言いましたCIDOC国際ドキュメンテーション会議の項目を参照し、あるいは、東博が作った情報の構造化モデルを参照した上でオリジナルの項目設定をしていて、実際にはかなり自由度高くそこから変えて運用できるようになっています。ある意味例えばこういったシステムに乗れば結果的には標準的な体系に沿ったデータの登録はされているものと思います。

発表スライド8
スライド8
 さてやっぱり大規模な館と地方小規模な館というのでは事情がかなり違うと思います。歴史民俗系というと歴民協という組織の構造に中核館が示されていると理解しています。(もしかすると違うかもしれません。)2023年度の幹事館が実際に公開DBとして何を出しているのかということを一通り一般のユーザーとしての視点で調べさせてもらいました。全体の幹事館は国立歴史民俗博物館になります。いくつか緑色に塗った部分が先ほど言いました I.B.Museum SaaS を使ってデータの公開されているところです。未確認とあるのはまだ館に直接コンタクトしてデータがどうなっているかというヒアリングまでできていません。ホームページ上にデータの公開と検索についてどこまで出ているのかということを調べて、「未確認」というのは探せなかったところです。本当にあるかどうかはこの後の確認が必要なところになります。一番右側のところに3つのワード(後で細かくはもう一度申し上げますけれどもいくつかの実際に今回話題になっている資料の名称)で検索をした場合に何件ヒットするのかという数字が出ています。鍬と唐箕ともう一つは洗濯機というのを選びました。時代的にもかなり違います。領域もかなり違うものだというのは皆さんもお感じになるでしょう。これだけでもヒット数がかなり地域によって違いがあるということはご理解いただけると思います。

発表スライド9
スライド9
 さて実際に今回宇仁さんと持田さんが直接現場で扱われ対応されている地方博物館小規模館のメタデータについて最初お話を聞きましたが、雲をつかむような話と感じた面もありました。そのため、どこから手をつけていいのかがわからないので段階を設けて進めていこうと思っています。
 ワークゼロというのはとにかくまずどのぐらいそういったデータがあるのかということを検索してみようという段階です。これを経てもう少し精緻なことをワーク1、次の段階でやりたいと思っています。

発表スライド10
スライド10
 まずストーリーの発掘というのを最初にやりました。今回のフォーラムの最初の問題提起を宇仁さんが「あふれかえる民俗資料の未来」というキーワードでお話になりました。例えば、「北海道○○町立博物館の学芸員Uさんはこんな事情を持っていらっしゃって、民俗資料の専門家がいないので価値が判断できない。結果として大量に集まってくるある資料をどのぐらいどのように収集保存の対象にすればいいか迷っている。」という文脈をお持ちだということです。収蔵庫がいっぱいで学芸員の交代時に完全な引き継ぎが行われるわけではないので、そのデータを見ただけでは次の学芸員の方はその意味まではすべては把握しきれないといった状況も一つのストーリーなのだと思います。
 では、人が実際にいくつかの資料について他の博物館に資料がないかどうかを調べるとしたらどうするのかなというのが次の段階になります。インタビューを宇仁さんと持田さんにして実際にそれぞれの館でお持ちのデータ(公開されていない)としてエクセルの一覧表というのをそれぞれからいただいて、その中にどれだけのものが入っているのかということを確認させてもらいました。あとは収集保存/背景についてどんなルールをお持ちなのか、他の館とはどんなネットワークをお持ちなのかといったことを聞いています。

発表スライド11
スライド11
 その中で検索に使う資料の候補として21個をピックアップしました。
 最初の鍬・鋸・斧、といったあたりは本当にもしかすると近現代ではなくてずっと前からあるようなものですので、最後の洗濯機・テレビとかとは全然世界が違います。けれども、困っていらっしゃる、たくさんあるということでいうと一つの候補になるのかなと思いました。それから今回結構集中してお話しするタコ足という北海道だけにおそらくある籾を田んぼに直接植えるための機器というのがある。これは直植え、稲を苗代から作るのではなくて、直接籾の状態で水田に蒔くというのは北海道でのことであって、他の地域ではないので、このタコ足というのはおそらく北海道にしかないだろうというお話を聞きました。
 一方、05番の播種機というのは一般的な種を蒔く機械ということになりますけれども、これは何の種を蒔くのかということによって言葉遣いも地方によってかなり様々になるんだなと。このあたりはまとめて調べていかないといけないなと思いました。なおMMコードというのはMMというのはミュージアムマテリアルという仮につけた時のコードで、00というのはワークゼロ段階なのでまだこれは作業のためにつけたコードですので段階が変わってくるとどんどん変わっていく仮のコードです。
 08番は唐箕。唐箕については今回も何人かが話されましたが、私自身も唐箕には非常に興味があって地方博物館に行けば唐箕があれば必ず見て写真を撮ってくるということを重ねてきました。あと一番最後に洗濯機、冷蔵庫、テレビ、扇風機いわゆる電化製品というおそらく戦後が主なもの。このあたりと一番最初の鍬とか斧というのではかなり位置づけが違うと思います。けれどもなるべくいくつかかなり特徴の違うものを話題の中で出てきたものをピックアップしてそれで実際にどのくらいのものがデータベース/メタデータで検索できるのかということを試してみました。

発表スライド13
スライド13
 先ほど21個の資料群というのをお見せしましたけれどもこの資料とこの資料はどんな違いがあるのかなということを識別するためにはいくつかの視点があると思います。ここでは細かく申し上げませんが先ほど宇仁さんの話の中でも生産者の数と実際に生産された数という二軸を提示されました。そういう多様性の度合いというのが資料群によってかなり違うと思います。これをどう識別していけばいいのかまだこれも確定したものがありませんので、これは作業的にとりあえずひとつひとつにコードをつけて、その観点でこの資料の場合はどうなるのかということを見ていこうというものになります。

発表スライド14
スライド14
 さて実際にいわゆる地方館の例として持田さんの浦幌町立博物館のデータベースの中に受入れ年別のレコード数というのがありましたので、どんなふうにコレクションが増えてきたのかということをグラフで示します。右側のグラフを見ていただくと、1968年に始まり1990年まではそんなに増えていません。そこからは全く集めていない年が何個かありますけども基本的には同じペースでどんどん集まってきていて、今は収蔵庫の方はかなりタイトな状態だと聞いています。
それぞれのある時期を担当された学芸員さんは違っていて、実際にデータを見てみるとどのカラムに何の項目をどう書くのかということが結構年によってガラッと変わってきます。一律にここに何と書いてあるからここを全部見ていけば検索できるというような状態の情報にはなっていません。エクセルで管理するという段階での比較的よくあるパターンなのかなと思います。

発表スライド15
スライド15
 先ほどの21ワードを使ってどの博物館について調べたのかということの一覧になります。宇仁さんからいただいたのが斜里町立知床博物館と美幌博物館、持田さんの浦幌町立博物館、それ以外に北海道の中核館と参照されているのであろうというふうに推定できる北海道博物館、それから国全体のセンターといっていいであろう国立歴史民俗博物館、たまたま1ヶ月以内に訪問したことがあるので岐阜県の美濃加茂市民ミュージアムのデータが公開されていましたのでそれを参照していただくのと、私関東の人間ですのでもう少し例がないかなと思って調べたところ埼玉県立の博物館については4館合同でデータベースを公開されていらっしゃいましたので、そこも参照させていただきました。
 もう一つ、ある資料について今後議論をするうえで実際に研究者がいて何らかの整理が進んでいるのかどうかということも大切な観点だというふうに宇仁さんから言われましたので、最初のとっかかりとして国立情報学研究所が公開している研究論文のデータベースCiNiiを使ってその資料に基づくキーワードでどれだけヒットするのかということも調べてみました。なお、斜里、美幌、浦幌、左側3つは内部運用データ、要は公開していなくてExcelの形でご提供いただいて、北海道博物館より右は全てオンラインで公開されているもの。おそらく持たれているデータの全てを公開されているというわけではないと思いますので、そこの差分がどうなっているのかは今後確認をしていきたいと思います。

発表スライド16
スライド16
スライド16に示されたデータベースへのリンク
検索トップ | 収蔵資料検索システム | 北海道博物館
Kanzou shiryou database 国立歴史民俗博物館「館蔵資料データベースの検索」
→現在はこちらに更新されている Kanzou shiryou database 国立歴史民俗博物館「館蔵資料画像データベースの検索」
みのかも文化の森・美濃加茂市民ミュージアム ミュージアムデータベース「民俗資料検索」
検索トップ | 収蔵資料データベース | 埼玉県立の博物館施設 埼玉県立歴史と民俗の博物館、埼玉県立さきたま史跡の博物館、埼玉県立嵐山史跡の博物館、埼玉県立川の博物館の4館の収蔵資料を検索

 下の方に資料数と書いてあるのは実際のレコード数です。どれだけのものがあるのか、斜里町でいうと5903件といったことです。オンラインのデータベースの方を見ていくと明示していませんけれども、何件が検索対象になるのかを明示されていないところもありますので、ここは今後の確認項目になります。
 データ項目数というのはエクセルをイメージしていただくと、カラムの数がどれだけあるのか、その中で検索をする上でオンラインの方は検索のメソッドが提供されていますので、どこの欄にどのキーワードを入れるのかということを書いてあります。エクセルの3つについてはどのカラムに何の情報が入っているのか時代によってかなり違うという問題がありますので、基本的にはデータが入っていそうなすべてのカラムのテキストを全部連結させてしまって、それに対して検索をするという形でカウントをしました。
 あと一番下にあるのは写真情報がそれに紐づいてあるかどうかということ。

発表スライド17
スライド17
 基本的にはそのデータベース全体に対してどのカラムかという意味を見ずにとにかくどこかに何かのキーワードが入っていれば関係しているという前提でのカウントを今回はしています。それから検索ワードの選定ですけれども、例えば漢字なのか仮名なのか、平仮名なのか片仮名なのか、これはエクセルのレベルと本当にすでに3つの館でも全く表現の仕方が違いましたので、どの形で検索したら何件になるのかということを独立して調べています。あとちょっと細かいですが「せんたっき」はおそらく学術論文ではおそらく洗濯機(せんたくき)というふうに書かれていることが多いんですが民間的に普通に言うと「せんたっき」という人のほうが多いですよね。この促音化みたいな日本語ならではのことも考慮して検索しないといけないなということを考えてやっています。

発表スライド18
スライド18
 ここには一番左側にコードがあって、次に「鍬」という代表的な名称が書いてありますが、これを検索するにあたって漢字としての鍬、平仮名の「くわ」、それからクワだけで検索するとですね兜の装束のカブトについているここですね、ここが鍬型というふうに見えますが、あれがかなりヒットされる博物館があったので、「農業」とアンド(&)で取ってどのくらい出るのかというのを試しています。実際はそんなにはヒットしませんでした。
 数字は見ていただいて、あと漢字の“鍬”と平仮名の“くわ”で件数がほぼ同じところと全く違うところがあります。今回は、意味としての“鍬”という単語を検索しているわけではなくて、テキストの列の中にこのテキストが入っていれば全てというところまでしかやっていません。普通の文章の中に鍬とは関係なく「くわ」という平仮名が入っている可能性がありますので、そこまでヒットさせるとなると研究論文で20万件もあるのはそれを意味しています。(今後はもっと精緻にやっていきます。)
 例としてはこれで見ていただき規模感というのを分かりいただけますでしょう。地方館3館でもこの“鍬”という資料は数十以上、100ぐらいの数で存在しているということになります。

発表スライド19
スライド19
 北海道博物館のデータベースを検索すると、ここは画像がすべて載っています。ただこの風呂鍬(フログワ)とこの金平鍬(カネヒラグ、先が金属製)は物としては完全に違うものです。検索するときにどの名称でやればどれがヒットするのかというところまでの統制はなかなか取りづらいと思います。北海道博物館の中で整合性が取れていても他の博物館ではそれぞれの見方があるので、この整理までして議論するとなるとクワというのは少しテーマとして大きすぎるワードだなと思っています。

発表スライド20
スライド20
 次にタコ足です。これは冒頭で申し上げましたけれども、北海道に特有と思われるものです。右側に引用をしています。本州であれば大体の場合は苗代で一回苗にしてそれを植えるという工程になると思います。けれども北海道の場合には寒冷ででも稲作をしようというときに出てきたエリアとして、直接蒔くというのが工程になっていて、それを効率化するためにこの一番上のお皿のところに籾を入れてそれが何等分か16等分に分かれて少しずつ蒔かれていくと生産性が大幅にアップするための形だというふうに聞いています。宇仁さんにお聞きすると、これはおそらく北海道特有だろうということですけれども、もしかしたら今回もし東北の方とかいろいろな方にお聞きすると違う地域でもこれが収蔵されている可能性もあるのかもしれません。

発表スライド21
スライド21
 一方、種を蒔くという意味に言うと“播種”という言葉の方がより一般的かと思いますけれども、これは宇仁さんのところにある資料の写真です。これをここに種を升のところに入れて進んでいくと仕掛けがあって種が少しずつ落ちていくという形のものです。だから畑に大豆を蒔いたりとかというのが基本的な使い方だと思います。今の2つは形は全然違います。しかし種を蒔くという目的は一緒になっていますので名前の付け方もそれに合わせて少しずつ重なりが出てくる可能性があるものだと思っています。

発表スライド22
スライド22
 この2つの言葉で検索したら何件ぐらいがヒットするのか。まず北海道だけかなと思っていても北海道の中でもそんなにヒットしない。たくさんあるというふうに宇仁さんからは聞いていたんですけれども、データとして残っているのはそんなにはない。もしかするとベルトンさんがおっしゃったように収集はしているものの実際に登録まではしていないというものが多数あるということを表しているかもしれません。これは裏取りをして状況をもっと確認する必要があると思います。右側のオンライン検索には一切このタコ足関係はヒットしてきませんのでもしかするとその北海道にしかないということなのかもしれない。
 あと研究論文はありますけれども、パッと見ていく感じでいうとタコ足でヒットした108件ほとんどはこの道具の話ではなくて全く違う文脈でのタコ足ということでした。そこは中身を見ていくことによって実際には研究はほとんどされていないと言っていいような状況かと思います。研究がされていないということは今後もしそれに議論をするときに中立の大学の方とか専門家の方の意見を聞きながら進めていくというのが少し難しいタイプの資料と言っていいのかもしれないと思っています。
 播種機の方は論文はたくさんありますので、その専門の方を中心とした議論がしやすいのかもしれません。

発表スライド23
スライド23
 唐箕についてはですね、美濃加茂ミュージアム、岐阜県の博物館に今月伺ってきたときに下の説明版のところに、この地域では「とわうち」とも言うと書いてありました。唐箕だけでなく「とわうち」という検索ワードも入れて議論する必要があるのだなと気がつきました。おそらくこれは他のすべての資料で呼び方が違うというのがたくさんあると思います。それを収集してどう検索していくのかということが今後必要になることだと思っています。

発表スライド24
スライド24
 検索の結果です、まず研究論文「とおみ」の2番目ひらがなは2万件もありますけど、これはもう単純に文章の中に「とうみ」という言葉が何かしら入ってしまっているというだけです。「とわうち」は美濃加茂市民ミュージアムしかありませんでした。これは岐阜県のある範囲だけの言葉なのかもしれませんが、全体として横断で見るときにはこの言葉を辞書/言い換えの言葉として入れていかなければいけないということです。

発表スライド25
スライド25
 次にこれも北海道ですね。北の地方に特有だろうというふうに宇仁さんはおっしゃっていましたが、バチバチっていう道具です。木材を切り出してそれを雪の上を運搬するときに使うものということでよろしいでしょうか。正式名称があるかないかも何なのかも全然わからないという話でした。私も調べたんですが、これに代わる言葉というのは全く今のところは分かっていません。

発表スライド26
スライド26
 このバチバチという平仮名で検索するとこんな感じです。やっぱり北海道でしかとりあえずなかったのと、研究論文も6件とありますがこれはこのバチバチのことでは全くないものでした。これを議論していくには関係者もそれぞれの小規模館の情報を寄せ集めてどう整理するのかということを議論していくということにせざるを得ないだろうなというふうに思います。

発表スライド27
スライド27
 少し時代が近くなってきますけれどもキーワードとしては“ミシン”なんでしょうけれども、宇仁さんから言葉を拾ったときには“足踏みミシン”という言葉で聞きました。これと“ミシン”だったらどうなるかということで検索をしてみるとこんな感じになります。ミシン自体の研究論文、これもまさにミシンの研究論文ですので非常にたくさんありますので、足踏みの段階と電動化された後の段階がまた別にあるんだと思います。けれども工学系の論文はたくさんありましたが、いわゆる博物館とか歴史的な観点で見るというものについてはもしかしたら少ないかもしれません。ここについては、専門館、ミシンについて専門で集めていらっしゃるところがあるのではないか、そこに議論に入っていただくと、ここまで来たのとは少し違った見方での整理ができるのではないかなと思います。

発表スライド28
スライド28
 これは宇仁さんのところの足踏みミシンですが、東京農工大学の科学博物館にはミシンが数十台あります。有名なコレクションですけれども、そこの学芸員の方とお話したときにこれの専門という人がいないなかなか、これをどうしていいのかが分からないというような問題意識もお持ちでした。それとおそらブラザーとかシンガーといったところのメーカーさんがもしかすると系統的に収集されていらっしゃるかもしれない。ですので、そういったところに入ってもらって全体としてどういうふうにすればいいのかということを議論することが、ミシンの場合には可能なのではないかなというふうに期待しています。

発表スライド29
スライド29
 それから洗濯機。洗濯機は各所で見るんですけれども、やっぱりそんなに数を一館で持っていらっしゃるところはないのだなというふうに今回思います。ただ当然、いわゆる現代の電化製品ですので、型番は非常にたくさんある。

発表スライド30
スライド30
 あとこれが手回し洗濯機といわれる段階。これが絞り器が付いているものですね。二層式があって今のドラム式があってかなり進化してきて、でも全部洗濯機と呼ばれている。このあたりについて言うと、いわゆる型番の豊富さだけではなくて進化が見えるような形のものとして議論する必要があるのかなと思います。

発表スライド31
スライド31
 まとめの段階に入ります。中核館、いわゆる全国を対象に、あるいはある程度のエリアを対象にしているところはメタデータの整備が進んでいらっしゃると思います。そこはどんどん進めていただいてオンライン公開をしていただくと小規模館からはそれを参照して整理をする大きな助けになるのだろうなと思います。ただいくつか申し上げたように、辞書的なこととか、検索のメソッドとかっていうのをもう少し公開していただくと学術的な検索をするときにはありがたいなと思うことがありました。地方館・小規模館はですね、このオンラインでデータベースを全部見てもらうというところに数年でいくかというと、簡単ではないかなというふうに思います。そうなった時、持田さんがおっしゃったように、もうすべてのデータが載っているデータベースがあればそれは一番いいのかもしれませんけども、それに何十年もかかってしまうのであればもう少し話を絞ってより早く効果が出るところにフォーカスしていく必要があるのかなと思います。
 あと一言だけですが、テキスト検索を今回はやりました。けどももう画像検索の技術もどんどん進んでいます。きれいに画像を撮っていただければその画像でどこの博物館にほぼ同じ形のものがあるのかということで検索するということのほうが、もしかすると実現的には早いのではないかなと思うこともあります。このあたりももう少し調べていって、もしかすると、中小規模館について言うとテキストデータのきっちりとしたデータを揃える以上に、写真を先に整備してしまったほうがもしかするとこの用途については早いかもしれないなという気もしています。

発表スライド32
スライド32
 整備をしていくにあたって計画的、段階的に整備をしていっても、効果が出るのはかなり全部揃ってから初めて皆さんが便利だと思われていると思います。これが待てないのが小規模館、地方館だと思います。なるべく早い段階でもうかなり明確な効果が出てしまうというところにフォーカスしてデータの整備をしていくとすると、いくつか申し上げたようなところにシフトするということもあり得るのかなと思います。

発表スライド35
スライド35
発表スライド36
スライド36
 次のステップとしてはワーク1の段階に移りたいのですが、具体的にお願いで言うとぜひ今回お話し聞いた中でうちの間についてもデータを見せていただける、インタビューに1時間・2時間取っていただけるというところがあれば、少し標準的なインタビューのフォーマットを作って情報を収集させていただいてどの資料についてどんな議論をすればいいのかということをもう少し進めていきたいなと思っております。
発表スライド37
スライド37
 連絡先は以上です皆様のご協力をお願いしたいと思います。よろしくお願いします。


トップページ横浜フォーラム2023開催報告
科研費基盤研究C(課題番号:23K00959)助成 Copyright (C) 2024 本間浩一 unisan@m5.dion.ne.jp