AIで沖縄や東北の「方言」「昔話」を復元 東大と仙台文学館の研究チーム 「文化失う前に保存を」


この記事を書いた人 Avatar photo 琉球新報社
仙台文学館に寄贈された古いテープ(研究チーム提供)

 「むかすあっどごぬねぇ(昔々あるところに)」。東京大と仙台文学館の研究チームが19日までに、1960~80年代の古いテープに方言を交えて録音されていた宮城や岩手、福島などの昔話を人工知能(AI)を活用して最新の音声合成技術でよみがえらせた。関わった東大の高道慎之介講師(34)は「話し手の減少やテープの劣化で各地の文化が失われる前にできる限り良い音で残したい」と話している。

 高道さんは熊本県出身。地元でも方言を話す人が減っていることからコンピューターで音声を自在に扱う研究者として何かできることがないかと考えていた。

 まずは沖縄で放送された方言音声の録音テープの復元に取り組んだ。より文化的に価値の高い音声を求め、各地に眠る古い資料を探して仙台市の仙台文学館に行き着いた。

 文学館には在野の昔話採集家が独自に集めた「吉野の石落とし」などの昔話の入った複数のテープなどが膨大に寄贈されていた。その保存に向けた整理を元小学校教師の佐藤照一さん(67)らが手探りで進めていた。寄贈時から一部にカビが生えており、デジタル化も模索していたが、当初は費用面で難航していた。

東京大の高道慎之介講師

 チームはオープンリールテープ88本をデジタル化した。専門の業者に依頼してテープを掃除した後に劣化した音質の改善に取り組んだ。当時の音を復元するため、AIの技術を生かしたプログラムを作成。古い音声を機械学習という手法でコンピューターに学ばせて乱れた音の波形を整えると、こもっていた音が鮮明になった。消えていた高い音域も再現できた。佐藤さんは「聞くことができないと諦めていたので感動があった」と振り返る。音声で内容を確認できたので整理作業にも役立ったという。

 一部については文字に起こした。例えば宮城の人が語った「座頭の坊が井戸に入った話」であれば「昔(むかす)あっどごぬねぇ、んー、とっても親切(しんしぇづ)だげっつも、貧乏(びんぼう)たがりなお百姓(ひゃくしょう)さんあったっだど」といったように文章に直した。

 デジタル化したデータの一部は音声合成や文字起こしの自動化などの技術革新に役立てるため、コーパスと呼ばれるインターネット上の研究者用データベースに昨年12月に公開した。

 「今回の成果がゴールではない」と高道さん。音声もデジタル化していなければ質が悪化して再現が困難になる。「将来的にはチャットGPTのような対話型AIに質問するだけで、日本の地方の文化を世界中のどこでも引き出せるようになればよい」と展望を抱いている。