遊びたいの?怒ってるの?犬の吠えている鳴き声をAIで解読する試み

[画像を見る]
アメリカの研究チームは今、AIにイヌが吠えている時の鳴き声を解読させ、彼らが人間に何を訴えているのか明らかにしようとしている。
突然イヌに吠えられてびっくりした、こんな経験はないだろうか? 犬に慣れていない人にとっては怖いかもしれないが、じつはその子は遊ぼうよと誘っていたのかもしれない。
ミシガン大学の研究チームがAIに解読させようとしているのは、そんなふうに誤解されがちな犬の吠え方の意味だ。
そのAIはもともと人間の言語用に開発されたものだが、従来のイヌ用モデルよりずっと正確に、遊びと攻撃の吠え声を区別し、さらにはイヌの年齢や犬種、性別までも識別できるという。
・犬が吠えている時、何を伝えたいのか?
犬や猫のように身近な動物から、ちょっと危険な肉食動物まで、彼らは鳴き声で何かを伝えているが、人間にとって彼らが何を言いたいのかを正確に理解するのは難しい。だがAIの進歩がそれを可能にするかもしれない。
ミシガン大学のコンピュータ科学者ラダ・ミハルチェア氏は、「人間の声で訓練された音声処理モデルとこれまでの成果を活用することで、犬の吠え声のニュアンスを理解する新たな可能性の扉が開きました」と語る。
動物の声を解読するAIモデルの開発が難しい理由の1つは、データが少ないことだ。人間の声を録音したものならたくさんあるが、動物の鳴き声のデータを集めるのはずっと大変だ。
ペットや家畜ならば飼い主の許可を得なければいけないし、野生動物なら自然の中に分け入っていかねばならない。しかもそうやって会いに行ったところで、彼らが録音に協力的である可能性はほとんどない。
[画像を見る]
photo by Pixabay・人間の音声用AIで犬の声を分析
そこでミハルチェア氏ら研究チームは、こうした犬の声のデータ不足を克服するために、もともと人間の音声を分析するために設計されたAIモデルを応用できないかと考えた。するとそれが思いの外うまく行ったのだ。
そうしたAIモデルは、音声テキスト変換や言語翻訳など、さまざまな音声技術のバックボーンとなっているもので、口調・高さ・アクセントなど、人間の声の細いニュアンスを区別するように訓練されている。
つまりは、人間が話す言葉のとんでもなく複雑なパターンを学習し、符号化することができるのだ。
今回の研究では、特に「Wav2Vec2」という人間用AIモデルで、犬の吠え声の解読に挑戦している。
ただしそのままでは使えないので、犬種・年齢・性別がさまざまな74頭の犬がさまざまな状況で発した鳴き声を録音し、このデータでAIを訓練し直した。
[画像を見る]
photo by Unsplash・犬の吠え声を4つに分類することに成功
その結果、AIは遊びの吠え声と攻撃の吠え声を区別するなど、4つの分類タスクに成功した。
驚いたことに、その元人間用AIは、最初から犬用に作られていた既存のモデルよりも優れていたという。
人間の音声に最適化された技術が、動物のコミュニケーションの解読に役立てられた初めての例です(ミハルチェア氏)この結果は、人間の声に含まれる音とパターンが、動物の鳴き声のようなまた別の音声パターンを分析するベースになることを示しているとのことだ。
こうしたツールは、生物学者や動物行動学者などに便利なのはもちろんのこと、犬をはじめとする動物たちが気持ちやニーズを理解することで、彼らの幸せを守ることにもつながるだろう。
この研究は『Joint International Conference on Computational Linguistics, Language Resources and Evaluation(数理言語学・言語資源・評価に関する合同国際会議)』で発表された。論文の未査読版は『arXiv』(2024年4月29日付)で閲覧できる。
References:Using AI to decode dog vocalizations | University of Michigan News / AI Decodes Dog Barks: Playful or Aggressive? - Neuroscience News / written by hiroching / edited by / parumo
『画像・動画、SNSが見れない場合はオリジナルサイト(カラパイア)をご覧ください。』