機械学習で物体認識できるなら、表示された猫画像を判定したとき「ニャー。これは猫の画像です」とアナウンスさせると良いのではないか?という発想を思い付いた
これら代替音声のフォーマットはOpusで低遅延モードがおそらくは最適だ
ていうかemojiならばもっと簡単に代替音声流せるわ
ただ、🤔あたりは「umm...」という代替音声を簡単に決めることができるけど、😠😡💢あたりの微妙なニュアンスの違いをどうするのかという懸念はある(まぁまるっとすべてAngryってアナウンスさせりゃ良いという考え方もあるけど)