ライブスピーチとパーソナルボイスによる高度なスピーチアクセシビリティは、
https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/
Machine Learning Research at Appleで研究発表された多くの論文が活用されてる感じがする。
https://machinelearning.apple.com/
視覚音声認識における唇の調音の役割について
音声からの自然な頭の動きの生成
音声感情分析のための事前トレーニングされたモデル表現とノイズに対する堅牢性
吃音のある人が音声認識をより有効に活用できるようにする
制御可能な音声合成を使用した ASR モデルのパーソナライズ