フォロー

ライブスピーチとパーソナルボイスによる高度なスピーチアクセシビリティは、
apple.com/newsroom/2023/05/app

Machine Learning Research at Appleで研究発表された多くの論文が活用されてる感じがする。
machinelearning.apple.com/

視覚音声認識における唇の調音の役割について
音声からの自然な頭の動きの生成
音声感情分析のための事前トレーニングされたモデル表現とノイズに対する堅牢性
吃音のある人が音声認識をより有効に活用できるようにする
制御可能な音声合成を使用した ASR モデルのパーソナライズ

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。