フォロー

ここ2週間くらいのテレカンは音声認識された字幕を修正しながら参加している。補聴器ユーザーのサポートとして。一番の課題は、かぶらないように発話するスキルを全員がもつこと。会議が盛り上がると会話がかぶって認識結果も壊滅的になる。複数人の音声をまとめて認識させてるのが本来はダメなんだけど。あと健聴者が字幕を修正するためなUIが作り込まれてないとリアルタイムの修正は無理ゲー。

· · Tootle for Mastodon · 0 · 0 · 3
ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。