Google Labのひと
- Whiskは消費者向け、FlowはプロのAI映画制作者向けに、それぞれ異なるレベルのツールを提供している。
- VO3モデルは、物理法則や音声生成において大きな進歩を遂げているが、キャラクターの一貫性やシーン間の連携にはまだ課題がある。
- MarinerはGeminiのマルチモーダル機能を活用し、ユーザーのタスクを理解し、計画を立て、スクリーンショットを解析してタスクを実行する。複数のタスクを同時に実行させることができ、タスクの進捗状況を監視したり、必要に応じて介入したりできる。
https://youtu.be/exuuGrbaxxc?si=g-vH1t_NukTZSBSa