フォロー

そんなこともできるのね。Gemini

- **空間理解とドキュメント理解**: Geminiの空間理解能力(2D/3Dバウンディングボックス、セグメンテーションマスク生成など)は、ロボティクスなどの分野で重要視されています。また、ドキュメント理解は、情報の多くがドキュメントに格納されているため、非常に需要の高いユースケースです。Geminiは、レイアウトを維持したまま文字起こし(layout preserving transcription)を行い、複雑な表や図を含むドキュメントを人間のように読み解き、分析することができます。
youtu.be/K4vXvaRV0dw?si=F0VEhc

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。