既存LLMの能力評価に、フューチャーベンンチマーク(未来予想評価指標)を用いる試み。
Claudeが一番よく、他のLLMより詳細なブランチ検索を行い、賛否両論を比較する分析的なアプローチを取る。ただし一番コストがかかる。https://youtu.be/eR5c1tmjx-U?si=JNKuDi_VInOhN7Qh
なぜこの手順が必要でしょうか?mstdn.guruはあなたが登録されているサーバーではないかもしれないので、まずあなたのサーバーに転送する必要があります。 アカウントをお持ちではないですか?こちらからサインアップできます
mstdn.guru