フォロー

既存LLMの能力評価に、フューチャーベンンチマーク(未来予想評価指標)を用いる試み。

Claudeが一番よく、他のLLMより詳細なブランチ検索を行い、賛否両論を比較する分析的なアプローチを取る。ただし一番コストがかかる。
youtu.be/eR5c1tmjx-U?si=JNKuDi

ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。