新しいものから表示

メタのLlama 4が何万トークンになろうが、あんまり魅力ない

ETCレーンが使用不可の中部高速道路
システム障害

- **従来のAIベンチマークの限界**:
- コーディングコンペでの上位入賞など、特定のタスクに特化したベンチマークは、実際の社会での有用性とは必ずしも一致しない。
- 会社での業務に使えるレベルには達していないという現場の声がある。

- **METR(モデルエバリューション&サーチ)の提案**:
- 人間の専門家が通常かかる時間で測られるタスクのうち、AIが50%の確率で完了できるタスクの長さを指標
- AIのタスク時間ホライゾンは指数関数的に成長

- 論理的思考力の向上、ツール仕様の改善(PythonやBashなどの利用)、失敗からの回復力の向上、状況認識の改善、自分の限界やタスク要求の理解。
youtu.be/rEV9eCwHEEc?si=mdHzXt

日本人夫婦の半数がセックスレス 「パパ、ママ」と呼ぶのはやめよう
asahi.com/articles/AST4222TYT4

Claudeと他のLLMのコード生成で違いがあるのは、たぶんClaudeは、実行中に"自動で"設計もしくは仕様を決めてから、コード生成している感じがする。

サンノゼの日系スーパーには、生クリーム入り大福も、滋賀県産の精米も売ってるのね。おにぎりも弁当も売ってる。

youtu.be/JSr8gyVuww0?si=kssGjM

キンドル内の本の要約機能、ロンチ。
アメリカだけ。

Dive back into Kindle book series with the new 'Recaps' feature now available
aboutamazon.com/news/books-and

へー、Microsoftの珍しい光景。

Three Microsoft CEOs walk into a room on Microsoft’s 50th anniversary … and are interviewed by Copilot!
x.com/satyanadella/status/1908

- VS Codeユーザー向けにエージェントモードが導入され、AIエージェントが開発者のニーズを予測し、創造性を支援する様子が説明されています。
- Foundryで独自のAIエージェントを構築できる「エージェントファクトリー」が紹介され、AI開発の民主化を推進するマイクロソフトの取り組みが示されています。
- GitHub Sparkを通じて、一般の人々がAIを使って開発したアプリの例を紹介し、AIが社会に貢献する可能性を示唆しています。
youtu.be/5snOg61k8bE?si=3rDCvt

- GitHub Copilotの進化を具体的に示し、コード補完からチャット、マルチファイル編集、そしてAIエージェントへと進化していることを説明しています。
- CEOがCopilotを用いてMicrosoft初の製品であるAltair BASICのエミュレーターを再構築するデモンストレーションを行い、AIの能力を視覚的に示しています。
- 「インテリジェンスがコモディティ化された」と述べ、CEOがコーディングできるようになったことを例に、AIが誰でも利用できるようになったことを強調しています。

ケイシーmagicで、任天堂switch2を撮ると、こうもオシャレになるのね。

スーパーワタレックプログラムも、こう編集できたらいいのに。
youtu.be/AjKGToaFDvA?si=Q4JVuA

APIを使用して、現在地点の天気を表示するHTMLコードを生成させるると、ClaudeとGrok3は一発で表示できたけど、Gemini2.5Proだけは何度もエラーとなるコードを出力させてしまう・・・。

テレビ神奈川の新番組、ココホリケンケン。
オズポケ3で撮影したロケ映像を使ってる。
ハリケンの地元、横須賀市を歩く。
tvk-yokohama.com/company/news/

古いものから表示
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。