新しいものから表示

今日の散財小説に会話に疑問を感じ、Grokで調査した、モバイル端末におけるローカルLLMの意外な価値。

インフォグラフィック

twitwi_shibata さんがブースト

久しぶりにIKEAに来てみたけど、北欧人のあの体格なのに、あの洗面台やベット、机をは買うんだろうか?
実は、アジア向けの商品ばっかりなんだろうか?

ナノバナナは、自らのデータ内にある情報を用いて画像に変化を与える事は出来るけど、gpt-5のように情報を新たに与えられて、与えられた情報を自ら理解して、新しい画像を"作り出す"というのは苦手。gpt-5の方が応用力ある。

* Anthropicは「AGI pilled」な組織文化を目指しており、これは単に製品開発だけでなく、組織全体がAGI(汎用人工知能)の実現とその影響を深く理解し、それに沿った行動をとることを意味します。
* Amodei氏は、数年以内に「データセンターにいる天才の国」が実現すると予測し、それが経済や科学、そして社会全体に大きな影響を与えると考えています。

モデル開発のコストと収益の関係を、新しい会社を次々と設立するようなものだと例え、初期の赤字は将来の大きな収益のための先行投資である。
* 「モデルごとの損益を個別の会社と見なせば、モデルは実際に収益を上げている」と述べています。

twitwi_shibata さんがブースト

オープンソースモデル(またはオープンウェイトモデル)の台頭について触れ、AIモデルにおける「オープンソース」の意味合いが、従来のソフトウェアとは異なる。モデルの重みを見ても、その内部構造を完全に理解したり、容易に改変したりすることは難しいと説明。

AIの進化には、過去に「AIは推論できない」「新しい発見はできない」「グローバルに一貫した文章は書けない」といった「壁」と思われていたものが、次々と突破されてきた歴史があると指摘しています。

「AIモデルは発見を常にしている」と断言し、医療分野でのAIによる診断例を挙げています。

youtu.be/GcqQ1ebBqkc?si=Unx-TK

僕らの氷川きよしちゃんが、24時間テレビに出演してる。グリスも付けてる

八王子市の自動運転バスが衝突事故。僕乗ってました ※実証実験中

運転手さんのハンドルとブレーキが効かないなんて、そんなことあるのかな?別系統になってると思うのだけど。
murauchi.muragon.com/entry/342

Googleは**「マルチターン編集」**というワークフローをナノ・バナナで、推奨しており、一度に複数の編集を求めるのではなく、一段階ずつ行うことでモデルがより正確に機能することをデモンストレーションしました。例えば、空の部屋に本棚、ソファ、コーヒーテーブルを一つずつ追加していく様子が示されました。

しかし、OpenAIのリーカーであるJimmy Applesが指摘するように、Flashは「複雑なアイデアにはイライラするほど単純なモデル」という側面も持ち合わせています。批評家であるPrinceは、シェイクスピアやナボコフに関するプロンプトを与えた際に内部的な世界知識の欠如から、テキスト生成が不正確になることや、大量のテキストをうまく扱えないことを指摘しました。
youtu.be/-6NKS3eJAYE?si=ElSY5p

Pixel 10/Pro Review:

「良いニュースと悪いニュース」としてPixel 10を紹介し、

良いニュースは「まだPixelらしい」点、悪いニュースは「まだPixelらしい」点だと述べています。

総合的に、Pixelのファンとして好意的ですが、Googleの戦略への懐疑が深く、視聴者に公平な視点を提供

youtu.be/i63u-iAnhuk?si=-CRI6W

確かに早い。

Apple releases FastVLM and MobileCLIP2 on Hugging Face!

The models are up to 85x faster and 3.4x smaller than previous work, enabling real-time VLM applications!
x.com/xenovacom/status/1961454

本田さんのApple 秋のイベント予想
自作LLMスライド作成。

古いものから表示
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。