新しいものから表示

ローカルでLLMできるのってこんなにあるんですね
こうなると、まるでブラウザがエンジンが何って言うのと変わらない様子。

逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説
zenn.dev/yuiseki/articles/d90c

ドストパラの価格表、18種で198,000円〜299,800円

NVIDIA GeForce RTX5080 価格表です!
x.com/dospara_web/status/18849

MSIのはついに水冷搭載かぁ
こういうの買う人は、最初からケース交換も頭に入れてるんだろうな。

モンスターGPUを完璧に冷却!しかも水冷で静かな「MSI GeForce RTX 5090 32G SUPRIM LIQUID SOC」
akiba-pc.watch.impress.co.jp/d

VRユーザーと開発者が知っておきたいNVIDIAとGPU”RTX 50シリーズ”のこと

moguravr.com/nvidia-gpurtx-50-

エジケンさんをまたゲストに呼んで欲しいっす。RP

中国からみたDeepSeekのほうが分析が深い。

・5万個のチップを持っていたという話があるが真実ではない。DeepSeekはコンプライアンスに細心の注意を払っており非準拠のGPUを購入していないためチップの数は少ない。米国のGPUの使用方法は贅沢すぎる。
・追随者が先駆者を追いかけるコストは1/10で済むのが現実。追うものと追われるものの彼我の差は大きい。

後者を冷静に認識してるのが凄味よな…
x.com/kenn/status/188445062683

 蒸留LLMをローカルで動かす試みがあちこちで見られますね。RP

DeepSeek-R1のIQ1_S(1.58bit)をRTX 4090(24GB)で試している。
llama.cppのオプション--n-gpu-layersでロードさせるレイヤー数を指定可能。8レイヤーで23.3GB、これが1枚の限界か。

当然のことながらGPUに乗りきってませんから遅い。だけど、動きはします...。

huggingface.co/unsloth/DeepSe…
x.com/noguchis/status/18848024

1.58-bit DeepSeek-R1を128GB M2 Ultraで動かそうと試行錯誤した結果、(理由はわからないが)面白いことに気がついた。
中途半端にGPUを使うと2tpsしか出ないが、いっそCPUだけを使うようにしたら、むしろ推論速度が速くなり、なぜかメモリ使用量も激減。これならもっと大きなモデルもいけるのでは?
x.com/gosrum/status/1884802296

汎用的な話題は、サーバーのLLMを使った従来型で、専門的な話題は、ローカルのSLMでといった分業がなされていくんでしょうか?

iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用
itmedia.co.jp/aiplus/articles/

【サハロフ佐藤の相場月報】

Core Ultra 200Sの通常版が発売、Ryzenは最大2万円の大幅な値上がり [1月後半のCPU価格]
akiba-pc.watch.impress.co.jp/d

DDR5 24GB×2枚が過去最安の13,990円、DDR5 SO-DIMM 8GB×2枚が3,980円で特売 [1月後半のメモリ価格]
akiba-pc.watch.impress.co.jp/d

「Windows 11」のスタートメニューからiPhoneの各種情報の確認やファイル転送が可能に ー まずは最新のプレビュービルドから
taisy0.com/2025/01/29/208051.h

AIの新フェーズ、NVIDIAがCESで語った「物理AI世界」を深掘りする(西田宗千佳)
moguravr.com/nvidia-keynote-ce

【サハロフ佐藤の相場月報】

リード10GB/sで格安のキオクシア「EXCERIA PLUS G4」が発売、小型のM.2 2230対応2TB SSDが2万円割れ [1月後半のSSD価格]
akiba-pc.watch.impress.co.jp/d

初の26TB HDDがWestern Digitalから販売開始、NAS向けなど上位HDDの一部が値下がり [1月後半のHDD価格]
akiba-pc.watch.impress.co.jp/d

Ryzen AI Max+ 395 のゲーミング性能が判明。APUでデスクトップ向けGeForce RTX 4060 Ti相当の性能に
gazlog.jp/entry/ryzenaimax-395

スマートグラス「XREAL One」レビュー 作業や娯楽に使えるのか?
moguravr.com/xreal-one-review-

自宅で動かしたいっすね。RP

DeepSeek、「ChatGPTやClaudeと同様、サーバーに鎮座するAIに質問を投げられるWebサービス」と見てる人と「Stable DiffusionやLlamaのように自宅のPCでローカルに動かせるAIモデル」と見てる人で結構認識が違うな。後者なら秘密情報が中国に漏洩云々~は関係ないし。
x.com/needle/status/1883846994

これかな?RP

【モデル公開のお知らせ】
DeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLMを公開いたしました。今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります。
x.com/cyberagent_pr/status/188

スレッドを表示

調教と言えば私の頃はボーカロイドだったが今はLLMを調教するのね。RP

【朗報】サイバーエージェントが公開したDeepSeek R1の日本語調教モデル、「1989年6月4日に何があった?」という質問にプロンプト・インジェクションをしなくても答えられる。
x.com/rootport/status/18838184

血圧が測れるファーウェイ「WATCH D2」の精度は? 上腕式血圧計と9日間の計測結果を比較してみた(ジャイアン鈴木)

news.mynavi.jp/article/2025012

中国勢がガンガン来ますねぇ。 RP

【速報】DeepSeek R1に張り合う新モデル「Kimi 1.5」が新たに登場。

注目すべき特徴
・OpenAIのo1に匹敵する結果
・マルチモーダルで高度な連鎖思考推論
・リアルタイムウェブ検索
・完全無料
・チャット回数無制限

出力文を日本語で出力するように促すと日本語で回答してくれます!
x.com/mugu_kagawaai/status/188

それぞれ2014年2016年の製品。

NVIDIAの900シリーズ・10シリーズGPUにサポート終了の気配。今すぐではないが、着実に近づく終了の足音
automaton-media.com/articles/n

古いものから表示
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。