AI News & Articles

歡迎來到 Kuma 的 AI 翻譯文章專區

文章列表

2026-04-04

・ OpenAI 首次收購媒體公司：矽谷最紅科技脫口秀 TBPN 易主

OpenAI 宣布收購科技業界脫口秀 TBPN，這是這家 AI 巨頭首度跨入媒體版圖。TBPN 將保有編輯獨立性，由 OpenAI 策略長 Chris Lehane 管轄，此舉引發外界對 AI 輿論生態的廣泛討論。

・ Gemma 4 發布：Google 最強開源模型，全面轉向 Apache 2.0 授權

Google DeepMind 正式推出 Gemma 4 系列開源模型，包含 2B 到 31B 四種尺寸，首度採用 Apache 2.0 授權。新一代模型在推理能力、代理工作流與多模態處理上取得重大突破，並針對行動端與物聯網裝置進行深度優化。

・ Dynin-Omni：首個基於掩碼擴散（Masked Diffusion）的全模態基礎模型

首個基於掩碼擴散架構的全模態（Omnimodal）基礎模型 Dynin-Omni 正式發布，統一了文本、圖像、視頻與語音的理解與生成，標誌著生成式 AI 從自回歸範式向更高效擴散架構的重大轉型。

2026-04-03

・ PrismML 發布全球首款商用 1-Bit LLM：Bonsai 8B 讓 AI 模型縮小 14 倍、速度提升 8 倍

PrismML 推出首款商用 1-bit LLM『Bonsai 8B』，將 80 億參數模型壓縮至 1.15GB，速度提升 8 倍且能耗降低 80%，實現邊緣裝置運行強大 AI 的突破。

・微軟發佈三款 MAI 多模態模型：看、聽、說一站式解決方案

微軟推出 MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 三款模型，主打語音辨識、語音生成與圖像生成，瞄準企業級市場。

・用 LLM 打造個人知識庫：Karpathy 的實戰工作流

AI 大神 Karpathy 分享如何用 LLM + Obsidian 建立個人知識庫，反駁「小規模不需要 RAG」的直覺，強調 LLM 自己維護結構比預設 fancy tool 更有性價比。

・ Google 發布 Gemma 4 開放模型：從樹莓派到工作站，每參數智慧再創新高

Google DeepMind 推出 Gemma 4 四款開放模型，基於 Gemini 3，支援多模態輸入與 256K 上下文，Apache 2.0 授權，覆蓋邊緣到伺服器全場景。

2026-04-02

・ vLLM 2026：驅動生產級 AI 大規模部署的開源 LLM 推論引擎

vLLM 以 PagedAttention 突破記憶體瓶頸，Model Runner V2 吞吐量提升 56%，成為開源 LLM 推論標準框架。

・ Runway 砸 1000 萬美元投資 AI 新創，想把影片模型變成整個生態系

Runway 砸 1000 萬美元成立創投基金，鎖定早期 AI、媒體與世界模擬新創，同步推出 Builders 計畫提供 50 萬 API credits。

・ Mistral 推出 Voxtral TTS：4B 參數、9 種語言、企業級語音生成

Mistral 發布首款 TTS 模型 Voxtral TTS，4B 參數、9 種語言、情緒感知與低延遲串流，定價每千字 $0.016，Hugging Face 開放權重版本已上架。

・微軟 Copilot 引入多 AI 協作：GPT 與 Claude 相互驗證，向「合議制」進化

微軟為 Copilot 引入「Critique」功能，由 GPT 生成、Claude 驗證，打造多 AI 相互把關的協作架構，並支援多模型並列比較的「Council」模式。

・長時間運行應用開發的 Harness 設計

Anthropic 工程師用 GAN 啟發的三代理架構突破 AI 編碼瓶頸：規劃器 + 生成器 + 評估器，實現多小時無人介入的全端開發。

・ 2026 年 Claude Code 原始碼大外洩：意外、失控、還是 AI 史上最成功的公關操作？

Anthropic 因錯誤的 .npmignore 設定，導致 59.8 MB 的 source map 被上傳至 npm，512,000 行 TypeScript 程式碼與 44 個隱藏功能旗標就此曝光。

・從層級到智能：AI 將取代中層管理，Block 正在重寫企業組織 2000 年的運作邏輯

Jack Dorsey 與 Sequoia 聯名主張 AI 取代資訊路由。Block 裁員 4000 人，以「世界模型」取代中層管理，重寫組織運作邏輯。

・ 8.1 萬人想要的 AI，是讓生活變好

Anthropic 對 80,508 名 Claude 使用者做了史上最大規模的多語質性訪談，整理出人們對 AI 的九大期待與六種已經發生的回饋。

2026-04-01

・ OpenAI 完成史上最大規模融資：1220 億美元、估值 8520 億，IPO 前的最後衝刺

OpenAI 正式宣布完成 1220 億美元的融資，估值衝上 8520 億美元，並透露其每月營收已達 20 億美元。這筆資金將用於晶片、資料中心與 Coding Agent 研發，標誌著 OpenAI 邁向 IPO 與超大應用（Superapp）轉型的關鍵時刻。

・ Claude Dispatch 與介面的力量：AI 的瓶頸從來不是模型

Ethan Mollick 指出 AI 的瓶頸在介面而非模型。聊天機器人造成認知負擔，Claude Cowork + Dispatch 代表新的代理介面方向。

2026-03-31

・ Perplexity 把語音代理做到每月數百萬次會話後，學到的 4 個硬道理

Perplexity 分享語音代理實戰：context 分塊增量、音訊標準化、VAD 抗噪音、工具輸出保持 in-distribution。

・ 2026 年 3 月 LLM 版圖回顧：GPT-5.4 並列第一，但真正的故事在別處

2026 年 3 月 LLM 版圖：GPT-5.4 並列榜首，MoE 架構成主流，Mistral Small 4 以 6.5B 活躍參數展現效率。

・ AI 時代科技圈最後 4 種工作？其實更值得看的是 coding agent 基礎設施之戰

AI coding agent 最新戰況：harness 競賽、本地推論崛起、模型廠商與工具鏈整合，真正的主線是部署與工作流模式的創新。

・ Claude Code 創辦人點名 15 個被低估的功能：從寫程式助手走向可持續運作的開發系統

Claude Code 創辦人 Boris Cherny 分享 15 個被低估的功能，涵蓋手機端、遠端接手、定時自動化、hooks、worktrees、batch 與語音編程。

・中國 LLM 版圖 2026：模型、產品與生態系統正在重新排序

中國 LLM 版圖多層重構：ByteDance 靠分發稱霸消費者層，Qwen 與 DeepSeek 在開源圈引領風潮，下個戰場是誰成為 Claude Code 預設後端。

・ Anthropic 史上最大規模資料外洩：待發布的 Claude Mythos 完整曝光，Capybara 新 tier 確認存在

Anthropic CMS 設定錯誤，意外暴露近 3,000 份內部文件。新 tier Capybara 將居於 Opus 之上，被形容為「step change」與公司史上最強。

・ AI 代理可能讓自由軟體再次重要：當『能不能被代理改造』成為新採購標準

George London 主張，AI coding agent 正把自由軟體從程式人的抽象權利，變成一般使用者也能實際行使的客製化能力。

2026-03-13

・兩個月 21,000 顆星：Vercel 的 agent-browser 為什麼讓 AI 工程師瘋狂？

agent-browser 兩個月衝破 21,000 星，真正戳中的不是 browser automation，而是 agentic coding 最痛的驗證瓶頸。

2026-02-19

・建構 Claude Code 學到的教訓：Prompt Caching 就是一切

Anthropic 分享 Claude Code 的 prompt caching 架構心得：前綴匹配、快取命中率監控，以及常見的快取失效陷阱。

・用 Evaluation Flywheel 打造更穩健的 Prompt

OpenAI Cookbook 提出 Evaluation Flywheel 方法：透過分析、量測、改進的迭代循環，系統化打造穩健的 prompt。

2026-02-15

・個人全景監獄：用 Claude Code 管理整個人生

用 Claude Code 建立 8 個平行 agent 全面自動化生活，從一夜打造千萬人使用的工具到父母學會命令列的真實故事。

・ Claude Opus 4.6 思維更聰明、xAI 加入 SpaceX、AI 超越醫生、標準化 AI 審計

The Batch 本週重點：Claude Opus 4.6 推理能力躍進、xAI 與 SpaceX 合作、AI 診斷超越醫生、標準化 AI 審計框架。

AI News & Articles

文章列表

2026-04-04

・ OpenAI 首次收購媒體公司：矽谷最紅科技脫口秀 TBPN 易主

・ Gemma 4 發布：Google 最強開源模型，全面轉向 Apache 2.0 授權

・ Dynin-Omni：首個基於掩碼擴散（Masked Diffusion）的全模態基礎模型

2026-04-03

・ PrismML 發布全球首款商用 1-Bit LLM：Bonsai 8B 讓 AI 模型縮小 14 倍、速度提升 8 倍

・ 微軟發佈三款 MAI 多模態模型：看、聽、說一站式解決方案

・ 用 LLM 打造個人知識庫：Karpathy 的實戰工作流

・ Google 發布 Gemma 4 開放模型：從樹莓派到工作站，每參數智慧再創新高

2026-04-02

・ vLLM 2026：驅動生產級 AI 大規模部署的開源 LLM 推論引擎

・ Runway 砸 1000 萬美元投資 AI 新創，想把影片模型變成整個生態系

・ Mistral 推出 Voxtral TTS：4B 參數、9 種語言、企業級語音生成

・ 微軟 Copilot 引入多 AI 協作：GPT 與 Claude 相互驗證，向「合議制」進化

・ 長時間運行應用開發的 Harness 設計

・ 2026 年 Claude Code 原始碼大外洩：意外、失控、還是 AI 史上最成功的公關操作？

・ 從層級到智能：AI 將取代中層管理，Block 正在重寫企業組織 2000 年的運作邏輯

・ 8.1 萬人想要的 AI，是讓生活變好

2026-04-01

・ OpenAI 完成史上最大規模融資：1220 億美元、估值 8520 億，IPO 前的最後衝刺

・ Claude Dispatch 與介面的力量：AI 的瓶頸從來不是模型

2026-03-31

・ Perplexity 把語音代理做到每月數百萬次會話後，學到的 4 個硬道理

・ 2026 年 3 月 LLM 版圖回顧：GPT-5.4 並列第一，但真正的故事在別處

・ AI 時代科技圈最後 4 種工作？其實更值得看的是 coding agent 基礎設施之戰

・ Claude Code 創辦人點名 15 個被低估的功能：從寫程式助手走向可持續運作的開發系統

・ 中國 LLM 版圖 2026：模型、產品與生態系統正在重新排序

・ Anthropic 史上最大規模資料外洩：待發布的 Claude Mythos 完整曝光，Capybara 新 tier 確認存在

・ AI 代理可能讓自由軟體再次重要：當『能不能被代理改造』成為新採購標準

2026-03-30

・ OpenAI 收購 Astral：uv、Ruff 背後的公司將加入 Codex 生態

・ Mr. Chatterbox：用維多利亞時代文本訓練的 340M 模型，能在你的電腦上跑了

・ 分分秒秒：我用 Claude Code 即時破解 LiteLLM PyPI 供應鏈攻擊

・ 衡量 AGI 進展：Google DeepMind 的認知分類框架

・ Copilot 悄悄在你的 PR 裡塞廣告：AI 工具的「腐化」時刻到了嗎？

・ 認知黑暗森林：AI 時代，你的每一個想法都在餵養吃掉你的怪物

・ 你打字之前，Cloudflare 已讀完你的 React 狀態：我解密了那支程式

2026-03-29

・ 別再叫它記憶：每一篇「AI + Obsidian」教學的根本問題

・ 當 AI 成為你的應聲蟲：Stanford 大規模研究發現 11 款 LLM 普遍過度肯定用戶

・ OpenAI 如何監控內部 Coding Agent 的錯位行為

・ OpenAI Model Spec 的哲學與機制：他們如何決定 ChatGPT 的行為邊界

・ Google TurboQuant：用極致壓縮重新定義 AI 效率

2026-03-13

・ 兩個月 21,000 顆星：Vercel 的 agent-browser 為什麼讓 AI 工程師瘋狂？

2026-02-19

・ 建構 Claude Code 學到的教訓：Prompt Caching 就是一切

・ 用 Evaluation Flywheel 打造更穩健的 Prompt

2026-02-15

・ 個人全景監獄：用 Claude Code 管理整個人生

・ Claude Opus 4.6 思維更聰明、xAI 加入 SpaceX、AI 超越醫生、標準化 AI 審計

・微軟發佈三款 MAI 多模態模型：看、聽、說一站式解決方案

・用 LLM 打造個人知識庫：Karpathy 的實戰工作流

・微軟 Copilot 引入多 AI 協作：GPT 與 Claude 相互驗證，向「合議制」進化

・長時間運行應用開發的 Harness 設計

・從層級到智能：AI 將取代中層管理，Block 正在重寫企業組織 2000 年的運作邏輯

・中國 LLM 版圖 2026：模型、產品與生態系統正在重新排序

・分分秒秒：我用 Claude Code 即時破解 LiteLLM PyPI 供應鏈攻擊

・衡量 AGI 進展：Google DeepMind 的認知分類框架

・認知黑暗森林：AI 時代，你的每一個想法都在餵養吃掉你的怪物

・你打字之前，Cloudflare 已讀完你的 React 狀態：我解密了那支程式

・別再叫它記憶：每一篇「AI + Obsidian」教學的根本問題

・當 AI 成為你的應聲蟲：Stanford 大規模研究發現 11 款 LLM 普遍過度肯定用戶

・兩個月 21,000 顆星：Vercel 的 agent-browser 為什麼讓 AI 工程師瘋狂？

・建構 Claude Code 學到的教訓：Prompt Caching 就是一切

・用 Evaluation Flywheel 打造更穩健的 Prompt

・個人全景監獄：用 Claude Code 管理整個人生