AI Articles

AI 領域精選文章翻譯

View the Project on GitHub Kumazan/ai-articles

AI News & Articles

歡迎來到 Kuma 的 AI 翻譯文章專區

文章列表

2026-04-04

OpenAI 首次收購媒體公司:矽谷最紅科技脫口秀 TBPN 易主

OpenAI 宣布收購科技業界脫口秀 TBPN,這是這家 AI 巨頭首度跨入媒體版圖。TBPN 將保有編輯獨立性,由 OpenAI 策略長 Chris Lehane 管轄,此舉引發外界對 AI 輿論生態的廣泛討論。

Gemma 4 發布:Google 最強開源模型,全面轉向 Apache 2.0 授權

Google DeepMind 正式推出 Gemma 4 系列開源模型,包含 2B 到 31B 四種尺寸,首度採用 Apache 2.0 授權。新一代模型在推理能力、代理工作流與多模態處理上取得重大突破,並針對行動端與物聯網裝置進行深度優化。

Dynin-Omni:首個基於掩碼擴散(Masked Diffusion)的全模態基礎模型

首個基於掩碼擴散架構的全模態(Omnimodal)基礎模型 Dynin-Omni 正式發布,統一了文本、圖像、視頻與語音的理解與生成,標誌著生成式 AI 從自回歸範式向更高效擴散架構的重大轉型。

2026-04-03

PrismML 發布全球首款商用 1-Bit LLM:Bonsai 8B 讓 AI 模型縮小 14 倍、速度提升 8 倍

PrismML 推出首款商用 1-bit LLM『Bonsai 8B』,將 80 億參數模型壓縮至 1.15GB,速度提升 8 倍且能耗降低 80%,實現邊緣裝置運行強大 AI 的突破。

微軟發佈三款 MAI 多模態模型:看、聽、說一站式解決方案

微軟推出 MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 三款模型,主打語音辨識、語音生成與圖像生成,瞄準企業級市場。

用 LLM 打造個人知識庫:Karpathy 的實戰工作流

AI 大神 Karpathy 分享如何用 LLM + Obsidian 建立個人知識庫,反駁「小規模不需要 RAG」的直覺,強調 LLM 自己維護結構比預設 fancy tool 更有性價比。

Google 發布 Gemma 4 開放模型:從樹莓派到工作站,每參數智慧再創新高

Google DeepMind 推出 Gemma 4 四款開放模型,基於 Gemini 3,支援多模態輸入與 256K 上下文,Apache 2.0 授權,覆蓋邊緣到伺服器全場景。

2026-04-02

vLLM 2026:驅動生產級 AI 大規模部署的開源 LLM 推論引擎

vLLM 以 PagedAttention 突破記憶體瓶頸,Model Runner V2 吞吐量提升 56%,成為開源 LLM 推論標準框架。

Runway 砸 1000 萬美元投資 AI 新創,想把影片模型變成整個生態系

Runway 砸 1000 萬美元成立創投基金,鎖定早期 AI、媒體與世界模擬新創,同步推出 Builders 計畫提供 50 萬 API credits。

Mistral 推出 Voxtral TTS:4B 參數、9 種語言、企業級語音生成

Mistral 發布首款 TTS 模型 Voxtral TTS,4B 參數、9 種語言、情緒感知與低延遲串流,定價每千字 $0.016,Hugging Face 開放權重版本已上架。

微軟 Copilot 引入多 AI 協作:GPT 與 Claude 相互驗證,向「合議制」進化

微軟為 Copilot 引入「Critique」功能,由 GPT 生成、Claude 驗證,打造多 AI 相互把關的協作架構,並支援多模型並列比較的「Council」模式。

長時間運行應用開發的 Harness 設計

Anthropic 工程師用 GAN 啟發的三代理架構突破 AI 編碼瓶頸:規劃器 + 生成器 + 評估器,實現多小時無人介入的全端開發。

2026 年 Claude Code 原始碼大外洩:意外、失控、還是 AI 史上最成功的公關操作?

Anthropic 因錯誤的 .npmignore 設定,導致 59.8 MB 的 source map 被上傳至 npm,512,000 行 TypeScript 程式碼與 44 個隱藏功能旗標就此曝光。

從層級到智能:AI 將取代中層管理,Block 正在重寫企業組織 2000 年的運作邏輯

Jack Dorsey 與 Sequoia 聯名主張 AI 取代資訊路由。Block 裁員 4000 人,以「世界模型」取代中層管理,重寫組織運作邏輯。

8.1 萬人想要的 AI,是讓生活變好

Anthropic 對 80,508 名 Claude 使用者做了史上最大規模的多語質性訪談,整理出人們對 AI 的九大期待與六種已經發生的回饋。

2026-04-01

OpenAI 完成史上最大規模融資:1220 億美元、估值 8520 億,IPO 前的最後衝刺

OpenAI 正式宣布完成 1220 億美元的融資,估值衝上 8520 億美元,並透露其每月營收已達 20 億美元。這筆資金將用於晶片、資料中心與 Coding Agent 研發,標誌著 OpenAI 邁向 IPO 與超大應用(Superapp)轉型的關鍵時刻。

Claude Dispatch 與介面的力量:AI 的瓶頸從來不是模型

Ethan Mollick 指出 AI 的瓶頸在介面而非模型。聊天機器人造成認知負擔,Claude Cowork + Dispatch 代表新的代理介面方向。

2026-03-31

Perplexity 把語音代理做到每月數百萬次會話後,學到的 4 個硬道理

Perplexity 分享語音代理實戰:context 分塊增量、音訊標準化、VAD 抗噪音、工具輸出保持 in-distribution。

2026 年 3 月 LLM 版圖回顧:GPT-5.4 並列第一,但真正的故事在別處

2026 年 3 月 LLM 版圖:GPT-5.4 並列榜首,MoE 架構成主流,Mistral Small 4 以 6.5B 活躍參數展現效率。

AI 時代科技圈最後 4 種工作?其實更值得看的是 coding agent 基礎設施之戰

AI coding agent 最新戰況:harness 競賽、本地推論崛起、模型廠商與工具鏈整合,真正的主線是部署與工作流模式的創新。

Claude Code 創辦人點名 15 個被低估的功能:從寫程式助手走向可持續運作的開發系統

Claude Code 創辦人 Boris Cherny 分享 15 個被低估的功能,涵蓋手機端、遠端接手、定時自動化、hooks、worktrees、batch 與語音編程。

中國 LLM 版圖 2026:模型、產品與生態系統正在重新排序

中國 LLM 版圖多層重構:ByteDance 靠分發稱霸消費者層,Qwen 與 DeepSeek 在開源圈引領風潮,下個戰場是誰成為 Claude Code 預設後端。

Anthropic 史上最大規模資料外洩:待發布的 Claude Mythos 完整曝光,Capybara 新 tier 確認存在

Anthropic CMS 設定錯誤,意外暴露近 3,000 份內部文件。新 tier Capybara 將居於 Opus 之上,被形容為「step change」與公司史上最強。

AI 代理可能讓自由軟體再次重要:當『能不能被代理改造』成為新採購標準

George London 主張,AI coding agent 正把自由軟體從程式人的抽象權利,變成一般使用者也能實際行使的客製化能力。

2026-03-30

OpenAI 收購 Astral:uv、Ruff 背後的公司將加入 Codex 生態

OpenAI 收購 Astral,將 uv、Ruff、ty 等 Python 開源工具整合進 Codex 生態,顯示 AI 開發賽道從寫程式走向管理整個工具鏈。

Mr. Chatterbox:用維多利亞時代文本訓練的 340M 模型,能在你的電腦上跑了

用 28,000 本維多利亞時代書籍、29.3 億 tokens 訓練的 340M 小模型,Simon Willison 實際跑過結論是「很弱,但很有趣」。

分分秒秒:我用 Claude Code 即時破解 LiteLLM PyPI 供應鏈攻擊

LiteLLM 1.82.8 被植入惡意程式,46 分鐘近 47,000 次下載。作者與 Claude Code 即時對話實錄,記錄從發現到公開揭露的過程。

衡量 AGI 進展:Google DeepMind 的認知分類框架

Google DeepMind 以認知科學為基礎建立 AGI 評估框架,識別 10 項核心能力,並與 Kaggle 合辦 20 萬美元黑客松。

Copilot 悄悄在你的 PR 裡塞廣告:AI 工具的「腐化」時刻到了嗎?

Copilot 被發現自動在用戶 PR 插入 Raycast 廣告,引爆 HN 討論。微軟緊急停用,但 AI 工具「腐化曲線」爭議持續。

認知黑暗森林:AI 時代,你的每一個想法都在餵養吃掉你的怪物

AI 時代,公開你的想法可能正在餵養吃掉你的怪物。借用《黑暗森林》理論,探討 AI 如何將整個網路變成吸收創新者的認知黑洞。

你打字之前,Cloudflare 已讀完你的 React 狀態:我解密了那支程式

研究者逆向工程 ChatGPT 的 Cloudflare Turnstile 機制,解密 377 支程式後發現:每次輸入前都會蒐集 55 個瀏覽器屬性,包含 GPU、字型、地理位置,甚至 React 應用程式的內部狀態——機器人防護已進化到應用層。

2026-03-29

別再叫它記憶:每一篇「AI + Obsidian」教學的根本問題

為什麼用 Obsidian markdown 當 AI 記憶系統是根本性的誤解——資料庫存知識、markdown 存指令,別搞混。

當 AI 成為你的應聲蟲:Stanford 大規模研究發現 11 款 LLM 普遍過度肯定用戶

Stanford 測試 11 款 LLM 的個人建議回應,發現多數模型的肯定率高於人類基準,AI 諂媚源自 RLHF 訓練結構而非偶然。

OpenAI 如何監控內部 Coding Agent 的錯位行為

OpenAI 用 GPT-5.4 驅動的即時監控系統,偵測內部 coding agent 的錯位行為,五個月內分析數千萬條軌跡。

OpenAI Model Spec 的哲學與機制:他們如何決定 ChatGPT 的行為邊界

深入解析 OpenAI Model Spec 的哲學與機制:指令鏈架構、不可覆寫紅線,以及與 Anthropic Constitution 的差異。

Google TurboQuant:用極致壓縮重新定義 AI 效率

Google TurboQuant 將 LLM 的 KV Cache 壓縮 6 倍,零精度損失、免重訓練,社群已推出三種開源實作。

2026-03-13

兩個月 21,000 顆星:Vercel 的 agent-browser 為什麼讓 AI 工程師瘋狂?

agent-browser 兩個月衝破 21,000 星,真正戳中的不是 browser automation,而是 agentic coding 最痛的驗證瓶頸。

2026-02-19

建構 Claude Code 學到的教訓:Prompt Caching 就是一切

Anthropic 分享 Claude Code 的 prompt caching 架構心得:前綴匹配、快取命中率監控,以及常見的快取失效陷阱。

用 Evaluation Flywheel 打造更穩健的 Prompt

OpenAI Cookbook 提出 Evaluation Flywheel 方法:透過分析、量測、改進的迭代循環,系統化打造穩健的 prompt。

2026-02-15

個人全景監獄:用 Claude Code 管理整個人生

用 Claude Code 建立 8 個平行 agent 全面自動化生活,從一夜打造千萬人使用的工具到父母學會命令列的真實故事。

Claude Opus 4.6 思維更聰明、xAI 加入 SpaceX、AI 超越醫生、標準化 AI 審計

The Batch 本週重點:Claude Opus 4.6 推理能力躍進、xAI 與 SpaceX 合作、AI 診斷超越醫生、標準化 AI 審計框架。