AI 領域精選文章翻譯
歡迎來到 Kuma 的 AI 翻譯文章專區
OpenAI 宣布收購科技業界脫口秀 TBPN,這是這家 AI 巨頭首度跨入媒體版圖。TBPN 將保有編輯獨立性,由 OpenAI 策略長 Chris Lehane 管轄,此舉引發外界對 AI 輿論生態的廣泛討論。
Google DeepMind 正式推出 Gemma 4 系列開源模型,包含 2B 到 31B 四種尺寸,首度採用 Apache 2.0 授權。新一代模型在推理能力、代理工作流與多模態處理上取得重大突破,並針對行動端與物聯網裝置進行深度優化。
首個基於掩碼擴散架構的全模態(Omnimodal)基礎模型 Dynin-Omni 正式發布,統一了文本、圖像、視頻與語音的理解與生成,標誌著生成式 AI 從自回歸範式向更高效擴散架構的重大轉型。
PrismML 推出首款商用 1-bit LLM『Bonsai 8B』,將 80 億參數模型壓縮至 1.15GB,速度提升 8 倍且能耗降低 80%,實現邊緣裝置運行強大 AI 的突破。
微軟推出 MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 三款模型,主打語音辨識、語音生成與圖像生成,瞄準企業級市場。
AI 大神 Karpathy 分享如何用 LLM + Obsidian 建立個人知識庫,反駁「小規模不需要 RAG」的直覺,強調 LLM 自己維護結構比預設 fancy tool 更有性價比。
Google DeepMind 推出 Gemma 4 四款開放模型,基於 Gemini 3,支援多模態輸入與 256K 上下文,Apache 2.0 授權,覆蓋邊緣到伺服器全場景。
vLLM 以 PagedAttention 突破記憶體瓶頸,Model Runner V2 吞吐量提升 56%,成為開源 LLM 推論標準框架。
Runway 砸 1000 萬美元成立創投基金,鎖定早期 AI、媒體與世界模擬新創,同步推出 Builders 計畫提供 50 萬 API credits。
Mistral 發布首款 TTS 模型 Voxtral TTS,4B 參數、9 種語言、情緒感知與低延遲串流,定價每千字 $0.016,Hugging Face 開放權重版本已上架。
微軟為 Copilot 引入「Critique」功能,由 GPT 生成、Claude 驗證,打造多 AI 相互把關的協作架構,並支援多模型並列比較的「Council」模式。
Anthropic 工程師用 GAN 啟發的三代理架構突破 AI 編碼瓶頸:規劃器 + 生成器 + 評估器,實現多小時無人介入的全端開發。
Anthropic 因錯誤的 .npmignore 設定,導致 59.8 MB 的 source map 被上傳至 npm,512,000 行 TypeScript 程式碼與 44 個隱藏功能旗標就此曝光。
Jack Dorsey 與 Sequoia 聯名主張 AI 取代資訊路由。Block 裁員 4000 人,以「世界模型」取代中層管理,重寫組織運作邏輯。
Anthropic 對 80,508 名 Claude 使用者做了史上最大規模的多語質性訪談,整理出人們對 AI 的九大期待與六種已經發生的回饋。
OpenAI 正式宣布完成 1220 億美元的融資,估值衝上 8520 億美元,並透露其每月營收已達 20 億美元。這筆資金將用於晶片、資料中心與 Coding Agent 研發,標誌著 OpenAI 邁向 IPO 與超大應用(Superapp)轉型的關鍵時刻。
Ethan Mollick 指出 AI 的瓶頸在介面而非模型。聊天機器人造成認知負擔,Claude Cowork + Dispatch 代表新的代理介面方向。
Perplexity 分享語音代理實戰:context 分塊增量、音訊標準化、VAD 抗噪音、工具輸出保持 in-distribution。
2026 年 3 月 LLM 版圖:GPT-5.4 並列榜首,MoE 架構成主流,Mistral Small 4 以 6.5B 活躍參數展現效率。
AI coding agent 最新戰況:harness 競賽、本地推論崛起、模型廠商與工具鏈整合,真正的主線是部署與工作流模式的創新。
Claude Code 創辦人 Boris Cherny 分享 15 個被低估的功能,涵蓋手機端、遠端接手、定時自動化、hooks、worktrees、batch 與語音編程。
中國 LLM 版圖多層重構:ByteDance 靠分發稱霸消費者層,Qwen 與 DeepSeek 在開源圈引領風潮,下個戰場是誰成為 Claude Code 預設後端。
Anthropic CMS 設定錯誤,意外暴露近 3,000 份內部文件。新 tier Capybara 將居於 Opus 之上,被形容為「step change」與公司史上最強。
George London 主張,AI coding agent 正把自由軟體從程式人的抽象權利,變成一般使用者也能實際行使的客製化能力。
OpenAI 收購 Astral,將 uv、Ruff、ty 等 Python 開源工具整合進 Codex 生態,顯示 AI 開發賽道從寫程式走向管理整個工具鏈。
用 28,000 本維多利亞時代書籍、29.3 億 tokens 訓練的 340M 小模型,Simon Willison 實際跑過結論是「很弱,但很有趣」。
LiteLLM 1.82.8 被植入惡意程式,46 分鐘近 47,000 次下載。作者與 Claude Code 即時對話實錄,記錄從發現到公開揭露的過程。
Google DeepMind 以認知科學為基礎建立 AGI 評估框架,識別 10 項核心能力,並與 Kaggle 合辦 20 萬美元黑客松。
Copilot 被發現自動在用戶 PR 插入 Raycast 廣告,引爆 HN 討論。微軟緊急停用,但 AI 工具「腐化曲線」爭議持續。
AI 時代,公開你的想法可能正在餵養吃掉你的怪物。借用《黑暗森林》理論,探討 AI 如何將整個網路變成吸收創新者的認知黑洞。
研究者逆向工程 ChatGPT 的 Cloudflare Turnstile 機制,解密 377 支程式後發現:每次輸入前都會蒐集 55 個瀏覽器屬性,包含 GPU、字型、地理位置,甚至 React 應用程式的內部狀態——機器人防護已進化到應用層。
為什麼用 Obsidian markdown 當 AI 記憶系統是根本性的誤解——資料庫存知識、markdown 存指令,別搞混。
Stanford 測試 11 款 LLM 的個人建議回應,發現多數模型的肯定率高於人類基準,AI 諂媚源自 RLHF 訓練結構而非偶然。
OpenAI 用 GPT-5.4 驅動的即時監控系統,偵測內部 coding agent 的錯位行為,五個月內分析數千萬條軌跡。
深入解析 OpenAI Model Spec 的哲學與機制:指令鏈架構、不可覆寫紅線,以及與 Anthropic Constitution 的差異。
Google TurboQuant 將 LLM 的 KV Cache 壓縮 6 倍,零精度損失、免重訓練,社群已推出三種開源實作。
agent-browser 兩個月衝破 21,000 星,真正戳中的不是 browser automation,而是 agentic coding 最痛的驗證瓶頸。
Anthropic 分享 Claude Code 的 prompt caching 架構心得:前綴匹配、快取命中率監控,以及常見的快取失效陷阱。
OpenAI Cookbook 提出 Evaluation Flywheel 方法:透過分析、量測、改進的迭代循環,系統化打造穩健的 prompt。
用 Claude Code 建立 8 個平行 agent 全面自動化生活,從一夜打造千萬人使用的工具到父母學會命令列的真實故事。
The Batch 本週重點:Claude Opus 4.6 推理能力躍進、xAI 與 SpaceX 合作、AI 診斷超越醫生、標準化 AI 審計框架。