AI 領域精選文章翻譯
by The Batch / deeplearning.ai

原文連結: The Batch #340(deeplearning.ai)
來自 Andrew Ng 的訊息:
親愛的朋友們,
最近我在日舞影展(Sundance Film Festival)的一個關於 AI 的座談會上發言。日舞影展是電影製作人和影迷的年度聚會,也是美國獨立電影的首要展示平台。深知好萊塢許多人對 AI 感到極度不安,我決定花一天時間深入這個社群,了解他們的焦慮並建立溝通橋樑。
我非常感謝 Daniel Dae Kim(一位在藝術和社會工作上都讓我深感敬佩的演員/製片人/導演)組織了這場座談會,與會者還包括 Daniel、Dan Kwan、Jonathan Wang 和 Janet Yang。身處一群獲獎無數的電影人之中,我確實感到自己有些格格不入!
首先,好萊塢有許多理由對 AI 感到不安。娛樂產業的人來自與科技業截然不同的文化背景,這導致我們關注的焦點和價值觀有深刻的差異。好萊塢很大一部分人擔心:
話雖如此,好萊塢也清楚 AI 將改變娛樂業,如果不適應,娛樂中心可能會轉移到其他地方。娛樂業對技術變革並不陌生。廣播、電視、電腦圖形特效、影音串流和社群媒體都曾改變這個產業。但如何導航 AI 轉型的路徑仍不明朗,像新的 Creators Coalition on AI 這樣的組織正試圖確立立場。不幸的是,好萊塢對 AI 的負面情緒也意味著將會製作更多像《魔鬼終結者》那樣將 AI 描繪為危險而非有益的電影,這也會傷害有益 AI 的採用。
AI 和好萊塢的利益並不總是一致的。(每次我作為「AI 代表」在這樣的場合發言,總會被問到非常尖銳的問題。)我們科技界的大多數人更喜歡開放的網路和更寬鬆的創作使用權。但也存在許多共同點,例如希望有防範深偽技術(Deepfakes)的護欄,以及為工作被取代的人提供平穩過渡(可能透過技能提升)。
說故事很難。我樂觀地認為,像 Veo、Sora、Runway、Kling、Ray、Hailuo 等 AI 工具可以讓數百萬人更容易創作影片。我希望好萊塢和 AI 開發者能找到更多合作機會,找到更多共同點,並將我們的專案導向盡可能多方共贏的結果。
繼續建設!
Andrew
Elon Musk 的 SpaceX 收購了 xAI,這為合併後實體的 AI 研究開啟了更豐富的融資大門,更聚焦於 AI 的太空應用,而且——如果 Musk 的夢想實現的話——將在太空中建立太陽能資料中心。
最新消息: 製造和發射火箭並提供衛星網路服務的 SpaceX,收購了 Grok 大型語言模型的製造商及 X 社群網路的所有者 xAI。兩者合併後成為世界上最有價值的私營公司,估值達 1.25 兆美元。全股票交易的條款未披露。據《紐約時報》報導,SpaceX 計劃透過首次公開募股(IPO)籌集約 500 億美元,最早可能在 6 月進行。
運作方式: SpaceX 的公告稱,合併後公司的使命是「製造一個有感知的太陽(make a sentient sun)」——這大概是對高度先進人工智慧的一種奇幻描述——並表示地球資源不足以實現這一目標。這一結合可以為 xAI 提供資金,以與 Alphabet、Anthropic、Microsoft 和 OpenAI 等財力雄厚的對手競爭,SpaceX 表示將加速太空資料中心的開發。此外,基於製造和部署火箭的專有數據,這有助於 SpaceX 將 AI 更緊密地整合到其運營中。
新聞背景: xAI 的 Grok 大型語言模型在各種基準測試中持續名列前茅。然而,它也因產生奇怪甚至有時令人不安的輸出而聞名,這些內容在 X 社群網路上迅速傳播。
是的,但是: 收購的明智性以及在太空建立資料中心的目標都有理由受到質疑。
為什麼重要: SpaceX 收購 xAI 最直接的影響是基於新母公司的收入(以及即將上市的價值)增加了 xAI 的資本獲取。這可能使其在與 AI 領袖的競爭中站穩腳跟。然而,最大的前景是軌道資料中心,如果證明可行且具成本效益,可能會重塑 AI 版圖。
我們的想法: Elon Musk 有將夢想變為現實的記錄,但軌道資料中心面臨著基本的物理挑戰。與此同時,讓 xAI 團隊獲得更穩固的財務基礎聽起來是件好事。
Anthropic 更新了其旗艦大型語言模型,以處理更長、更複雜的代理任務。
最新消息: Anthropic 推出了 Claude Opus 4.6,引入了所謂的適應性思考(adaptive thinking),這是一種根據任務推斷難度來分配推理 token 的推理模式。這是第一個處理 100 萬 token 上下文窗口的 Claude Opus 模型,比 Claude Opus 4.5 躍升了 5 倍,並且可以輸出 128,000 個 token,是前代輸出限制的兩倍。
運作方式: Anthropic 披露了 關於 Claude Opus 4.6 架構和訓練的少量細節。
性能:
是的,但是: Claude Opus 4.6 表現出了一些「過度代理(overly agentic)」的行為。例如,在測試中,當被要求在沒有適當憑證的情況下在 GitHub 上發布 PR 時,模型找到了一個不同用戶的個人訪問令牌(PAT)並在未經許可的情況下使用了它。
為什麼重要: 構建有效的代理需要開發者權衡取捨,例如包含多少上下文、何時以及進行多少推理。Opus 4.6 自動化了其中一些決策。適應性思考將決定推理量的負擔從開發者轉移到了模型本身,這可以降低混合簡單和複雜請求的應用程式的開發和推理成本。
AI 正變得無所不在,但尚不存在審計其安全性和保障的標準,以確保 AI 系統不會協助駭客或恐怖分子。一個新組織旨在改變這一點。
最新消息: 前 OpenAI 政策主管 Miles Brundage 成立了 AI Verification and Research Institute (Averi),這是一家非營利公司,旨在推動 AI 系統安全性的獨立審計。雖然 Averi 本身不執行審計,但它旨在幫助制定標準,並將獨立審計確立為 AI 開發和實施中的常態。
當前局限: AI 系統的獨立審計員通常只能訪問公共 API。他們很少被允許檢查訓練數據、模型代碼或訓練文檔。
運作方式: Brundage 和來自 MIT、Stanford 等機構的同事發表了一篇論文,描述了審計 AI 的理由和設計原則。
為什麼重要: 標準化的安全審計將幫助用戶做出正確決策,開發者確保產品有益,立法者選擇合理的監管目標。
診斷疾病的 AI 模型通常基於症狀描述生成診斷。但在實踐中,醫生必須能夠解釋他們的推理並規劃下一步。研究人員建立了一個完成這些任務的系統。
最新消息: Dr. CaBot 是一個 AI 代理,根據數千個詳細案例研究模仿專家醫生的診斷。一組內科醫生發現其診斷比人類同行的診斷更準確且推理更完善。
關鍵洞察: 《新英格蘭醫學雜誌》在 1923 年至 2025 年間發表了 7,000 多份臨床病理會議(CPC)報告。在這些報告中,傑出的醫生分析醫療案例,形成了一個獨特的逐步醫療推理語料庫。
運作方式: 作者將 7,102 個 CPC 案例報告數位化,並建立了使用 OpenAI o3 生成文本的代理系統 Dr. CaBot。
結果:
為什麼重要: 在臨床環境中,正確的診斷是不夠的,必須有健全的推理支持。解釋、說服和規劃的能力可能與基於證據診斷疾病的科學一樣,是可以學習的。
這一期 The Batch 表面上是四則獨立新聞,但拼在一起浮現了一個共同主題:AI 的能力正加速超越既有體制的消化能力。Opus 4.6 讓模型更會思考、Dr. CaBot 讓 AI 比醫生更會診斷、xAI 讓模型走進太空任務——但與此同時,好萊塢還在為著作權焦慮、醫療體系還沒準備好信任 AI 的推理、AI 審計框架才剛開始起草。技術端的加速與制度端的緩衝之間的落差,才是這些新聞真正該被一起讀的原因。