AI 領域精選文章翻譯
by Ethan Mollick

原文連結: Claude Dispatch and the Power of Interfaces
AI 的實際能力,已遠超大多數人的認知。這個所謂的「能力懸差」,根源並不在於 AI 本身的限制(當然限制依然存在),而在於人們與它互動的方式。絕大多數人都透過聊天機器人使用 AI,而且通常是功能較弱的免費版本。聊天機器人用來問個問題還好,但要真正完成工作,它其實是個糟糕的工具。
最新研究也印證了這一點:讓一群金融專業人士使用 GPT-4o 完成複雜估值任務,研究者逐輪測量他們的認知負擔。雖然 AI 確實帶來了生產力提升,但這種提升在一定程度上被一個問題抵消了——AI 呈現資訊的方式完全壓垮了人:文字牆、不請自來的話題延伸、無邊際的發散討論。聊天機器人的介面本身,才是障礙,而不是工作本身。
更糟的是,一旦對話變得混亂,就永遠維持混亂。AI 一心想幫忙,只是把使用者雜亂的結構原封不動地反射回去;而使用者,已被淹沒,根本無力重新整理。兩邊都在不斷加劇問題。受傷最深的,是那些經驗較少的工作者——恰恰就是最有機會從 AI 獲益的那群人。
如果你曾經用聊天機器人辦事,這一點不會讓你感到意外。你問一個具體的問題,卻收到五段文字,答案藏在某個角落,同時 AI 還貼心地提議三件你沒有要做的事。介面本身製造的認知成本,足以蓋過 AI 智慧帶來的好處。那麼,更好的介面應該長什麼樣子?
一個方向是:為不同職業打造專屬介面。目前真正完善的專用 AI 介面,幾乎只存在於程式設計領域。這完全可以理解——AI 實驗室的人員大多是程式設計師,模型大量以程式碼訓練,而打造工具的人往往就是在為自己打造。
Claude Code 是 Anthropic 的自主編程代理,可以連續工作數小時。OpenAI 的 Codex 和 Google 的 Antigravity 也做著類似的事。我用 Claude Code 做過各種事,從賺錢到做遊戲,從未碰過任何程式碼。但這些工具終究是為程式設計師設計的:預設你懂 Python 和 Git,介面看起來像 1980 年代的電腦教室。對 99% 不是開發者的知識工作者來說,這些強大工具根本不是為他們優化的。
Google 似乎是目前最積極為其他職業打造專用介面的公司。Stitch 讓你用自然語言描述一個應用程式,就能得到多個相互連動的畫面和一致的設計系統,暗示了 AI 原生設計的可能性。Pomelli 讓你貼上網站網址,自動生成符合品牌風格的社群媒體內容,用的是行銷語言而非提示語言。最廣為人知的 NotebookLM,則提供了整合、展示和處理多元資訊來源的方式。這些都指向了某個方向,但距離 Claude Code 對程式設計師那種改變遊戲規則的衝擊,還有一段路要走。
但還有另一種介面正在爆發成長:個人代理。
如果你還沒聽說過 OpenClaw——這是一個開源 AI 代理,標誌是一隻紅色龍蝦,是史上成長最快的開源專案之一。OpenClaw 成功的原因在於它是真正的個人代理:系統設計讓你可以透過 WhatsApp、Telegram 或 Slack 跟 AI 代理說話——就是你平常傳訊息的那些應用程式。你告訴它去查郵件、訂桌子、找個檔案,它就去你的電腦上做。它解決介面問題的方式,事後看來顯而易見:不是聊天機器人,不是命令列,而是讓你以對待真人的方式跟 AI 說話,用的是 WhatsApp 這種本來就極其熟悉的介面。
OpenClaw 的問題是難以設定且安全風險很高。Anthropic 的答案是 Claude Cowork 搭配 Dispatch。Cowork 在一月推出,是為知識工作者設計的 Claude Code 版本。它讓 Claude 透過桌面工作區存取本地檔案和應用程式,並透過連接器接入數十種應用程式,當連接器不可用時,就直接控制滑鼠和鍵盤作為備援。Dispatch 是最近幾週推出的關鍵拼圖:你可以在手機上傳送訊息給 Claude,讓它在你的桌面上工作。掃一個 QR code,你的手機就變成了坐在電腦前的 AI 代理的遙控器。
Dispatch 搭配 Claude Code 的組合,創造了一種感覺像是在跟一個得力助理說話的體驗。比如,我從手機要求 Claude 準備早間簡報,它就讀取我的行事曆、郵件和線上頻道,然後報告我接下來需要做什麼。Cowork 也能做更複雜的工作:我從手機要求它看一份我最近做的簡報,確認第三張投影片的圖表是否是最新的,如果不是就更新它。它在一個地方有點卡(有個網站封鎖了它下載檔案),但除此之外結果非常令人印象深刻。它打開並「閱讀」了 PowerPoint,調查了我整台電腦以尋找更新的資料。當我給它一篇更新論文的連結,它下載了 PDF、找到了更新的圖表、擷取了圖表影像,並為我更新了 PowerPoint。這是複雜而精密的工作,即使並非完全無縫,通常也足夠接近而能省下大量時間。
這和 OpenClaw 一樣靈活嗎?不。Cowork 是沙盒化的,更安全但也更受限(但這不代表沒有安全風險)。連接器生態系統仍在成長但尚不完整。Cowork 能使用你的電腦這個概念令人印象深刻,但實際操作上容易出錯。但核心洞察和 OpenClaw 偶然發現的是一樣的:人們不想要聊天機器人。他們想要一個能處理自己實際檔案、使用自己實際工具、以他們跟人說話的方式互動的代理。
以上所有思路,都預設我們需要事先決定介面。但最新的 AI 系統其實可以為你建立介面。例如,過去幾週 Claude 獲得了直接在對話中生成視覺化內容的能力。這些不是靜態圖片——它們是互動式的、可調整的,Claude 也能在你追問時即時修改它們。
這是解決介面問題的另一種思路。不是由公司為每種工作都建立一個專用介面,而是 AI 即時生成合適的介面。我猜未來不會是「一個介面統治一切」,而是 AI 為當下生成最合適的介面——桌面上的代理、對話中的圖表、解決問題的客製應用程式。我們正在從「適應 AI 的介面」走向「AI 適應你的介面」。
AI 的能力一直跑在 AI 的易用性前面。模型早就聰明到可以做出非凡的事,但我們一直讓人們透過聊天機器人使用這種智慧。而就像認知負擔研究顯示的,聊天機器人的格式本身就在對抗使用者。隨著介面改善,我們將看到當更大量的人能真正使用 AI 的能力時,會發生什麼事。每一個縮小這個差距的新介面,都會感覺像是 AI 能力的飛躍,即使模型本身沒有改變(雖然它們還是在改變)。我猜有些人對「AI 令人失望」的感受,不是因為 AI 不好,而是因為介面不對。我們打造了近代史上最強大的技術之一,然後讓人們透過打字進一個對話視窗來使用它。這很快就會改變。
這篇文章點出了一個長期被低估的真相:AI 實驗室花大量精力提升模型智慧,卻往往對「介面」這個部分投入不足。Mollick 的分析很有說服力——當模型已經足夠聰明,但介面仍逼著用戶用 1990 年代的聊天框操作,真正的限制瓶頸其實早就從「模型夠不夠強」轉移到了「介面能不能讓人真正用起來」。
Claude Cowork + Dispatch 的邏輯也值得仔細看。它不是在發明一種全新互動方式,而是把人類早就習慣的「傳訊息給能幹的人、讓他去辦事」這個行為模式,複製到 AI 身上。這才是真正的設計突破——不是技術上的,而是認知上的。
「按需生成介面」的概念則更進一步:未來的介面不是預先設計好等你去用,而是 AI 觀察你的需求後即時建構。這對 SaaS 產業的長期衝擊,恐怕比任何人現在評估的都要深遠。如果 AI 能為每個使用場景生成最合適的互動形式,「做一個好用的介面」這件事的門檻和邏輯就會被根本地重塑。