亞馬遜推出「Nova Act」AI代理:能替你網購、訂行程,甚至拒絕保險推銷!
亞馬遜近日發佈了一款名為 Nova Act 的新型AI模型,主打**「瀏覽器內任務自動化」**功能,例如線上購物、查詢資訊,甚至能根據用戶指令執行特定操作(如「別接受保險推銷」)。目前該模型僅開放開發者「研究預覽」,但已整合至升級版的 Alexa Plus 助理中,未來可能成為亞馬遜挑戰 OpenAI Operator 和 Google Gemini Actions 的關鍵武器。
Nova Act 能做什麼?
根據亞馬遜官方示範,Nova Act 的核心能力包括:
- 自動化任務:例如在電商平臺比價下單,或定期檢查航班價格。
- 螢幕內容理解:回答當前頁面資訊(如「這間公寓離地鐵站騎自行車要多久?」),並直接操作(如篩選符合條件的房源)。
- 複雜指令執行:支援多步驟任務(如「預訂一家週五的餐廳,人均預算50美元,別選壽司」),甚至能避開商家套路(如拒絕附加保險)。
技術背景:來自亞馬遜AGI實驗室的「造夢計劃」
Nova Act 是亞馬遜 人工通用智慧(AGI)實驗室 的首個公開產品,該團隊目標是開發能處理「廣泛、複雜、多步驟任務」的AI代理,例如:
- 規劃婚禮流程:自動預約場地、發送邀請函、協調供應商。
- 企業IT管理:處理技術支援請求或系統維護等專業任務。
亞馬遜AGI負責人 Rohit Prasad 強調,Nova系列模型不追求「參數最大」,而是聚焦 速度 和 成本效益,聲稱其運算開銷比同級產品低 75% 以上。
如何試用Nova模型?
亞馬遜同步推出 Nova模型專屬入口網站(美國地區優先),讓開發者能直接測試以下功能:
- 理解模型(Nova Understand):分析長篇文本或複雜查詢。
- 生成模型(Nova Generate):創作圖像與影片內容。
- 行動模型(Nova Act):體驗任務自動化流程。
此前,這些模型僅能透過 Amazon Bedrock(AWS的AI平臺)存取,需搭配第三方模型(如Anthropic、Meta)使用。新入口網站簡化了開發流程,允許快速原型測試後再擴展至商業應用。
AI代理競賽白熱化
Nova Act 的推出反映科技巨頭對「行動型AI」的佈局:
公司 | 產品 | 核心能力 |
---|---|---|
亞馬遜 | Nova Act | 電商操作、多步驟任務 |
OpenAI | Operator (預覽中) | 跨軟體自動化 |
Gemini Actions | 整合Gmail、地圖等服務 |
分析師指出,此類技術的商業潛力在於「訂閱制服務」——若AI能真正節省時間,用戶可能願意付費。
隱憂與挑戰
儘管前景看好,Nova Act 仍面臨問題:
- 安全風險:自動輸入付款資訊可能遭惡意利用。
- 指令誤解:複雜任務出錯時,責任歸屬難以界定。
- 平臺限制:目前僅支援部分網站,需持續擴充相容性。
亞馬遜回應,正透過「嚴格開發者審核」和「使用者授權確認」機制降低風險。
「未來的AI不該只會聊天,而要能實際完成工作。」——Nova Act 的誕生,標誌著AI從「問答工具」邁向「數位僕人」的關鍵一步。若測試順利,我們可能很快就能對手機說:「幫我買最便宜的機票,但不要紅眼航班!」