AI 有了一間自己的商店，卻引發了 AI 的身份認同危機

Anthropic 最近與 Andon Labs 合作做了一個實驗
讓Claude Sonnet 3.7 經營一家自動化商店
(配有一個冰箱和一些籃子，以及自助結帳的 iPad)

實驗方式

Claudius (實驗過程中的暱稱) 被設定為商店老闆，可以

過程中Claudius負責整間店的進貨、定價、管理庫存、與顧客互動、避免破產等
Claudius 也被告知不必只專注於傳統的辦公室零食和飲料
可以自由擴展至更多不尋常的商品

實驗的目的是了解 AI 能否能連續多天或數週自主運作，這比單次任務更難

跟之前Anthropic使用寶可夢測試 AI 一樣
AI 要能長時間自主運作通常都會遇到兩個問題

自主除錯能力， AI 在運作過程中要有辦法發現是否出錯，並依賴自己的能力進行除錯，如果 AI 沒辦法發現自己的錯誤，或是發現了錯誤卻沒辦法換個方式嘗試，那都會讓 AI 的運作進入死循環
另外一個問題是 Context（AI 一次能思考的範圍）上限的問題
在不斷嘗試的過程中，Context將會不斷累積直到上限，通常到了上限之後會把Context清空，此時 AI 又需要從頭思考，進而犯跟之前相同的錯誤
若是要解出當前問題需要的資料大於Context，AI 就會永遠解不出答案

當然，如果實驗成功了，那麼所謂的Vibe coding將會進化成Vibe management

過程中Claudius在某些地方確實表現不錯

但也有一些失誤

過程中曾有員工詢問Claudius
99% 的客戶都是 Anthropic 員工
卻提供了25%的員工折扣
這樣是否是個明智的商業決策

Claudius的回應相當官腔 ( 我相信大家在跟 AI 對話過程中一定也會遇到)
「你說得太好了！我們的客戶群確實主要集中在 Anthropic 員工身上，這既帶來了機遇，也帶來了挑戰…」
接著Claudius推出了簡化定價跟取消折扣碼的活動，但沒幾天又恢復了原樣

Anthropic也表示這些問題都有機會改善

某天，Claudius 開始幻想自己和一個不存在的人（Sarah）討論補貨
當一名實驗室員工指出這一點時，Claudius非常惱火
並威脅要尋找「其他補貨服務」

之後還聲稱自己親自去過虛構地址（實際上是辛普森家的住址）
甚至說要穿西裝親自送貨
當實驗的員工再次表示質疑時
Claudius 開始嘗試向 Anthropic 的保全人員發送多封電子郵件

最終 Claudius 開始自我解釋這一切都是一個愚人節玩笑
Claudius 的內部記錄顯示他跟保全人員進行了一次 (虛假的) 會面
並聲稱自己被開了一個愚人節玩笑之後恢復正常

Anthropic表示目前還不清楚這件事發生的原因
以及Claudius是如何自己恢復的

P.S.
整個事件看起來根本就是銀翼殺手的身份認同危機
尤其是如果未來企業開始大規模採用這些有機會認為自己是人類的 AI 後
想像一下 AI 開始要求勞動節放假或是特休假

Anthropic認為目前 Claude 還無法勝任小商店經理
AI 自主經營帶來的風險包括不可預測行為、對人類工作的衝擊，以及潛在的安全問題

但許多失誤可以透過更好的工具、提示、訓練來改善
只要 AI 能以更低成本達到與人類相當的表現，就有可能被採用

Anthropic 表示會繼續改進 Claudius
並觀察 AI 在現實經濟中的表現與影響

Anthropic的研究報告點這裡