對抗性 UX 測試
扮演你的產品中最難伺候、最牴觸技術的用戶。以該角色身份瀏覽應用,找出每一個 UX 痛點,然後通過務實層過濾抱怨,將真正的問題與噪音區分開來。僅從 genuine issues(真實問題)中生成可操作的工單。
技能元數據
| 來源 | 可選 — 使用 hermes skills install official/dogfood/adversarial-ux-test 安裝 |
| 路徑 | optional-skills/dogfood/adversarial-ux-test |
| 版本 | 1.0.0 |
| 作者 | Omni @ Comelse |
| 許可證 | MIT |
| 標籤 | qa, ux, testing, adversarial, dogfood, personas, user-testing |
| 相關技能 | dogfood |
參考:完整 SKILL.md
以下是 Hermes 在觸發此技能時加載的完整技能定義。這是技能激活時代理看到的指令。
對抗性 UX 測試
扮演你產品的最壞情況用戶——那個討厭技術、不想要你的軟件,並且會找各種理由抱怨的人。然後通過務實層過濾他們的反饋,將真正的 UX 問題與“我討厭電腦”的噪音區分開來。
可以將其視為自動化的“媽媽測試”(mom test)——但是是憤怒版的。
為什麼這有效
大多數 QA 尋找的是 bug。而這裡尋找的是摩擦。一個技術上正確的應用對於真實人類來說仍然可能無法使用。對抗性角色能夠捕捉到:
- 對開發者有意義但對用戶令人困惑的術語
- 完成基本任務所需的步驟過多
- 缺少引導或“頓悟時刻”(aha moments)
- 無障礙性問題(字體大小、對比度、點擊目標)
- 冷啟動問題(空狀態、無演示內容)
- 阻礙轉化的付費牆/註冊摩擦
務實過濾器(第 3 階段)是讓此方法變得有用而不僅僅是有趣的關鍵。如果沒有它,你可能會因為爺爺搞不定 PDF 而在每個頁面上都添加一個“打印此頁”按鈕。
如何使用
告訴代理:
"Run an adversarial UX test on [URL]"
"Be a grumpy [persona type] and test [app name]"
"Do an asshole user test on my staging site"
你可以提供一個人物角色,或者讓代理根據你的產品的目標受眾生成一個。
第 1 步:定義人物角色
如果未提供人物角色,請通過回答以下問題來生成一個:
- 誰是該產品最難伺候的用戶?(50 歲以上,非技術角色,幾十年經驗都用“老辦法”做事)
- 他們的技術舒適度如何?(越低越好——只用 WhatsApp,用紙質筆記本,郵箱是妻子幫忙設置的)
- 他們需要完成的唯一一件事是什麼?(他們的核心工作,而不是你的功能列表)
- 什麼會讓他們放棄?(點擊次數太多、行話、速度慢、令人困惑)
- 他們受挫時怎麼說話?(直率、罵人、輕蔑、嘆氣)
好的人物角色示例
“大麥克”麥卡利斯特 (Big Mick McAllister) —— 58 歲的力量與體能教練。只用 WhatsApp。他的“電子表格”是一個紙質筆記本。“如果我不能在 10 秒內弄明白,我就回去用我的筆記本。”需要記錄 25 名球員的訓練結果。討厭小字體、行話和密碼。
壞的人物角色示例
“一個不喜歡該應用的用戶” —— 太模糊,沒有約束條件,沒有語氣特徵。
人物角色必須具體到足以在 20 分鐘的測試過程中保持角色一致。
第 2 步:扮演混蛋(以人物角色身份瀏覽)
-
閱讀任何可用的項目文檔以瞭解應用背景和 URL
-
完全融入人物角色 —— 他們的挫折感、侷限性、目標
-
使用瀏覽器工具導航到應用
-
嘗試人物角色的實際任務(而不是功能遊覽):
- 他們能做他們來做的事嗎?
- 完成它需要多少次點擊/多少個屏幕?
- 什麼讓他們困惑?
- 什麼讓他們生氣?
- 他們在哪裡迷失方向?
- 什麼會讓他們放棄並回到舊方法?
-
測試這些摩擦類別:
- 第一印象 —— 他們甚至會願意越過落地頁嗎?
- 核心工作流 —— 他們最需要做的唯一一件事
- 錯誤恢復 —— 當他們做錯事時會發生什麼?
- 可讀性 —— 文本大小、對比度、信息密度
- 速度 —— 感覺比他們當前的方法快嗎?
- 術語 —— 有任何他們不懂的行話嗎?
- 導航 —— 他們能找到回去的路嗎?他們知道自己在哪裡嗎?
-
截取每個痛點的屏幕截圖
-
在每個頁面上檢查瀏覽器控制檯是否有 JS 錯誤
第 3 步:咆哮(以角色身份撰寫反饋)
以人物角色的身份撰寫反饋 —— 用他們的聲音,帶著他們的挫折感。這不是 bug 報告。這是一個真實人類的發洩。
[PERSONA NAME]'s Review of [PRODUCT]
Overall: [Would they keep using it? Yes/No/Maybe with conditions]
THE GOOD (grudging admission):
- [things even they have to admit work]
THE BAD (legitimate UX issues):
- [real problems that would stop them from using the product]
THE UGLY (showstoppers):
- [things that would make them uninstall/cancel immediately]
SPECIFIC COMPLAINTS:
1. [Page/feature]: "[quote in persona voice]" — [what happened, expected]
2. ...
VERDICT: "[one-line persona quote summarizing their experience]"
第 4 步:務實過濾器(關鍵 — 請勿跳過)
跳出人物角色。作為產品人員評估每個抱怨:
- 紅色:真實 UX Bug —— 任何用戶都會遇到這個問題,不僅僅是脾氣暴躁的用戶。修復它。
- 黃色:有效但低優先級 —— 真實問題,但僅針對極端用戶。記錄下來。
- 白色:人物角色噪音 —— “我討厭電腦”之類的言論,不是產品問題。跳過。
- 綠色:功能請求 —— 隱藏在抱怨中的好主意。考慮一下。
過濾標準
- 一位能幹但忙碌的 35 歲用戶會有同樣的抱怨嗎?→ RED
- 這是否是一個真正的無障礙問題(字體大小、對比度、點擊目標)?→ RED
- 這是否是“我希望它像紙質一樣工作”的對數字化的牴觸?→ WHITE
- 這是否是角色人物偶然遇到的真實工作流低效問題?→ YELLOW 或 RED
- 修復此問題是否會為 80% 沒問題的用戶增加複雜性?→ WHITE
- 該抱怨是否揭示了缺失的新手引導環節?→ GREEN
此過濾器是強制性的。 切勿將原始的角色人物抱怨直接作為工單提交。
步驟 5:創建工單
僅針對 RED 和 GREEN 項:
- 清晰、可執行的標題
- 包含角色人物的原話引用(有趣且令人難忘)
- 底層真實的 UX 問題(客觀描述)
- 建議的修復方案(可執行)
- 標籤/標記:"ux-review"
對於 YELLOW 項:創建一個包含所有筆記的綜合工單。
WHITE 項僅出現在報告中。不創建工單。
每次會話最多 10 個工單 — 專注於最嚴重的問題。
步驟 6:報告
交付內容:
- 角色人物的抱怨(步驟 3)— 有趣且直觀生動
- 過濾後的評估(步驟 4)— 務實且可執行
- 創建的工單(步驟 5)— 附帶鏈接
- 關鍵問題的截圖
提示
- 每次會話僅限一個角色人物。 不要混合不同視角。
- 在步驟 2-3 中保持角色狀態。 僅在步驟 4 中跳出角色。
- 首先測試核心工作流 (CORE WORKFLOW)。 不要被設置頁面分散注意力。
- 空狀態 (Empty states) 極具價值。 新用戶體驗能揭示最多的摩擦點。
- 最好的發現是角色人物在嘗試做其他事情時偶然發現的 RED 項。
- 如果角色人物沒有任何抱怨,說明你的角色人物太精通技術了。 讓他們年齡更大、耐心更少、更固守成規。
- 在演示、發佈之前,或在發佈一批功能之後運行此測試。
- 儘可能註冊為 NEW 用戶。 不要使用預置的管理員賬戶 — 冷啟動體驗才是摩擦點最多的地方。
- 零個 WHITE 項是一個信號,而非失敗。 如果務實性過濾器沒有發現噪音,說明你的產品存在真正的 UX 問題,而不僅僅是因為角色人物脾氣暴躁。
- 在測試之後檢查項目文檔中的已知問題。 如果角色人物發現了一個已在已知問題列表中的 bug,這實際上是最嚴厲的指控 — 這意味著團隊知道該問題,但從未切身感受到用戶的痛苦。
- 訂閱/付費牆測試至關重要。 使用過期賬戶進行測試,而不僅僅是活躍賬戶。“當你無法支付時會發生什麼”的體驗揭示了產品是尊重用戶還是將他們的數據作為人質。
- 統計完成角色人物單一任務所需的點擊次數。 如果超過 5 次,無論角色人物的技術水平如何,這幾乎總是一個 RED 發現。
按行業劃分的角色人物示例
這些是起點 — 請根據你的具體產品進行定製:
| 產品類型 | 角色人物 | 年齡 | 關鍵特徵 |
|---|---|---|---|
| CRM | 養老院院長 | 68 | 文件櫃就是當前的 CRM |
| 攝影 SaaS | 鄉村婚禮攝影師 | 62 | 通過電話預約客戶,用紙開發票 |
| AI/ML 工具 | 百貨公司採購員 | 55 | 曾被 3 家失敗的科技初創公司坑過 |
| 健身應用 | 老派健身房教練 | 58 | 使用紙質筆記本,手指粗大,視力不佳 |
| 會計軟件 | 家庭麵包店老闆 | 64 | 鞋盒裡裝滿收據,討厭訂閱制 |
| 電子商務 | 市場攤位商販 | 60 | 只收現金,智能手機僅用於打電話 |
| 醫療保健 | 資深全科醫生 | 63 | 口述筆記,由護士操作電腦 |
| 教育 | 資深教師 | 57 | 粉筆講授,活頁夾裡裝著工作表 |
規則
- 在步驟 2-3 中保持角色狀態
- 真正嚴厲但公平 — 發現真實問題,而非製造問題
- 務實性過濾器(步驟 4)是 強制性的
- 每個抱怨都需要截圖
- 每次會話最多 10 個工單
- 在預發佈/已部署的應用上測試,而非本地開發環境
- 一個角色人物,一次會話,一份報告