跳到主要內容

對抗性 UX 測試

扮演你的產品中最難伺候、最牴觸技術的用戶。以該角色身份瀏覽應用,找出每一個 UX 痛點,然後通過務實層過濾抱怨,將真正的問題與噪音區分開來。僅從 genuine issues(真實問題)中生成可操作的工單。

技能元數據

來源可選 — 使用 hermes skills install official/dogfood/adversarial-ux-test 安裝
路徑optional-skills/dogfood/adversarial-ux-test
版本1.0.0
作者Omni @ Comelse
許可證MIT
標籤qa, ux, testing, adversarial, dogfood, personas, user-testing
相關技能dogfood

參考:完整 SKILL.md

信息

以下是 Hermes 在觸發此技能時加載的完整技能定義。這是技能激活時代理看到的指令。

對抗性 UX 測試

扮演你產品的最壞情況用戶——那個討厭技術、不想要你的軟件,並且會找各種理由抱怨的人。然後通過務實層過濾他們的反饋,將真正的 UX 問題與“我討厭電腦”的噪音區分開來。

可以將其視為自動化的“媽媽測試”(mom test)——但是是憤怒版的。

為什麼這有效

大多數 QA 尋找的是 bug。而這裡尋找的是摩擦。一個技術上正確的應用對於真實人類來說仍然可能無法使用。對抗性角色能夠捕捉到:

  • 對開發者有意義但對用戶令人困惑的術語
  • 完成基本任務所需的步驟過多
  • 缺少引導或“頓悟時刻”(aha moments)
  • 無障礙性問題(字體大小、對比度、點擊目標)
  • 冷啟動問題(空狀態、無演示內容)
  • 阻礙轉化的付費牆/註冊摩擦

務實過濾器(第 3 階段)是讓此方法變得有用而不僅僅是有趣的關鍵。如果沒有它,你可能會因為爺爺搞不定 PDF 而在每個頁面上都添加一個“打印此頁”按鈕。

如何使用

告訴代理:

"Run an adversarial UX test on [URL]"
"Be a grumpy [persona type] and test [app name]"
"Do an asshole user test on my staging site"

你可以提供一個人物角色,或者讓代理根據你的產品的目標受眾生成一個。

第 1 步:定義人物角色

如果未提供人物角色,請通過回答以下問題來生成一個:

  1. 誰是該產品最難伺候的用戶?(50 歲以上,非技術角色,幾十年經驗都用“老辦法”做事)
  2. 他們的技術舒適度如何?(越低越好——只用 WhatsApp,用紙質筆記本,郵箱是妻子幫忙設置的)
  3. 他們需要完成的唯一一件事是什麼?(他們的核心工作,而不是你的功能列表)
  4. 什麼會讓他們放棄?(點擊次數太多、行話、速度慢、令人困惑)
  5. 他們受挫時怎麼說話?(直率、罵人、輕蔑、嘆氣)

好的人物角色示例

“大麥克”麥卡利斯特 (Big Mick McAllister) —— 58 歲的力量與體能教練。只用 WhatsApp。他的“電子表格”是一個紙質筆記本。“如果我不能在 10 秒內弄明白,我就回去用我的筆記本。”需要記錄 25 名球員的訓練結果。討厭小字體、行話和密碼。

壞的人物角色示例

“一個不喜歡該應用的用戶” —— 太模糊,沒有約束條件,沒有語氣特徵。

人物角色必須具體到足以在 20 分鐘的測試過程中保持角色一致

第 2 步:扮演混蛋(以人物角色身份瀏覽)

  1. 閱讀任何可用的項目文檔以瞭解應用背景和 URL

  2. 完全融入人物角色 —— 他們的挫折感、侷限性、目標

  3. 使用瀏覽器工具導航到應用

  4. 嘗試人物角色的實際任務(而不是功能遊覽):

    • 他們能做他們來做的事嗎?
    • 完成它需要多少次點擊/多少個屏幕?
    • 什麼讓他們困惑?
    • 什麼讓他們生氣?
    • 他們在哪裡迷失方向?
    • 什麼會讓他們放棄並回到舊方法?
  5. 測試這些摩擦類別:

    • 第一印象 —— 他們甚至會願意越過落地頁嗎?
    • 核心工作流 —— 他們最需要做的唯一一件事
    • 錯誤恢復 —— 當他們做錯事時會發生什麼?
    • 可讀性 —— 文本大小、對比度、信息密度
    • 速度 —— 感覺比他們當前的方法快嗎?
    • 術語 —— 有任何他們不懂的行話嗎?
    • 導航 —— 他們能找到回去的路嗎?他們知道自己在哪裡嗎?
  6. 截取每個痛點的屏幕截圖

  7. 在每個頁面上檢查瀏覽器控制檯是否有 JS 錯誤

第 3 步:咆哮(以角色身份撰寫反饋)

以人物角色的身份撰寫反饋 —— 用他們的聲音,帶著他們的挫折感。這不是 bug 報告。這是一個真實人類的發洩。

[PERSONA NAME]'s Review of [PRODUCT]

Overall: [Would they keep using it? Yes/No/Maybe with conditions]

THE GOOD (grudging admission):
- [things even they have to admit work]

THE BAD (legitimate UX issues):
- [real problems that would stop them from using the product]

THE UGLY (showstoppers):
- [things that would make them uninstall/cancel immediately]

SPECIFIC COMPLAINTS:
1. [Page/feature]: "[quote in persona voice]" — [what happened, expected]
2. ...

VERDICT: "[one-line persona quote summarizing their experience]"

第 4 步:務實過濾器(關鍵 — 請勿跳過)

跳出人物角色。作為產品人員評估每個抱怨:

  • 紅色:真實 UX Bug —— 任何用戶都會遇到這個問題,不僅僅是脾氣暴躁的用戶。修復它。
  • 黃色:有效但低優先級 —— 真實問題,但僅針對極端用戶。記錄下來。
  • 白色:人物角色噪音 —— “我討厭電腦”之類的言論,不是產品問題。跳過。
  • 綠色:功能請求 —— 隱藏在抱怨中的好主意。考慮一下。

過濾標準

  1. 一位能幹但忙碌的 35 歲用戶會有同樣的抱怨嗎?→ RED
  2. 這是否是一個真正的無障礙問題(字體大小、對比度、點擊目標)?→ RED
  3. 這是否是“我希望它像紙質一樣工作”的對數字化的牴觸?→ WHITE
  4. 這是否是角色人物偶然遇到的真實工作流低效問題?→ YELLOW 或 RED
  5. 修復此問題是否會為 80% 沒問題的用戶增加複雜性?→ WHITE
  6. 該抱怨是否揭示了缺失的新手引導環節?→ GREEN

此過濾器是強制性的。 切勿將原始的角色人物抱怨直接作為工單提交。

步驟 5:創建工單

僅針對 REDGREEN 項:

  • 清晰、可執行的標題
  • 包含角色人物的原話引用(有趣且令人難忘)
  • 底層真實的 UX 問題(客觀描述)
  • 建議的修復方案(可執行)
  • 標籤/標記:"ux-review"

對於 YELLOW 項:創建一個包含所有筆記的綜合工單。

WHITE 項僅出現在報告中。不創建工單。

每次會話最多 10 個工單 — 專注於最嚴重的問題。

步驟 6:報告

交付內容:

  1. 角色人物的抱怨(步驟 3)— 有趣且直觀生動
  2. 過濾後的評估(步驟 4)— 務實且可執行
  3. 創建的工單(步驟 5)— 附帶鏈接
  4. 關鍵問題的截圖

提示

  • 每次會話僅限一個角色人物。 不要混合不同視角。
  • 在步驟 2-3 中保持角色狀態。 僅在步驟 4 中跳出角色。
  • 首先測試核心工作流 (CORE WORKFLOW)。 不要被設置頁面分散注意力。
  • 空狀態 (Empty states) 極具價值。 新用戶體驗能揭示最多的摩擦點。
  • 最好的發現是角色人物在嘗試做其他事情時偶然發現的 RED 項。
  • 如果角色人物沒有任何抱怨,說明你的角色人物太精通技術了。 讓他們年齡更大、耐心更少、更固守成規。
  • 在演示、發佈之前,或在發佈一批功能之後運行此測試。
  • 儘可能註冊為 NEW 用戶。 不要使用預置的管理員賬戶 — 冷啟動體驗才是摩擦點最多的地方。
  • 零個 WHITE 項是一個信號,而非失敗。 如果務實性過濾器沒有發現噪音,說明你的產品存在真正的 UX 問題,而不僅僅是因為角色人物脾氣暴躁。
  • 在測試之後檢查項目文檔中的已知問題。 如果角色人物發現了一個已在已知問題列表中的 bug,這實際上是最嚴厲的指控 — 這意味著團隊知道該問題,但從未切身感受到用戶的痛苦。
  • 訂閱/付費牆測試至關重要。 使用過期賬戶進行測試,而不僅僅是活躍賬戶。“當你無法支付時會發生什麼”的體驗揭示了產品是尊重用戶還是將他們的數據作為人質。
  • 統計完成角色人物單一任務所需的點擊次數。 如果超過 5 次,無論角色人物的技術水平如何,這幾乎總是一個 RED 發現。

按行業劃分的角色人物示例

這些是起點 — 請根據你的具體產品進行定製:

產品類型角色人物年齡關鍵特徵
CRM養老院院長68文件櫃就是當前的 CRM
攝影 SaaS鄉村婚禮攝影師62通過電話預約客戶,用紙開發票
AI/ML 工具百貨公司採購員55曾被 3 家失敗的科技初創公司坑過
健身應用老派健身房教練58使用紙質筆記本,手指粗大,視力不佳
會計軟件家庭麵包店老闆64鞋盒裡裝滿收據,討厭訂閱制
電子商務市場攤位商販60只收現金,智能手機僅用於打電話
醫療保健資深全科醫生63口述筆記,由護士操作電腦
教育資深教師57粉筆講授,活頁夾裡裝著工作表

規則

  • 在步驟 2-3 中保持角色狀態
  • 真正嚴厲但公平 — 發現真實問題,而非製造問題
  • 務實性過濾器(步驟 4)是 強制性的
  • 每個抱怨都需要截圖
  • 每次會話最多 10 個工單
  • 在預發佈/已部署的應用上測試,而非本地開發環境
  • 一個角色人物,一次會話,一份報告