Hermes 在安裝時會將一個大型內置技能庫複製到 ~/.hermes/skills/ 目錄下。本頁面列出了存儲在代碼倉庫 skills/ 目錄下的內置技能。
apple
適用於 Apple/macOS 系統的技能 —— iMessage、提醒事項、備忘錄、查找我的設備(FindMy)以及 macOS 自動化。這些技能僅在 macOS 系統上加載。
| 技能 | 描述 | 路徑 |
|---|
apple-notes | 通過 macOS 上的 memo CLI 管理 Apple 備忘錄(創建、查看、搜索、編輯)。 | apple/apple-notes |
apple-reminders | 通過 remindctl CLI 管理 Apple 提醒事項(列出、添加、完成、刪除)。 | apple/apple-reminders |
findmy | 通過 macOS 上的 FindMy.app 使用 AppleScript 和屏幕捕獲功能追蹤 Apple 設備和 AirTags。 | apple/findmy |
imessage | 通過 macOS 上的 imsg CLI 發送和接收 iMessage/SMS。 | apple/imessage |
autonomous-ai-agents
用於啟動和編排自主 AI 編碼 Agent 及多 Agent 工作流的技能 —— 運行獨立的 Agent 進程、委派任務以及協調並行工作流。
| 技能 | 描述 | 路徑 |
|---|
claude-code | 將編碼任務委派給 Claude Code(Anthropic 的 CLI Agent)。適用於構建功能、重構代碼、代碼審查以及迭代式開發。需要已安裝 claude CLI。 | autonomous-ai-agents/claude-code |
codex | 將編碼任務委派給 OpenAI Codex CLI Agent。適用於構建功能、重構代碼、代碼審查以及批量修復問題。需要已安裝 codex CLI 並配置 git 倉庫。 | autonomous-ai-agents/codex |
hermes-agent-spawning | 啟動額外的 Hermes Agent 實例作為自主子進程,用於獨立的長時間運行任務。支持非交互式單次運行模式(-q)和交互式 PTY 模式,用於多輪協作。與 delegate_task 不同,此技能會運行一個完整的獨立 hermes 進程。 | autonomous-ai-agents/hermes-agent |
opencode | 將編碼任務委派給 OpenCode CLI Agent,用於功能實現、代碼重構、代碼審查以及長時間運行的自主會話。需要已安裝並認證 opencode CLI。 | autonomous-ai-agents/opencode |
data-science
用於數據科學工作流的技能 —— 交互式探索、Jupyter 筆記本、數據分析與可視化。
| 技能 | 描述 | 路徑 |
|---|
jupyter-live-kernel | 使用實時 Jupyter 內核進行有狀態、迭代式的 Python 執行,通過 hamelnb 實現。當任務涉及探索、迭代或檢查中間結果時,請加載此技能。 | data-science/jupyter-live-kernel |
creative
創意內容生成 —— ASCII 藝術、手繪風格圖表以及視覺設計工具。
| 技能 | 描述 | 路徑 |
|---|
ascii-art | 使用 pyfiglet(571 種字體)、cowsay、boxes、toilet、圖像轉 ASCII、遠程 API(asciified、ascii.co.uk)以及 LLM 降級方案生成 ASCII 藝術。無需 API 密鑰。 | creative/ascii-art |
ascii-video | “ASCII 藝術視頻的生產流水線 —— 支持任意格式。將視頻/音頻/圖像/生成輸入轉換為彩色 ASCII 字符視頻輸出(MP4、GIF、圖像序列)。涵蓋:視頻轉 ASCII 轉換、音頻響應式音樂可視化、生成式 ASCII 藝術動畫、混合……” | creative/ascii-video |
excalidraw | 使用 Excalidraw JSON 格式創建手繪風格圖表。生成 .excalidraw 文件,用於架構圖、流程圖、時序圖、概念圖等。文件可在 excalidraw.com 打開,或上傳以生成可分享鏈接。 | creative/excalidraw |
p5js | 用於交互式和生成式視覺藝術的生產流水線,基於 p5.js。創建草圖,通過無頭瀏覽器渲染為圖像/視頻,並提供實時預覽。支持畫布動畫、數據可視化和創意編程實驗。 | creative/p5js |
devops
DevOps 與基礎設施自動化技能。
| 技能 | 描述 | 路徑 |
|---|
webhook-subscriptions | 創建和管理 Webhook 訂閱,用於事件驅動的 Agent 激活。外部服務(GitHub、Stripe、CI/CD、IoT)通過 POST 事件來觸發 Agent 運行。需要啟用 Webhook 平臺。 | devops/webhook-subscriptions |
dogfood
| 技能 | 描述 | 路徑 |
|---|
dogfood | 對 Web 應用程序進行系統性探索式 QA 測試 —— 發現缺陷、捕獲證據並生成結構化報告。 | dogfood/dogfood |
hermes-agent-setup | 幫助用戶配置 Hermes Agent —— CLI 使用、設置嚮導、模型/提供方選擇、工具、技能、語音/STT/TTS、網關以及故障排除。 | dogfood/hermes-agent-setup |
email
用於從終端發送、接收、搜索和管理電子郵件的技能。
| 技能 | 描述 | 路徑 |
|---|
himalaya | 通過 IMAP/SMTP 管理電子郵件的 CLI 工具。使用 himalaya 列出、閱讀、撰寫、回覆、轉發、搜索和整理電子郵件。支持多個賬戶,並可通過 MML(MIME 元語言)進行消息編寫。 | email/himalaya |
gaming
用於設置、配置和管理遊戲服務器、模組包及遊戲相關基礎設施的技能。
| 技能 | 描述 | 路徑 |
|---|
minecraft-modpack-server | 從 CurseForge/Modrinth 服務器包的 zip 文件中設置模組化 Minecraft 服務器。涵蓋 NeoForge/Forge 安裝、Java 版本、JVM 調優、防火牆配置、局域網設置、備份以及啟動腳本。 | gaming/minecraft-modpack-server |
pokemon-player | 通過無頭模擬器自主運行寶可夢遊戲。啟動遊戲服務器,從內存中讀取結構化遊戲狀態,做出戰略決策,併發送按鈕輸入——全部通過終端完成。 | gaming/pokemon-player |
github
用於通過 gh CLI 和 git 在終端中管理倉庫、拉取請求、代碼審查、問題以及 CI/CD 流水線的 GitHub 工作流技能。
| 技能 | 描述 | 路徑 |
|---|
codebase-inspection | 使用 pygount 檢查和分析代碼庫,統計行數(LOC)、語言分佈以及代碼與註釋的比例。當被要求檢查代碼行數、倉庫大小、語言構成或代碼庫統計信息時使用。 | github/codebase-inspection |
github-auth | 使用 git(普遍可用)或 gh CLI 為 Agent 設置 GitHub 身份驗證。涵蓋 HTTPS 令牌、SSH 密鑰、憑證助手以及 gh auth —— 並具備自動檢測流程以選擇合適的方法。 | github/github-auth |
github-code-review | 通過分析 git diff 來審查代碼變更,對 PR 提交內聯評論,並進行徹底的預推送審查。支持 gh CLI,或回退至 git + GitHub REST API 通過 curl 實現。 | github/github-code-review |
github-issues | 創建、管理、分類和關閉 GitHub 問題。搜索現有問題,添加標籤,分配人員,並鏈接到 PR。支持 gh CLI,或回退至 git + GitHub REST API 通過 curl 實現。 | github/github-issues |
github-pr-workflow | 完整的拉取請求生命週期——創建分支、提交更改、打開 PR、監控 CI 狀態、自動修復失敗併合並。支持 gh CLI,或回退至 git + GitHub REST API 通過 curl 實現。 | github/github-pr-workflow |
github-repo-management | 克隆、創建、fork、配置和管理 GitHub 倉庫。管理遠程倉庫、密鑰、發佈版本和工作流。支持 gh CLI,或回退至 git + GitHub REST API 通過 curl 實現。 | github/github-repo-management |
inference-sh
通過 inference.sh 雲平臺執行 AI 應用的技能。
| 技能 | 描述 | 路徑 |
|---|
inference-sh-cli | 通過 inference.sh CLI(infsh)運行 150+ 個 AI 應用——包括圖像生成、視頻創作、大語言模型(LLM)、搜索、3D 內容、社交自動化等。 | inference-sh/cli |
leisure
| 技能 | 描述 | 路徑 |
|---|
find-nearby | 使用 OpenStreetMap 查找附近地點(餐廳、咖啡館、酒吧、藥房等)。支持座標、地址、城市、郵編或 Telegram 位置標記。無需 API 密鑰。 | leisure/find-nearby |
mcp
用於與 MCP(模型上下文協議)服務器、工具和集成協作的技能。包括內置的原生 MCP 客戶端(在 config.yaml 中配置服務器以實現自動工具發現)以及 mcporter CLI 橋接工具,用於臨時服務器交互。
| 技能 | 描述 | 路徑 |
|---|
mcporter | 使用 mcporter CLI 直接列出、配置、認證並調用 MCP 服務器/工具(支持 HTTP 或 stdio),包括臨時服務器、配置編輯以及 CLI/類型生成。 | mcp/mcporter |
native-mcp | 內置的 MCP(模型上下文協議)客戶端,可連接外部 MCP 服務器,發現其工具,並將其註冊為原生 Hermes Agent 工具。支持 stdio 和 HTTP 傳輸,具備自動重連、安全過濾和零配置工具注入功能。 | mcp/native-mcp |
用於處理媒體內容的技能——包括 YouTube 字幕、GIF 搜索、音樂生成和音頻可視化。
| 技能 | 描述 | 路徑 |
|---|
gif-search | 使用 curl 從 Tenor 搜索並下載 GIF。除 curl 和 jq 外無其他依賴。適用於查找反應 GIF、創建視覺內容以及在聊天中發送 GIF。 | media/gif-search |
heartmula | 設置並運行 HeartMuLa,開源音樂生成模型系列(類似 Suno)。通過歌詞 + 標籤生成完整歌曲,支持多語言。 | media/heartmula |
songsee | 通過 CLI 從音頻文件生成頻譜圖和音頻特徵可視化(如梅爾頻譜、音高、MFCC、節拍圖等)。適用於音頻分析、音樂製作調試和可視化文檔。 | media/songsee |
youtube-content | 獲取 YouTube 視頻字幕,並將其轉換為結構化內容(章節、摘要、話題線、博客文章等)。 | media/youtube-content |
mlops
通用機器學習運維工具——模型庫管理、數據集操作和工作流編排。
| 技能 | 描述 | 路徑 |
|---|
huggingface-hub | Hugging Face Hub CLI(hf)——搜索、下載和上傳模型與數據集,管理倉庫,部署推理端點。 | mlops/huggingface-hub |
mlops/cloud
GPU 雲服務提供商和用於機器學習工作負載的無服務器計算平臺。
| 技能 | 描述 | 路徑 |
|---|
lambda-labs-gpu-cloud | 用於機器學習訓練和推理的預留及按需 GPU 雲實例。當您需要專用 GPU 實例、簡單的 SSH 訪問、持久化文件系統,或用於大規模訓練的高性能多節點集群時使用。 | mlops/cloud/lambda-labs |
modal-serverless-gpu | 用於運行機器學習工作負載的無服務器 GPU 雲平臺。當您需要按需訪問 GPU 而無需管理基礎設施、將機器學習模型部署為 API,或運行具有自動擴展功能的批處理作業時使用。 | mlops/cloud/modal |
mlops/evaluation
模型評估基準、實驗追蹤、數據整理、分詞器和可解釋性工具。
| 技能 | 描述 | 路徑 |
|---|
evaluating-llms-harness | 在 60 多個學術基準(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上評估大語言模型。用於模型質量基準測試、模型對比、報告學術結果或追蹤訓練進度。EleutherAI、HuggingFace 和主要研究實驗室廣泛採用的行業標準。支持…… | mlops/evaluation/lm-evaluation-harness |
huggingface-tokenizers | 針對研究和生產優化的快速分詞器。基於 Rust 實現,可在 <20 秒內分詞 1GB 數據。支持 BPE、WordPiece 和 Unigram 算法。可訓練自定義詞彙表,追蹤對齊關係,處理填充/截斷。與 transformers 無縫集成。用於…… | mlops/evaluation/huggingface-tokenizers |
nemo-curator | 用於大語言模型訓練的 GPU 加速數據整理工具。支持文本/圖像/視頻/音頻。具備模糊去重(快 16 倍)、質量過濾(30+ 啟發式規則)、語義去重、PII 信息脫敏、NSFW 檢測功能。通過 RAPIDS 在 GPU 上橫向擴展。用於準備高質量訓練數據…… | mlops/evaluation/nemo-curator |
sparse-autoencoder-training | 提供使用 SAELens 訓練和分析稀疏自編碼器(SAE)的指導,將神經網絡激活分解為可解釋特徵。用於發現可解釋特徵、分析超疊加現象,或研究語言模型中的單義表示…… | mlops/evaluation/saelens |
weights-and-biases | 使用自動日誌記錄追蹤機器學習實驗,實時可視化訓練過程,通過實驗掃描優化超參數,並使用 W&B 管理模型註冊表——協作式 MLOps 平臺 | mlops/evaluation/weights-and-biases |
mlops/inference
模型服務、量化(GGUF/GPTQ)、結構化輸出、推理優化和模型手術工具,用於部署和運行大語言模型。
| 技能 | 描述 | 路徑 |
|---|
gguf-quantization | GGUF 格式和 llama.cpp 量化,用於高效 CPU/GPU 推理。當您需要在消費級硬件、Apple Silicon 上部署模型,或需要 2-8 位靈活量化且無需 GPU 要求時使用。 | mlops/inference/gguf |
guidance | 使用正則表達式和語法控制大語言模型輸出,確保生成有效的 JSON/XML/代碼,強制結構化格式,並使用 Guidance 構建多步驟工作流——微軟研究院的約束生成框架 | mlops/inference/guidance |
instructor | 使用 Pydantic 驗證從大語言模型響應中提取結構化數據,自動重試失敗的提取,以類型安全方式解析複雜 JSON,並流式傳輸部分結果——經過實戰檢驗的結構化輸出庫 | mlops/inference/instructor |
llama-cpp | 在 CPU、Apple Silicon 和消費級 GPU 上運行大語言模型推理,無需 NVIDIA 硬件。用於邊緣部署、M1/M2/M3 Mac 電腦、AMD/Intel GPU,或當 CUDA 不可用時。支持 GGUF 量化(1.5-8 位),減少內存佔用,相比 PyTorch 在 CPU 上提速 4-10 倍。 | mlops/inference/llama-cpp |
obliteratus | 使用 OBLITERATUS 技術從開源權重大語言模型中移除拒絕行為——基於機制可解釋性技術(均值差異、SVD、白化 SVD、LEACE、SAE 分解等)移除防護機制,同時保留推理能力。提供 9 種 CLI 方法,28 個分析模塊,116 個模型預設…… | mlops/inference/obliteratus |
outlines | 在生成過程中保證有效的 JSON/XML/代碼結構,使用 Pydantic 模型實現類型安全輸出,支持本地模型(Transformers、vLLM),並通過 Outlines——dottxt.ai 的結構化生成庫最大化推理速度 | mlops/inference/outlines |
serving-llms-vllm | 使用 vLLM 的 PagedAttention 和連續批處理實現高吞吐量大語言模型服務。用於部署生產級大語言模型 API、優化推理延遲/吞吐量,或在 GPU 內存有限的情況下服務模型。支持 OpenAI 兼容端點、量化(GPTQ/AWQ/FP8)、連續批處理、動態批處理等功能…… | mlops/inference/vllm |
tensorrt-llm | 使用 NVIDIA TensorRT 優化大語言模型推理,實現最高吞吐量和最低延遲。用於在 NVIDIA GPU(A100/H100)上進行生產部署,當您需要比 PyTorch 快 10-100 倍的推理性能,或需要支持量化(FP8/INT4)、飛行中批處理和多模型併發服務時使用…… | mlops/inference/tensorrt-llm |
mlops/models
特定的模型架構與工具 —— 計算機視覺(CLIP、SAM、Stable Diffusion)、語音(Whisper)、音頻生成(AudioCraft)以及多模態模型(LLaVA)。
| 技能 | 描述 | 路徑 |
|---|
audiocraft-audio-generation | 用於音頻生成的 PyTorch 庫,包括文本到音樂(MusicGen)和文本到聲音(AudioGen)。當需要根據文本描述生成音樂、創建音效或進行旋律條件下的音樂生成時使用。 | mlops/models/audiocraft |
clip | OpenAI 的模型,連接視覺與語言。支持零樣本圖像分類、圖像-文本匹配以及跨模態檢索。在 4 億張圖像-文本對上訓練。適用於無需微調即可進行圖像搜索、內容審核或視覺-語言任務。適用於通用用途… | mlops/models/clip |
llava | 大型語言與視覺助手。支持視覺指令調優和基於圖像的對話。結合 CLIP 視覺編碼器與 Vicuna/LLaMA 語言模型。支持多輪圖像聊天、視覺問答和指令遵循。適用於視覺-語言對話… | mlops/models/llava |
segment-anything-model | 圖像分割的基礎模型,支持零樣本遷移。當需要使用點、框或掩碼作為提示來分割圖像中的任意對象,或自動生成圖像中所有對象的掩碼時使用。 | mlops/models/segment-anything |
stable-diffusion-image-generation | 基於 HuggingFace Diffusers 的先進文本到圖像生成模型(Stable Diffusion)。適用於根據文本提示生成圖像、執行圖像到圖像轉換、圖像修復(inpainting),或構建自定義擴散流水線。 | mlops/models/stable-diffusion |
whisper | OpenAI 的通用語音識別模型。支持 99 種語言,具備轉錄、翻譯為英語以及語言識別功能。提供六種模型尺寸,從 tiny(3900 萬參數)到 large(15.5 億參數)。適用於語音轉文字、播客轉錄或多語言音頻處理… | mlops/models/whisper |
mlops/research
用於構建和優化 AI 系統的機器學習研究框架,支持聲明式編程。
| 技能 | 描述 | 路徑 |
|---|
dspy | 使用聲明式編程構建複雜的 AI 系統,自動優化提示,通過 DSPy(斯坦福 NLP 的系統化大語言模型編程框架)創建模塊化 RAG 系統和智能體 | mlops/research/dspy |
mlops/training
用於微調、RLHF/DPO/GRPO 訓練、分佈式訓練框架以及優化工具,支持 LLM 及其他模型的訓練。
| 技能 | 描述 | 路徑 |
|---|
axolotl | 使用 Axolotl 進行 LLM 微調的專家指導 - YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模態支持 | mlops/training/axolotl |
distributed-llm-pretraining-torchtitan | 使用 torchtitan 提供原生 PyTorch 分佈式 LLM 預訓練,支持 4D 並行(FSDP2、TP、PP、CP)。適用於在 8 到 512+ GPU 上大規模預訓練 Llama 3.1、DeepSeek V3 或自定義模型,支持 Float8、torch.compile 和分佈式檢查點。 | mlops/training/torchtitan |
fine-tuning-with-trl | 使用 TRL 進行強化學習微調 LLM - SFT 用於指令調優,DPO 用於偏好對齊,PPO/GRPO 用於獎勵優化,以及獎勵模型訓練。適用於需要 RLHF、對齊模型偏好或從人類反饋中訓練的場景。兼容 HuggingFace Tr… | mlops/training/trl-fine-tuning |
grpo-rl-training | 使用 TRL 進行 GRPO/RL 微調的專家指導,適用於推理和任務特定模型訓練 | mlops/training/grpo-rl-training |
hermes-atropos-environments | 構建、測試和調試 Hermes Agent RL 環境以用於 Atropos 訓練。涵蓋 HermesAgentBaseEnv 接口、獎勵函數、Agent 循環集成、工具評估、wandb 日誌記錄以及三種 CLI 模式(serve/process/evaluate)。適用於創建、審查或調試 Atropos 訓練環境。 | mlops/training/hermes-atropos-environments |
huggingface-accelerate | 最簡單的分佈式訓練 API。僅需 4 行代碼即可為任意 PyTorch 腳本添加分佈式支持。統一的 DeepSpeed/FSDP/Megatron/DDP API。自動設備分配、混合精度(FP16/BF16/FP8)。交互式配置,單命令啟動。HuggingFace 生態系統標準。 | mlops/training/accelerate |
optimizing-attention-flash | 使用 Flash Attention 優化 Transformer 注意力機制,實現 2-4 倍加速和 10-20 倍內存減少。適用於訓練/運行長序列(>512 tokens)的 Transformer 模型,或遇到注意力機制導致 GPU 內存不足的問題,或需要更快推理速度的場景。支持 PyTorch 原生 SDPA,… | mlops/training/flash-attention |
peft-fine-tuning | 使用 LoRA、QLoRA 和 25+ 方法進行 LLM 的參數高效微調。適用於在 GPU 內存有限的情況下微調大模型(7B-70B),需要訓練 <1% 參數且精度損失最小,或進行多適配器服務的場景。HuggingFace 官方庫… | mlops/training/peft |
pytorch-fsdp | 使用 PyTorch FSDP 進行全分片數據並行訓練的專家指導 - 參數分片、混合精度、CPU卸載、FSDP2 | mlops/training/pytorch-fsdp |
pytorch-lightning | 高級 PyTorch 框架,包含 Trainer 類、自動分佈式訓練(DDP/FSDP/DeepSpeed)、回調系統和極少樣板代碼。代碼從筆記本電腦擴展到超級計算機保持一致。適用於希望使用內置最佳實踐的乾淨訓練循環。 | mlops/training/pytorch-lightning |
simpo-training | LLM 對齊的簡單偏好優化。DPO 的無參考替代方案,性能更優(AlpacaEval 2.0 上提升 +6.4 分)。無需參考模型,比 DPO 更高效。適用於希望比 DPO/PPO 更簡單、更快訓練的偏好對齊場景。 | mlops/training/simpo |
slime-rl-training | 提供使用 slime(Megatron+SGLang 框架)進行 LLM 後訓練的強化學習指導。適用於訓練 GLM 模型、實現自定義數據生成工作流,或需要與 Megatron-LM 緊密集成以實現 RL 擴展的場景。 | mlops/training/slime |
unsloth | 使用 Unsloth 實現快速微調的專家指導 - 訓練速度提升 2-5 倍,內存減少 50-80%,支持 LoRA/QLoRA 優化 | mlops/training/unsloth |
mlops/vector-databases
用於 RAG、語義搜索和 AI 應用後端的向量相似性搜索與嵌入數據庫。
| 技能 | 描述 | 路徑 |
|---|
chroma | 用於 AI 應用的開源嵌入數據庫。存儲嵌入向量和元數據,執行向量搜索和全文搜索,按元數據過濾。簡單的四函數 API。可從筆記本擴展到生產集群。適用於語義搜索、RAG 應用或文檔檢索。最佳適用於…… | mlops/vector-databases/chroma |
faiss | Facebook 開發的高效相似性搜索與密集向量聚類庫。支持數十億向量,支持 GPU 加速,提供多種索引類型(Flat、IVF、HNSW)。適用於快速 k-NN 搜索、大規模向量檢索,或需要純相似性搜索而無需…… | mlops/vector-databases/faiss |
pinecone | 用於生產級 AI 應用的託管向量數據庫。完全託管,自動擴展,支持混合搜索(密集 + 稀疏),元數據過濾和命名空間。延遲極低(p95 <100ms)。適用於生產級 RAG、推薦系統或大規模語義搜索。最適合服務器…… | mlops/vector-databases/pinecone |
qdrant-vector-search | 用於 RAG 和語義搜索的高性能向量相似性搜索引擎。適用於構建需要快速最近鄰搜索、帶過濾的混合搜索,或使用 Rust 驅動性能的可擴展向量存儲的生產級 RAG 系統。 | mlops/vector-databases/qdrant |
筆記記錄
筆記記錄技能,用於保存信息、輔助研究,以及在多輪會話中協作規劃和信息共享。
| 技能 | 描述 | 路徑 |
|---|
obsidian | 在 Obsidian 倉庫中閱讀、搜索和創建筆記。 | note-taking/obsidian |
生產力
用於文檔創建、演示文稿、電子表格及其他生產力工作流的技能。
| 技能 | 描述 | 路徑 |
|---|
google-workspace | 通過 Python 集成 Gmail、日曆、驅動器、聯繫人、電子表格和文檔。使用 OAuth2 並支持自動令牌刷新。無需外部二進制文件——完全在 Hermes 虛擬環境中使用 Google 的 Python 客戶端庫運行。 | productivity/google-workspace |
linear | 通過 GraphQL API 管理 Linear 問題、項目和團隊。創建、更新、搜索和組織問題。 | productivity/linear |
nano-pdf | 使用 nano-pdf 命令行工具,通過自然語言指令編輯 PDF。修改文本、修復拼寫錯誤、更新標題,並對特定頁面的內容進行更改,無需手動編輯。 | productivity/nano-pdf |
notion | 使用 Notion API 通過 curl 創建和管理頁面、數據庫和塊。直接從終端搜索、創建、更新和查詢 Notion 工作區。 | productivity/notion |
ocr-and-documents | 從 PDF 和掃描文檔中提取文本。使用 web_extract 處理遠程 URL,使用 pymupdf 處理本地文本型 PDF,使用 marker-pdf 處理 OCR/掃描文檔。對於 DOCX 文件使用 python-docx,PPTX 文件請參考 powerpoint 技能。 | productivity/ocr-and-documents |
powerpoint | “任何涉及 .pptx 文件的情況均可使用此技能——無論是輸入、輸出或兩者兼有。包括:創建幻燈片演示文稿、路演演示文稿或演示文稿;讀取、解析或從任意 .pptx 文件中提取文本(即使提取的內容將用於其他地方,例如…… | productivity/powerpoint |
用於學術研究、論文發現、文獻綜述、領域偵察、市場數據、內容監控和科學知識檢索的技能。
| 技能 | 描述 | 路徑 |
|---|
arxiv | 使用 arXiv 的免費 REST API 搜索和檢索學術論文。無需 API 密鑰。可通過關鍵詞、作者、類別或 ID 進行搜索。可與 web_extract 或 ocr-and-documents 技能結合,以讀取完整論文內容。 | research/arxiv |
blogwatcher | 使用 blogwatcher CLI 監控博客和 RSS/Atom 訂閱源的更新。添加博客、掃描新文章,並跟蹤已閱讀內容。 | research/blogwatcher |
llm-wiki | Karpathy 的 LLM Wiki — 構建並維護一個持久、相互鏈接的 Markdown 知識庫。可導入源內容,查詢已編譯的知識,並進行一致性檢查。與 RAG 不同,該 Wiki 僅編譯一次並保持最新狀態。可作為 Obsidian 倉庫使用。通過 skills.config.wiki.path 配置。 | research/llm-wiki |
domain-intel | 使用 Python 標準庫進行被動域名偵察。包括子域名發現、SSL 證書檢查、WHOIS 查詢、DNS 記錄分析、域名可用性檢查以及批量多域名分析。無需 API 密鑰。 | research/domain-intel |
duckduckgo-search | 通過 DuckDuckGo 進行免費網絡搜索 — 支持文本、新聞、圖片、視頻。無需 API 密鑰。安裝 ddgs CLI 後優先使用;僅在確認當前運行時 ddgs 可用時,才使用 Python 的 DDGS 庫。 | research/duckduckgo-search |
ml-paper-writing | 為 NeurIPS、ICML、ICLR、ACL、AAAI、COLM 等會議撰寫符合出版標準的機器學習/AI 論文。適用於從研究倉庫起草論文、構建論證結構、驗證引用或準備最終提交版本時使用。包含 LaTeX 模板、審稿人指南和引用驗證功能。 | research/ml-paper-writing |
polymarket | 查詢 Polymarket 預測市場數據 — 搜索市場、獲取價格、訂單簿和價格歷史。通過公共 REST API 僅讀取,無需 API 密鑰。 | research/polymarket |
red-teaming
用於 LLM 紅隊測試、越獄攻擊和安全過濾器繞過研究的技能。
| 技能 | 描述 | 路徑 |
|---|
godmode | 使用 G0DM0D3 技術對通過 API 提供的 LLM 進行越獄 — 包括 33 種 Parseltongue 輸入混淆技術、GODMODE CLASSIC 系統提示模板、ULTRAPLINIAN 多模型競速、編碼升級以及 Hermes 原生預填充/系統提示集成。適用於任何可通過 API 訪問的模型,包括閉源模型。 | red-teaming/godmode |
smart-home
用於控制智能家居設備 — 燈光、開關、傳感器和家庭自動化系統。
| 技能 | 描述 | 路徑 |
|---|
openhue | 通過 OpenHue CLI 控制 Philips Hue 燈具、房間和場景。可開關燈光、調節亮度、顏色、色溫,並激活場景。 | smart-home/openhue |
用於與社交平臺交互 — 發佈內容、閱讀信息、監控動態和賬戶操作。
| 技能 | 描述 | 路徑 |
|---|
xitter | 使用官方 X API 憑據,通過 x-cli 終端客戶端與 X/Twitter 交互。 | social-media/xitter |
software-development
| 技能 | 描述 | 路徑 |
|---|
code-review | 執行全面代碼審查的指南,重點關注安全性和質量 | software-development/code-review |
plan | Hermes 的規劃模式 — 檢查上下文,在當前工作區/後端工作目錄的 .hermes/plans/ 中編寫 Markdown 規劃文件,且不執行任何工作。 | software-development/plan |
requesting-code-review | 在完成任務、實現重大功能或合併前使用。通過系統化審查流程驗證工作是否滿足要求。 | software-development/requesting-code-review |
subagent-driven-development | 在執行實現計劃且任務獨立時使用。為每個任務分派新的 delegate_task,並進行兩階段審查(規範符合性,然後代碼質量)。 | software-development/subagent-driven-development |
systematic-debugging | 遇到任何錯誤、測試失敗或意外行為時使用。四階段根本原因調查 — 在理解問題之前不進行修復。 | software-development/systematic-debugging |
test-driven-development | 在實現任何功能或修復 bug 之前使用。強制執行 RED-GREEN-REFACTOR 循環,採用測試先行方法。 | software-development/test-driven-development |
writing-plans | 當你有多個步驟任務的規格或需求時使用。創建包含小任務、精確文件路徑和完整代碼示例的全面實現計劃。 | software-development/writing-plans |
可選技能
可選技能隨倉庫一起提供,位於 optional-skills/ 目錄下,但默認不啟用。它們涵蓋更重或更小眾的使用場景。通過以下方式安裝:
hermes skills install official/<category>/<skill>
autonomous-ai-agents
| 技能 | 描述 | 路徑 |
|---|
blackbox | 將編碼任務委派給 Blackbox AI CLI Agent。具備多模型能力的 Agent,內置評判機制,通過多個 LLM 執行任務並選擇最佳結果。需要安裝 blackbox CLI 並提供 Blackbox AI API 密鑰。 | autonomous-ai-agents/blackbox |
blockchain
| 技能 | 描述 | 路徑 |
|---|
base | 通過 Base RPC + CoinGecko 查詢 Base(以太坊 L2)區塊鏈數據並獲取美元定價信息——包括錢包餘額、代幣信息、交易詳情、Gas 分析、合約檢查、鯨魚檢測以及實時網絡狀態。無需 API 密鑰。 | blockchain/base |
solana | 通過 Solana RPC + CoinGecko 查詢 Solana 區塊鏈數據並獲取美元定價信息——包括錢包餘額、代幣組合及其價值、交易詳情、NFT、鯨魚檢測以及實時網絡狀態。無需 API 密鑰。 | blockchain/solana |
creative
| 技能 | 描述 | 路徑 |
|---|
blender-mcp | 通過 socket 連接,直接從 Hermes 控制 Blender。創建 3D 對象、材質、動畫,並運行任意 Blender Python(bpy)代碼。 | creative/blender-mcp |
meme-generation | 使用 Pillow 選擇模板併疊加文字,生成真實的 meme 圖像,輸出實際的 .png meme 文件。 | creative/meme-generation |
devops
| 技能 | 描述 | 路徑 |
|---|
docker-management | 管理 Docker 容器、鏡像、卷、網絡以及 Compose 堆棧——涵蓋生命週期操作、調試、清理和 Dockerfile 優化。 | devops/docker-management |
email
health
| 技能 | 描述 | 路徑 |
|---|
neuroskill-bci | 連接到正在運行的 NeuroSkill 實例,將用戶的實時認知與情緒狀態(專注度、放鬆度、情緒、認知負荷、睏倦、心率、HRV、睡眠階段以及 40 多項衍生 EXG 指標)融入響應中。需要配備 BCI 可穿戴設備(Muse 2/S 或 OpenBCI)及 NeuroSkill 桌面應用程序。 | health/neuroskill-bci |
mcp
| 技能 | 描述 | 路徑 |
|---|
fastmcp | 使用 Python 中的 FastMCP 構建、測試、檢查、安裝和部署 MCP 服務器。適用於創建新的 MCP 服務器、將 API 或數據庫封裝為 MCP 工具、暴露資源或提示,或為 HTTP 部署準備 FastMCP 服務器。 | mcp/fastmcp |
migration
| 技能 | 描述 | 路徑 |
|---|
openclaw-migration | 將用戶的 OpenClaw 自定義配置遷移至 Hermes Agent。從 ~/.openclaw 導入 Hermes 兼容的記憶、SOUL.md、命令允許列表、用戶技能以及選定的工作區資產,然後報告無法遷移的內容及其原因。 | migration/openclaw-migration |
productivity
| 技能 | 描述 | 路徑 |
|---|
telephony | 為 Hermes 提供電話功能——配置並持久化 Twilio 號碼,發送和接收短信/MMS,發起直接通話,以及通過 Bland.ai 或 Vapi 發起 AI 驅動的外呼。 | productivity/telephony |
research
| 技能 | 描述 | 路徑 |
|---|
bioinformatics | 通往 bioSkills 和 ClawBio 提供的 400 多項生物信息學技能的入口。涵蓋基因組學、轉錄組學、單細胞分析、變異檢測、藥物基因組學、宏基因組學、結構生物學等。 | research/bioinformatics |
qmd | 使用 qmd——一種結合 BM25、向量搜索和 LLM 重排序的混合檢索引擎——在本地搜索個人知識庫、筆記、文檔和會議記錄。支持 CLI 和 MCP 集成。 | research/qmd |
security
| 技能 | 描述 | 路徑 |
|---|
1password | 設置並使用 1Password CLI(op)。適用於安裝 CLI、啟用桌面應用集成、登錄,以及為命令讀取或注入密鑰。 | security/1password |
oss-forensics | 針對 GitHub 倉庫的供應鏈調查、證據恢復和取證分析。涵蓋已刪除提交恢復、強制推送檢測、IOC 提取、多源證據收集和結構化取證報告。 | security/oss-forensics |
sherlock | 在 400 多個社交網絡上進行 OSINT 用戶名搜索。通過用戶名追蹤社交媒體賬戶。 | security/sherlock |