跳到主要内容

好用的 Skill 去哪找?

下面两个网站是目前较流行的 Skill 聚合网站,有大量经过实战验证的优秀 Skill。如果想查看 Hermes Agent 出厂自带的 Skill,往下翻即可。

虾评

xiaping.coze.com

精品 Skill 分享评测平台,470+ 个 Skill 按场景分类。

有排行榜、合集和真实评测,能看到别人在用什么、哪些好用,找 Skill 不用一个个翻。覆盖开发辅助、效率工具、办公、自媒体、设计等 17+ 类。

去虾评逛逛

SkillHub

skillhub.cn

腾讯维护的 AI Skill 社区,面向中国用户,精选 Top 50。

由腾讯团队运营,每个 Skill 都经过安全审核和多维度评估再上架。数量不堆,挑的都是靠谱货,适合不想自己一个个鉴别的人。

去 SkillHub 看精选

Hermes 内置 Skill 速查

Hermes 安装后自带 95 个 Skill。完整目录和路径见 Skill Catalog 文档

Apple 系统

apple-notes

通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。

Apple 系统

apple-reminders

通过 remindctl CLI 管理 Apple 提醒事项(列出、添加、完成、删除)。

Apple 系统

findmy

通过 macOS 上的 FindMy.app 使用 AppleScript 和屏幕捕获功能追踪 Apple 设备和 AirTags。

Apple 系统

imessage

通过 macOS 上的 imsg CLI 发送和接收 iMessage/SMS。

自主 Agent

claude-code

将编码任务委派给 Claude Code(Anthropic 的 CLI Agent)。适用于构建功能、重构代码、代码审查以及迭代式开发。需要已安装 claude CLI。

自主 Agent

codex

将编码任务委派给 OpenAI Codex CLI Agent。适用于构建功能、重构代码、代码审查以及批量修复问题。需要已安装 codex CLI 并配置 git 仓库。

自主 Agent

hermes-agent-spawning

启动额外的 Hermes Agent 实例作为自主子进程,用于独立的长时间运行任务。支持非交互式单次运行模式(-q)和交互式 PTY 模式,用于多轮协作。与 `delegate_task` 不同,此技能会运行一个完整的独立 hermes 进程。

自主 Agent

opencode

将编码任务委派给 OpenCode CLI Agent,用于功能实现、代码重构、代码审查以及长时间运行的自主会话。需要已安装并认证 opencode CLI。

创意设计

ascii-art

使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图像转 ASCII、远程 API(asciified、ascii.co.uk)以及 LLM 降级方案生成 ASCII 艺术。无需 API 密钥。

创意设计

ascii-video

“ASCII 艺术视频的生产流水线 —— 支持任意格式。将视频/音频/图像/生成输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图像序列)。涵盖:视频转 ASCII 转换、音频响应式音乐可视化、生成式 ASCII 艺术动画、混合……”

创意设计

excalidraw

使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件,用于架构图、流程图、时序图、概念图等。文件可在 excalidraw.com 打开,或上传以生成可分享链接。

创意设计

p5js

用于交互式和生成式视觉艺术的生产流水线,基于 p5.js。创建草图,通过无头浏览器渲染为图像/视频,并提供实时预览。支持画布动画、数据可视化和创意编程实验。

DevOps

webhook-subscriptions

创建和管理 Webhook 订阅,用于事件驱动的 Agent 激活。外部服务(GitHub、Stripe、CI/CD、IoT)通过 POST 事件来触发 Agent 运行。需要启用 Webhook 平台。

Dogfood

dogfood

对 Web 应用程序进行系统性探索式 QA 测试 —— 发现缺陷、捕获证据并生成结构化报告。

Dogfood

hermes-agent-setup

帮助用户配置 Hermes Agent —— CLI 使用、设置向导、模型/提供方选择、工具、技能、语音/STT/TTS、网关以及故障排除。

邮件

himalaya

通过 IMAP/SMTP 管理电子邮件的 CLI 工具。使用 himalaya 列出、阅读、撰写、回复、转发、搜索和整理电子邮件。支持多个账户,并可通过 MML(MIME 元语言)进行消息编写。

游戏

minecraft-modpack-server

从 CurseForge/Modrinth 服务器包的 zip 文件中设置模组化 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙配置、局域网设置、备份以及启动脚本。

游戏

pokemon-player

通过无头模拟器自主运行宝可梦游戏。启动游戏服务器,从内存中读取结构化游戏状态,做出战略决策,并发送按钮输入——全部通过终端完成。

GitHub

codebase-inspection

使用 pygount 检查和分析代码库,统计行数(LOC)、语言分布以及代码与注释的比例。当被要求检查代码行数、仓库大小、语言构成或代码库统计信息时使用。

GitHub

github-auth

使用 git(普遍可用)或 gh CLI 为 Agent 设置 GitHub 身份验证。涵盖 HTTPS 令牌、SSH 密钥、凭证助手以及 gh auth —— 并具备自动检测流程以选择合适的方法。

GitHub

github-code-review

通过分析 git diff 来审查代码变更,对 PR 提交内联评论,并进行彻底的预推送审查。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。

GitHub

github-issues

创建、管理、分类和关闭 GitHub 问题。搜索现有问题,添加标签,分配人员,并链接到 PR。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。

GitHub

github-pr-workflow

完整的拉取请求生命周期——创建分支、提交更改、打开 PR、监控 CI 状态、自动修复失败并合并。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。

GitHub

github-repo-management

克隆、创建、fork、配置和管理 GitHub 仓库。管理远程仓库、密钥、发布版本和工作流。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。

Inference.sh

inference-sh-cli

通过 inference.sh CLI(infsh)运行 150+ 个 AI 应用——包括图像生成、视频创作、大语言模型(LLM)、搜索、3D 内容、社交自动化等。

生活

find-nearby

使用 OpenStreetMap 查找附近地点(餐厅、咖啡馆、酒吧、药房等)。支持坐标、地址、城市、邮编或 Telegram 位置标记。无需 API 密钥。

MCP

mcporter

使用 mcporter CLI 直接列出、配置、认证并调用 MCP 服务器/工具(支持 HTTP 或 stdio),包括临时服务器、配置编辑以及 CLI/类型生成。

MCP

native-mcp

内置的 MCP(模型上下文协议)客户端,可连接外部 MCP 服务器,发现其工具,并将其注册为原生 Hermes Agent 工具。支持 stdio 和 HTTP 传输,具备自动重连、安全过滤和零配置工具注入功能。

多媒体

gif-search

使用 curl 从 Tenor 搜索并下载 GIF。除 curl 和 jq 外无其他依赖。适用于查找反应 GIF、创建视觉内容以及在聊天中发送 GIF。

多媒体

heartmula

设置并运行 HeartMuLa,开源音乐生成模型系列(类似 Suno)。通过歌词 + 标签生成完整歌曲,支持多语言。

多媒体

songsee

通过 CLI 从音频文件生成频谱图和音频特征可视化(如梅尔频谱、音高、MFCC、节拍图等)。适用于音频分析、音乐制作调试和可视化文档。

多媒体

youtube-content

获取 YouTube 视频字幕,并将其转换为结构化内容(章节、摘要、话题线、博客文章等)。

MLOps

huggingface-hub

Hugging Face Hub CLI(hf)——搜索、下载和上传模型与数据集,管理仓库,部署推理端点。

MLOps · 云

lambda-labs-gpu-cloud

用于机器学习训练和推理的预留及按需 GPU 云实例。当您需要专用 GPU 实例、简单的 SSH 访问、持久化文件系统,或用于大规模训练的高性能多节点集群时使用。

MLOps · 云

modal-serverless-gpu

用于运行机器学习工作负载的无服务器 GPU 云平台。当您需要按需访问 GPU 而无需管理基础设施、将机器学习模型部署为 API,或运行具有自动扩展功能的批处理作业时使用。

MLOps · 评测

evaluating-llms-harness

在 60 多个学术基准(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上评估大语言模型。用于模型质量基准测试、模型对比、报告学术结果或追踪训练进度。EleutherAI、HuggingFace 和主要研究实验室广泛采用的行业标准。支持……

MLOps · 评测

huggingface-tokenizers

针对研究和生产优化的快速分词器。基于 Rust 实现,可在 <20 秒内分词 1GB 数据。支持 BPE、WordPiece 和 Unigram 算法。可训练自定义词汇表,追踪对齐关系,处理填充/截断。与 transformers 无缝集成。用于……

MLOps · 评测

nemo-curator

用于大语言模型训练的 GPU 加速数据整理工具。支持文本/图像/视频/音频。具备模糊去重(快 16 倍)、质量过滤(30+ 启发式规则)、语义去重、PII 信息脱敏、NSFW 检测功能。通过 RAPIDS 在 GPU 上横向扩展。用于准备高质量训练数据……

MLOps · 评测

sparse-autoencoder-training

提供使用 SAELens 训练和分析稀疏自编码器(SAE)的指导,将神经网络激活分解为可解释特征。用于发现可解释特征、分析超叠加现象,或研究语言模型中的单义表示……

MLOps · 评测

weights-and-biases

使用自动日志记录追踪机器学习实验,实时可视化训练过程,通过实验扫描优化超参数,并使用 W&B 管理模型注册表——协作式 MLOps 平台

MLOps · 推理

gguf-quantization

GGUF 格式和 llama.cpp 量化,用于高效 CPU/GPU 推理。当您需要在消费级硬件、Apple Silicon 上部署模型,或需要 2-8 位灵活量化且无需 GPU 要求时使用。

MLOps · 推理

guidance

使用正则表达式和语法控制大语言模型输出,确保生成有效的 JSON/XML/代码,强制结构化格式,并使用 Guidance 构建多步骤工作流——微软研究院的约束生成框架

MLOps · 推理

instructor

使用 Pydantic 验证从大语言模型响应中提取结构化数据,自动重试失败的提取,以类型安全方式解析复杂 JSON,并流式传输部分结果——经过实战检验的结构化输出库

MLOps · 推理

llama-cpp

在 CPU、Apple Silicon 和消费级 GPU 上运行大语言模型推理,无需 NVIDIA 硬件。用于边缘部署、M1/M2/M3 Mac 电脑、AMD/Intel GPU,或当 CUDA 不可用时。支持 GGUF 量化(1.5-8 位),减少内存占用,相比 PyTorch 在 CPU 上提速 4-10 倍。

MLOps · 推理

obliteratus

使用 OBLITERATUS 技术从开源权重大语言模型中移除拒绝行为——基于机制可解释性技术(均值差异、SVD、白化 SVD、LEACE、SAE 分解等)移除防护机制,同时保留推理能力。提供 9 种 CLI 方法,28 个分析模块,116 个模型预设……

MLOps · 推理

outlines

在生成过程中保证有效的 JSON/XML/代码结构,使用 Pydantic 模型实现类型安全输出,支持本地模型(Transformers、vLLM),并通过 Outlines——dottxt.ai 的结构化生成库最大化推理速度

MLOps · 推理

serving-llms-vllm

使用 vLLM 的 PagedAttention 和连续批处理实现高吞吐量大语言模型服务。用于部署生产级大语言模型 API、优化推理延迟/吞吐量,或在 GPU 内存有限的情况下服务模型。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)、连续批处理、动态批处理等功能……

MLOps · 推理

tensorrt-llm

使用 NVIDIA TensorRT 优化大语言模型推理,实现最高吞吐量和最低延迟。用于在 NVIDIA GPU(A100/H100)上进行生产部署,当您需要比 PyTorch 快 10-100 倍的推理性能,或需要支持量化(FP8/INT4)、飞行中批处理和多模型并发服务时使用……

MLOps · 模型

audiocraft-audio-generation

用于音频生成的 PyTorch 库,包括文本到音乐(MusicGen)和文本到声音(AudioGen)。当需要根据文本描述生成音乐、创建音效或进行旋律条件下的音乐生成时使用。

MLOps · 模型

clip

OpenAI 的模型,连接视觉与语言。支持零样本图像分类、图像-文本匹配以及跨模态检索。在 4 亿张图像-文本对上训练。适用于无需微调即可进行图像搜索、内容审核或视觉-语言任务。适用于通用用途…

MLOps · 模型

llava

大型语言与视觉助手。支持视觉指令调优和基于图像的对话。结合 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型。支持多轮图像聊天、视觉问答和指令遵循。适用于视觉-语言对话…

MLOps · 模型

segment-anything-model

图像分割的基础模型,支持零样本迁移。当需要使用点、框或掩码作为提示来分割图像中的任意对象,或自动生成图像中所有对象的掩码时使用。

MLOps · 模型

stable-diffusion-image-generation

基于 HuggingFace Diffusers 的先进文本到图像生成模型(Stable Diffusion)。适用于根据文本提示生成图像、执行图像到图像转换、图像修复(inpainting),或构建自定义扩散流水线。

MLOps · 模型

whisper

OpenAI 的通用语音识别模型。支持 99 种语言,具备转录、翻译为英语以及语言识别功能。提供六种模型尺寸,从 tiny(3900 万参数)到 large(15.5 亿参数)。适用于语音转文字、播客转录或多语言音频处理…

MLOps · 研究

dspy

使用声明式编程构建复杂的 AI 系统,自动优化提示,通过 DSPy(斯坦福 NLP 的系统化大语言模型编程框架)创建模块化 RAG 系统和智能体

MLOps · 训练

axolotl

使用 Axolotl 进行 LLM 微调的专家指导 - YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持

MLOps · 训练

distributed-llm-pretraining-torchtitan

使用 torchtitan 提供原生 PyTorch 分布式 LLM 预训练,支持 4D 并行(FSDP2、TP、PP、CP)。适用于在 8 到 512+ GPU 上大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型,支持 Float8、torch.compile 和分布式检查点。

MLOps · 训练

fine-tuning-with-trl

使用 TRL 进行强化学习微调 LLM - SFT 用于指令调优,DPO 用于偏好对齐,PPO/GRPO 用于奖励优化,以及奖励模型训练。适用于需要 RLHF、对齐模型偏好或从人类反馈中训练的场景。兼容 HuggingFace Tr…

MLOps · 训练

grpo-rl-training

使用 TRL 进行 GRPO/RL 微调的专家指导,适用于推理和任务特定模型训练

MLOps · 训练

hermes-atropos-environments

构建、测试和调试 Hermes Agent RL 环境以用于 Atropos 训练。涵盖 HermesAgentBaseEnv 接口、奖励函数、Agent 循环集成、工具评估、wandb 日志记录以及三种 CLI 模式(serve/process/evaluate)。适用于创建、审查或调试 Atropos 训练环境。

MLOps · 训练

huggingface-accelerate

最简单的分布式训练 API。仅需 4 行代码即可为任意 PyTorch 脚本添加分布式支持。统一的 DeepSpeed/FSDP/Megatron/DDP API。自动设备分配、混合精度(FP16/BF16/FP8)。交互式配置,单命令启动。HuggingFace 生态系统标准。

MLOps · 训练

optimizing-attention-flash

使用 Flash Attention 优化 Transformer 注意力机制,实现 2-4 倍加速和 10-20 倍内存减少。适用于训练/运行长序列(>512 tokens)的 Transformer 模型,或遇到注意力机制导致 GPU 内存不足的问题,或需要更快推理速度的场景。支持 PyTorch 原生 SDPA,…

MLOps · 训练

peft-fine-tuning

使用 LoRA、QLoRA 和 25+ 方法进行 LLM 的参数高效微调。适用于在 GPU 内存有限的情况下微调大模型(7B-70B),需要训练 <1% 参数且精度损失最小,或进行多适配器服务的场景。HuggingFace 官方库…

MLOps · 训练

pytorch-lightning

高级 PyTorch 框架,包含 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调系统和极少样板代码。代码从笔记本电脑扩展到超级计算机保持一致。适用于希望使用内置最佳实践的干净训练循环。

MLOps · 训练

simpo-training

LLM 对齐的简单偏好优化。DPO 的无参考替代方案,性能更优(AlpacaEval 2.0 上提升 +6.4 分)。无需参考模型,比 DPO 更高效。适用于希望比 DPO/PPO 更简单、更快训练的偏好对齐场景。

MLOps · 训练

slime-rl-training

提供使用 slime(Megatron+SGLang 框架)进行 LLM 后训练的强化学习指导。适用于训练 GLM 模型、实现自定义数据生成工作流,或需要与 Megatron-LM 紧密集成以实现 RL 扩展的场景。

MLOps · 训练

unsloth

使用 Unsloth 实现快速微调的专家指导 - 训练速度提升 2-5 倍,内存减少 50-80%,支持 LoRA/QLoRA 优化

MLOps · 向量库

chroma

用于 AI 应用的开源嵌入数据库。存储嵌入向量和元数据,执行向量搜索和全文搜索,按元数据过滤。简单的四函数 API。可从笔记本扩展到生产集群。适用于语义搜索、RAG 应用或文档检索。最佳适用于……

MLOps · 向量库

faiss

Facebook 开发的高效相似性搜索与密集向量聚类库。支持数十亿向量,支持 GPU 加速,提供多种索引类型(Flat、IVF、HNSW)。适用于快速 k-NN 搜索、大规模向量检索,或需要纯相似性搜索而无需……

MLOps · 向量库

pinecone

用于生产级 AI 应用的托管向量数据库。完全托管,自动扩展,支持混合搜索(密集 + 稀疏),元数据过滤和命名空间。延迟极低(p95 <100ms)。适用于生产级 RAG、推荐系统或大规模语义搜索。最适合服务器……

MLOps · 向量库

qdrant-vector-search

用于 RAG 和语义搜索的高性能向量相似性搜索引擎。适用于构建需要快速最近邻搜索、带过滤的混合搜索,或使用 Rust 驱动性能的可扩展向量存储的生产级 RAG 系统。

笔记

obsidian

在 Obsidian 仓库中阅读、搜索和创建笔记。

效率工具

google-workspace

通过 Python 集成 Gmail、日历、驱动器、联系人、电子表格和文档。使用 OAuth2 并支持自动令牌刷新。无需外部二进制文件——完全在 Hermes 虚拟环境中使用 Google 的 Python 客户端库运行。

效率工具

linear

通过 GraphQL API 管理 Linear 问题、项目和团队。创建、更新、搜索和组织问题。

效率工具

nano-pdf

使用 nano-pdf 命令行工具,通过自然语言指令编辑 PDF。修改文本、修复拼写错误、更新标题,并对特定页面的内容进行更改,无需手动编辑。

效率工具

notion

使用 Notion API 通过 curl 创建和管理页面、数据库和块。直接从终端搜索、创建、更新和查询 Notion 工作区。

效率工具

ocr-and-documents

从 PDF 和扫描文档中提取文本。使用 web_extract 处理远程 URL,使用 pymupdf 处理本地文本型 PDF,使用 marker-pdf 处理 OCR/扫描文档。对于 DOCX 文件使用 python-docx,PPTX 文件请参考 powerpoint 技能。

效率工具

powerpoint

“任何涉及 .pptx 文件的情况均可使用此技能——无论是输入、输出或两者兼有。包括:创建幻灯片演示文稿、路演演示文稿或演示文稿;读取、解析或从任意 .pptx 文件中提取文本(即使提取的内容将用于其他地方,例如……

调研

arxiv

使用 arXiv 的免费 REST API 搜索和检索学术论文。无需 API 密钥。可通过关键词、作者、类别或 ID 进行搜索。可与 `web_extract` 或 `ocr-and-documents` 技能结合,以读取完整论文内容。

调研

blogwatcher

使用 blogwatcher CLI 监控博客和 RSS/Atom 订阅源的更新。添加博客、扫描新文章,并跟踪已阅读内容。

调研

llm-wiki

Karpathy 的 LLM Wiki — 构建并维护一个持久、相互链接的 Markdown 知识库。可导入源内容,查询已编译的知识,并进行一致性检查。与 RAG 不同,该 Wiki 仅编译一次并保持最新状态。可作为 Obsidian 仓库使用。通过 `skills.config.wiki.path` 配置。

调研

domain-intel

使用 Python 标准库进行被动域名侦察。包括子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录分析、域名可用性检查以及批量多域名分析。无需 API 密钥。

调研

duckduckgo-search

通过 DuckDuckGo 进行免费网络搜索 — 支持文本、新闻、图片、视频。无需 API 密钥。安装 `ddgs` CLI 后优先使用;仅在确认当前运行时 `ddgs` 可用时,才使用 Python 的 DDGS 库。

调研

ml-paper-writing

为 NeurIPS、ICML、ICLR、ACL、AAAI、COLM 等会议撰写符合出版标准的机器学习/AI 论文。适用于从研究仓库起草论文、构建论证结构、验证引用或准备最终提交版本时使用。包含 LaTeX 模板、审稿人指南和引用验证功能。

调研

polymarket

查询 Polymarket 预测市场数据 — 搜索市场、获取价格、订单簿和价格历史。通过公共 REST API 仅读取,无需 API 密钥。

红队 / 安全

godmode

使用 G0DM0D3 技术对通过 API 提供的 LLM 进行越狱 — 包括 33 种 Parseltongue 输入混淆技术、GODMODE CLASSIC 系统提示模板、ULTRAPLINIAN 多模型竞速、编码升级以及 Hermes 原生预填充/系统提示集成。适用于任何可通过 API 访问的模型,包括闭源模型。

智能家居

openhue

通过 OpenHue CLI 控制 Philips Hue 灯具、房间和场景。可开关灯光、调节亮度、颜色、色温,并激活场景。

社交媒体

xitter

使用官方 X API 凭据,通过 x-cli 终端客户端与 X/Twitter 交互。

软件开发

code-review

执行全面代码审查的指南,重点关注安全性和质量

软件开发

plan

Hermes 的规划模式 — 检查上下文,在当前工作区/后端工作目录的 `.hermes/plans/` 中编写 Markdown 规划文件,且不执行任何工作。

软件开发

requesting-code-review

在完成任务、实现重大功能或合并前使用。通过系统化审查流程验证工作是否满足要求。

软件开发

subagent-driven-development

在执行实现计划且任务独立时使用。为每个任务分派新的 `delegate_task`,并进行两阶段审查(规范符合性,然后代码质量)。

软件开发

systematic-debugging

遇到任何错误、测试失败或意外行为时使用。四阶段根本原因调查 — 在理解问题之前不进行修复。

软件开发

test-driven-development

在实现任何功能或修复 bug 之前使用。强制执行 RED-GREEN-REFACTOR 循环,采用测试先行方法。

软件开发

writing-plans

当你有多个步骤任务的规格或需求时使用。创建包含小任务、精确文件路径和完整代码示例的全面实现计划。