apple-notes
通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。
下面两个网站是目前较流行的 Skill 聚合网站,有大量经过实战验证的优秀 Skill。如果想查看 Hermes Agent 出厂自带的 Skill,往下翻即可。
精品 Skill 分享评测平台,470+ 个 Skill 按场景分类。
有排行榜、合集和真实评测,能看到别人在用什么、哪些好用,找 Skill 不用一个个翻。覆盖开发辅助、效率工具、办公、自媒体、设计等 17+ 类。
去虾评逛逛 →腾讯维护的 AI Skill 社区,面向中国用户,精选 Top 50。
由腾讯团队运营,每个 Skill 都经过安全审核和多维度评估再上架。数量不堆,挑的都是靠谱货,适合不想自己一个个鉴别的人。
去 SkillHub 看精选 →Hermes 安装后自带 95 个 Skill。完整目录和路径见 Skill Catalog 文档。
通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。
通过 remindctl CLI 管理 Apple 提醒事项(列出、添加、完成、删除)。
通过 macOS 上的 FindMy.app 使用 AppleScript 和屏幕捕获功能追踪 Apple 设备和 AirTags。
通过 macOS 上的 imsg CLI 发送和接收 iMessage/SMS。
将编码任务委派给 Claude Code(Anthropic 的 CLI Agent)。适用于构建功能、重构代码、代码审查以及迭代式开发。需要已安装 claude CLI。
将编码任务委派给 OpenAI Codex CLI Agent。适用于构建功能、重构代码、代码审查以及批量修复问题。需要已安装 codex CLI 并配置 git 仓库。
启动额外的 Hermes Agent 实例作为自主子进程,用于独立的长时间运行任务。支持非交互式单次运行模式(-q)和交互式 PTY 模式,用于多轮协作。与 `delegate_task` 不同,此技能会运行一个完整的独立 hermes 进程。
将编码任务委派给 OpenCode CLI Agent,用于功能实现、代码重构、代码审查以及长时间运行的自主会话。需要已安装并认证 opencode CLI。
使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图像转 ASCII、远程 API(asciified、ascii.co.uk)以及 LLM 降级方案生成 ASCII 艺术。无需 API 密钥。
“ASCII 艺术视频的生产流水线 —— 支持任意格式。将视频/音频/图像/生成输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图像序列)。涵盖:视频转 ASCII 转换、音频响应式音乐可视化、生成式 ASCII 艺术动画、混合……”
使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件,用于架构图、流程图、时序图、概念图等。文件可在 excalidraw.com 打开,或上传以生成可分享链接。
用于交互式和生成式视觉艺术的生产流水线,基于 p5.js。创建草图,通过无头浏览器渲染为图像/视频,并提供实时预览。支持画布动画、数据可视化和创意编程实验。
创建和管理 Webhook 订阅,用于事件驱动的 Agent 激活。外部服务(GitHub、Stripe、CI/CD、IoT)通过 POST 事件来触发 Agent 运行。需要启用 Webhook 平台。
对 Web 应用程序进行系统性探索式 QA 测试 —— 发现缺陷、捕获证据并生成结构化报告。
帮助用户配置 Hermes Agent —— CLI 使用、设置向导、模型/提供方选择、工具、技能、语音/STT/TTS、网关以及故障排除。
通过 IMAP/SMTP 管理电子邮件的 CLI 工具。使用 himalaya 列出、阅读、撰写、回复、转发、搜索和整理电子邮件。支持多个账户,并可通过 MML(MIME 元语言)进行消息编写。
从 CurseForge/Modrinth 服务器包的 zip 文件中设置模组化 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙配置、局域网设置、备份以及启动脚本。
通过无头模拟器自主运行宝可梦游戏。启动游戏服务器,从内存中读取结构化游戏状态,做出战略决策,并发送按钮输入——全部通过终端完成。
使用 pygount 检查和分析代码库,统计行数(LOC)、语言分布以及代码与注释的比例。当被要求检查代码行数、仓库大小、语言构成或代码库统计信息时使用。
使用 git(普遍可用)或 gh CLI 为 Agent 设置 GitHub 身份验证。涵盖 HTTPS 令牌、SSH 密钥、凭证助手以及 gh auth —— 并具备自动检测流程以选择合适的方法。
通过分析 git diff 来审查代码变更,对 PR 提交内联评论,并进行彻底的预推送审查。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。
创建、管理、分类和关闭 GitHub 问题。搜索现有问题,添加标签,分配人员,并链接到 PR。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。
完整的拉取请求生命周期——创建分支、提交更改、打开 PR、监控 CI 状态、自动修复失败并合并。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。
克隆、创建、fork、配置和管理 GitHub 仓库。管理远程仓库、密钥、发布版本和工作流。支持 gh CLI,或回退至 git + GitHub REST API 通过 curl 实现。
通过 inference.sh CLI(infsh)运行 150+ 个 AI 应用——包括图像生成、视频创作、大语言模型(LLM)、搜索、3D 内容、社交自动化等。
使用 OpenStreetMap 查找附近地点(餐厅、咖啡馆、酒吧、药房等)。支持坐标、地址、城市、邮编或 Telegram 位置标记。无需 API 密钥。
使用 mcporter CLI 直接列出、配置、认证并调用 MCP 服务器/工具(支持 HTTP 或 stdio),包括临时服务器、配置编辑以及 CLI/类型生成。
内置的 MCP(模型上下文协议)客户端,可连接外部 MCP 服务器,发现其工具,并将其注册为原生 Hermes Agent 工具。支持 stdio 和 HTTP 传输,具备自动重连、安全过滤和零配置工具注入功能。
使用 curl 从 Tenor 搜索并下载 GIF。除 curl 和 jq 外无其他依赖。适用于查找反应 GIF、创建视觉内容以及在聊天中发送 GIF。
设置并运行 HeartMuLa,开源音乐生成模型系列(类似 Suno)。通过歌词 + 标签生成完整歌曲,支持多语言。
通过 CLI 从音频文件生成频谱图和音频特征可视化(如梅尔频谱、音高、MFCC、节拍图等)。适用于音频分析、音乐制作调试和可视化文档。
获取 YouTube 视频字幕,并将其转换为结构化内容(章节、摘要、话题线、博客文章等)。
Hugging Face Hub CLI(hf)——搜索、下载和上传模型与数据集,管理仓库,部署推理端点。
用于机器学习训练和推理的预留及按需 GPU 云实例。当您需要专用 GPU 实例、简单的 SSH 访问、持久化文件系统,或用于大规模训练的高性能多节点集群时使用。
用于运行机器学习工作负载的无服务器 GPU 云平台。当您需要按需访问 GPU 而无需管理基础设施、将机器学习模型部署为 API,或运行具有自动扩展功能的批处理作业时使用。
在 60 多个学术基准(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上评估大语言模型。用于模型质量基准测试、模型对比、报告学术结果或追踪训练进度。EleutherAI、HuggingFace 和主要研究实验室广泛采用的行业标准。支持……
针对研究和生产优化的快速分词器。基于 Rust 实现,可在 <20 秒内分词 1GB 数据。支持 BPE、WordPiece 和 Unigram 算法。可训练自定义词汇表,追踪对齐关系,处理填充/截断。与 transformers 无缝集成。用于……
用于大语言模型训练的 GPU 加速数据整理工具。支持文本/图像/视频/音频。具备模糊去重(快 16 倍)、质量过滤(30+ 启发式规则)、语义去重、PII 信息脱敏、NSFW 检测功能。通过 RAPIDS 在 GPU 上横向扩展。用于准备高质量训练数据……
提供使用 SAELens 训练和分析稀疏自编码器(SAE)的指导,将神经网络激活分解为可解释特征。用于发现可解释特征、分析超叠加现象,或研究语言模型中的单义表示……
使用自动日志记录追踪机器学习实验,实时可视化训练过程,通过实验扫描优化超参数,并使用 W&B 管理模型注册表——协作式 MLOps 平台
GGUF 格式和 llama.cpp 量化,用于高效 CPU/GPU 推理。当您需要在消费级硬件、Apple Silicon 上部署模型,或需要 2-8 位灵活量化且无需 GPU 要求时使用。
使用正则表达式和语法控制大语言模型输出,确保生成有效的 JSON/XML/代码,强制结构化格式,并使用 Guidance 构建多步骤工作流——微软研究院的约束生成框架
使用 Pydantic 验证从大语言模型响应中提取结构化数据,自动重试失败的提取,以类型安全方式解析复杂 JSON,并流式传输部分结果——经过实战检验的结构化输出库
在 CPU、Apple Silicon 和消费级 GPU 上运行大语言模型推理,无需 NVIDIA 硬件。用于边缘部署、M1/M2/M3 Mac 电脑、AMD/Intel GPU,或当 CUDA 不可用时。支持 GGUF 量化(1.5-8 位),减少内存占用,相比 PyTorch 在 CPU 上提速 4-10 倍。
使用 OBLITERATUS 技术从开源权重大语言模型中移除拒绝行为——基于机制可解释性技术(均值差异、SVD、白化 SVD、LEACE、SAE 分解等)移除防护机制,同时保留推理能力。提供 9 种 CLI 方法,28 个分析模块,116 个模型预设……
在生成过程中保证有效的 JSON/XML/代码结构,使用 Pydantic 模型实现类型安全输出,支持本地模型(Transformers、vLLM),并通过 Outlines——dottxt.ai 的结构化生成库最大化推理速度
使用 vLLM 的 PagedAttention 和连续批处理实现高吞吐量大语言模型服务。用于部署生产级大语言模型 API、优化推理延迟/吞吐量,或在 GPU 内存有限的情况下服务模型。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)、连续批处理、动态批处理等功能……
使用 NVIDIA TensorRT 优化大语言模型推理,实现最高吞吐量和最低延迟。用于在 NVIDIA GPU(A100/H100)上进行生产部署,当您需要比 PyTorch 快 10-100 倍的推理性能,或需要支持量化(FP8/INT4)、飞行中批处理和多模型并发服务时使用……
用于音频生成的 PyTorch 库,包括文本到音乐(MusicGen)和文本到声音(AudioGen)。当需要根据文本描述生成音乐、创建音效或进行旋律条件下的音乐生成时使用。
OpenAI 的模型,连接视觉与语言。支持零样本图像分类、图像-文本匹配以及跨模态检索。在 4 亿张图像-文本对上训练。适用于无需微调即可进行图像搜索、内容审核或视觉-语言任务。适用于通用用途…
大型语言与视觉助手。支持视觉指令调优和基于图像的对话。结合 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型。支持多轮图像聊天、视觉问答和指令遵循。适用于视觉-语言对话…
图像分割的基础模型,支持零样本迁移。当需要使用点、框或掩码作为提示来分割图像中的任意对象,或自动生成图像中所有对象的掩码时使用。
基于 HuggingFace Diffusers 的先进文本到图像生成模型(Stable Diffusion)。适用于根据文本提示生成图像、执行图像到图像转换、图像修复(inpainting),或构建自定义扩散流水线。
OpenAI 的通用语音识别模型。支持 99 种语言,具备转录、翻译为英语以及语言识别功能。提供六种模型尺寸,从 tiny(3900 万参数)到 large(15.5 亿参数)。适用于语音转文字、播客转录或多语言音频处理…
使用声明式编程构建复杂的 AI 系统,自动优化提示,通过 DSPy(斯坦福 NLP 的系统化大语言模型编程框架)创建模块化 RAG 系统和智能体
使用 Axolotl 进行 LLM 微调的专家指导 - YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持
使用 torchtitan 提供原生 PyTorch 分布式 LLM 预训练,支持 4D 并行(FSDP2、TP、PP、CP)。适用于在 8 到 512+ GPU 上大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型,支持 Float8、torch.compile 和分布式检查点。
使用 TRL 进行强化学习微调 LLM - SFT 用于指令调优,DPO 用于偏好对齐,PPO/GRPO 用于奖励优化,以及奖励模型训练。适用于需要 RLHF、对齐模型偏好或从人类反馈中训练的场景。兼容 HuggingFace Tr…
使用 TRL 进行 GRPO/RL 微调的专家指导,适用于推理和任务特定模型训练
构建、测试和调试 Hermes Agent RL 环境以用于 Atropos 训练。涵盖 HermesAgentBaseEnv 接口、奖励函数、Agent 循环集成、工具评估、wandb 日志记录以及三种 CLI 模式(serve/process/evaluate)。适用于创建、审查或调试 Atropos 训练环境。
最简单的分布式训练 API。仅需 4 行代码即可为任意 PyTorch 脚本添加分布式支持。统一的 DeepSpeed/FSDP/Megatron/DDP API。自动设备分配、混合精度(FP16/BF16/FP8)。交互式配置,单命令启动。HuggingFace 生态系统标准。
使用 Flash Attention 优化 Transformer 注意力机制,实现 2-4 倍加速和 10-20 倍内存减少。适用于训练/运行长序列(>512 tokens)的 Transformer 模型,或遇到注意力机制导致 GPU 内存不足的问题,或需要更快推理速度的场景。支持 PyTorch 原生 SDPA,…
使用 LoRA、QLoRA 和 25+ 方法进行 LLM 的参数高效微调。适用于在 GPU 内存有限的情况下微调大模型(7B-70B),需要训练 <1% 参数且精度损失最小,或进行多适配器服务的场景。HuggingFace 官方库…
高级 PyTorch 框架,包含 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调系统和极少样板代码。代码从笔记本电脑扩展到超级计算机保持一致。适用于希望使用内置最佳实践的干净训练循环。
LLM 对齐的简单偏好优化。DPO 的无参考替代方案,性能更优(AlpacaEval 2.0 上提升 +6.4 分)。无需参考模型,比 DPO 更高效。适用于希望比 DPO/PPO 更简单、更快训练的偏好对齐场景。
提供使用 slime(Megatron+SGLang 框架)进行 LLM 后训练的强化学习指导。适用于训练 GLM 模型、实现自定义数据生成工作流,或需要与 Megatron-LM 紧密集成以实现 RL 扩展的场景。
使用 Unsloth 实现快速微调的专家指导 - 训练速度提升 2-5 倍,内存减少 50-80%,支持 LoRA/QLoRA 优化
用于 AI 应用的开源嵌入数据库。存储嵌入向量和元数据,执行向量搜索和全文搜索,按元数据过滤。简单的四函数 API。可从笔记本扩展到生产集群。适用于语义搜索、RAG 应用或文档检索。最佳适用于……
Facebook 开发的高效相似性搜索与密集向量聚类库。支持数十亿向量,支持 GPU 加速,提供多种索引类型(Flat、IVF、HNSW)。适用于快速 k-NN 搜索、大规模向量检索,或需要纯相似性搜索而无需……
用于生产级 AI 应用的托管向量数据库。完全托管,自动扩展,支持混合搜索(密集 + 稀疏),元数据过滤和命名空间。延迟极低(p95 <100ms)。适用于生产级 RAG、推荐系统或大规模语义搜索。最适合服务器……
用于 RAG 和语义搜索的高性能向量相似性搜索引擎。适用于构建需要快速最近邻搜索、带过滤的混合搜索,或使用 Rust 驱动性能的可扩展向量存储的生产级 RAG 系统。
在 Obsidian 仓库中阅读、搜索和创建笔记。
通过 Python 集成 Gmail、日历、驱动器、联系人、电子表格和文档。使用 OAuth2 并支持自动令牌刷新。无需外部二进制文件——完全在 Hermes 虚拟环境中使用 Google 的 Python 客户端库运行。
通过 GraphQL API 管理 Linear 问题、项目和团队。创建、更新、搜索和组织问题。
使用 nano-pdf 命令行工具,通过自然语言指令编辑 PDF。修改文本、修复拼写错误、更新标题,并对特定页面的内容进行更改,无需手动编辑。
使用 Notion API 通过 curl 创建和管理页面、数据库和块。直接从终端搜索、创建、更新和查询 Notion 工作区。
从 PDF 和扫描文档中提取文本。使用 web_extract 处理远程 URL,使用 pymupdf 处理本地文本型 PDF,使用 marker-pdf 处理 OCR/扫描文档。对于 DOCX 文件使用 python-docx,PPTX 文件请参考 powerpoint 技能。
“任何涉及 .pptx 文件的情况均可使用此技能——无论是输入、输出或两者兼有。包括:创建幻灯片演示文稿、路演演示文稿或演示文稿;读取、解析或从任意 .pptx 文件中提取文本(即使提取的内容将用于其他地方,例如……
使用 arXiv 的免费 REST API 搜索和检索学术论文。无需 API 密钥。可通过关键词、作者、类别或 ID 进行搜索。可与 `web_extract` 或 `ocr-and-documents` 技能结合,以读取完整论文内容。
使用 blogwatcher CLI 监控博客和 RSS/Atom 订阅源的更新。添加博客、扫描新文章,并跟踪已阅读内容。
Karpathy 的 LLM Wiki — 构建并维护一个持久、相互链接的 Markdown 知识库。可导入源内容,查询已编译的知识,并进行一致性检查。与 RAG 不同,该 Wiki 仅编译一次并保持最新状态。可作为 Obsidian 仓库使用。通过 `skills.config.wiki.path` 配置。
使用 Python 标准库进行被动域名侦察。包括子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录分析、域名可用性检查以及批量多域名分析。无需 API 密钥。
通过 DuckDuckGo 进行免费网络搜索 — 支持文本、新闻、图片、视频。无需 API 密钥。安装 `ddgs` CLI 后优先使用;仅在确认当前运行时 `ddgs` 可用时,才使用 Python 的 DDGS 库。
为 NeurIPS、ICML、ICLR、ACL、AAAI、COLM 等会议撰写符合出版标准的机器学习/AI 论文。适用于从研究仓库起草论文、构建论证结构、验证引用或准备最终提交版本时使用。包含 LaTeX 模板、审稿人指南和引用验证功能。
查询 Polymarket 预测市场数据 — 搜索市场、获取价格、订单簿和价格历史。通过公共 REST API 仅读取,无需 API 密钥。
使用 G0DM0D3 技术对通过 API 提供的 LLM 进行越狱 — 包括 33 种 Parseltongue 输入混淆技术、GODMODE CLASSIC 系统提示模板、ULTRAPLINIAN 多模型竞速、编码升级以及 Hermes 原生预填充/系统提示集成。适用于任何可通过 API 访问的模型,包括闭源模型。
通过 OpenHue CLI 控制 Philips Hue 灯具、房间和场景。可开关灯光、调节亮度、颜色、色温,并激活场景。
使用官方 X API 凭据,通过 x-cli 终端客户端与 X/Twitter 交互。
执行全面代码审查的指南,重点关注安全性和质量
Hermes 的规划模式 — 检查上下文,在当前工作区/后端工作目录的 `.hermes/plans/` 中编写 Markdown 规划文件,且不执行任何工作。
在完成任务、实现重大功能或合并前使用。通过系统化审查流程验证工作是否满足要求。
在执行实现计划且任务独立时使用。为每个任务分派新的 `delegate_task`,并进行两阶段审查(规范符合性,然后代码质量)。
遇到任何错误、测试失败或意外行为时使用。四阶段根本原因调查 — 在理解问题之前不进行修复。
在实现任何功能或修复 bug 之前使用。强制执行 RED-GREEN-REFACTOR 循环,采用测试先行方法。
当你有多个步骤任务的规格或需求时使用。创建包含小任务、精确文件路径和完整代码示例的全面实现计划。