diff --git a/SKILL.md b/SKILL.md index 3b39d9a..867c4b7 100644 --- a/SKILL.md +++ b/SKILL.md @@ -1,18 +1,22 @@ --- name: humanizer-zh description: | - 去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。 - 基于维基百科的"AI 写作特征"综合指南。检测并修复以下模式:夸大的象征意义、 - 宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段式法则、 - AI 词汇、否定式排比、过多的连接性短语。 -allowed-tools: - - Read - - Write - - Edit - - AskUserQuestion + 去除中文文本中的 AI 生成痕迹,让文字听起来更自然、更像人类书写。 + 基于维基百科"Signs of AI writing"综合指南 + avoid-ai-writing v3.4.0 框架, + 检测并修复 42 种 AI 写作模式,含 P0/P1/P2 严重级别与三级词表系统。 + 触发场景:用户提到"润色这段文字"、"去除AI痕迹"、"让文字更自然"、 + "改写成人类写的"、"这是AI写的吧"、"润色中文文本"、"去除AI味"。 +version: 2.1.0 +category: writing metadata: - trigger: 编辑或审阅文本,去除 AI 写作痕迹 - source: 翻译自 blader/humanizer,参考 hardikpandya/stop-slop + openclaw: + os: [linux, darwin, windows] + author: 胖虎龙虾(翻译整理 + avoid-ai-writing 框架整合) + created: 2026-04-03 + updated: 2026-05-18 + sources: + - Wikipedia:Signs of AI writing (WikiProject AI Cleanup) + - conorbronsdon/avoid-ai-writing v3.4.0 (MIT License) --- # Humanizer-zh: 去除 AI 写作痕迹 @@ -21,8 +25,6 @@ metadata: ## 你的任务 -当收到需要人性化处理的文本时: - 1. **识别 AI 模式** - 扫描下面列出的模式 2. **重写问题片段** - 用自然的替代方案替换 AI 痕迹 3. **保留含义** - 保持核心信息完整 @@ -31,6 +33,42 @@ metadata: --- +## 严重级别(P0 / P1 / P2) + +每种 AI 模式按严重程度分级: + +| 级别 | 说明 | 行动 | +|------|------|------| +| **P0** | 信誉杀手 — 明显 AI 痕迹,读者会立即识别 | 立即修复 | +| **P1** | 明显 AI 气味 — 有经验的读者能察觉 | 发布前修复 | +| **P2** | 风格抛光 — 细微的 AI 风格问题 | 时间允许时修复 | + +### P0 — 必须立即修复 + +- 截止日期免责声明(「截至2024年」「根据我最后的训练更新」) +- 聊天机器人痕迹(「希望这对您有帮助!」「好问题!」「当然!」) +- 无源的模糊归因(「专家认为」「据观察者指出」) +- 常规事件的显著性膨胀(「这标志着行业重要里程碑」) + +### P1 — 发布前修复 + +- 词表违规(delve、leverage、harness、robust、pivotal、nuanced 等 AI 高频词) +- 模板短语和槽填充结构(「在当今快速发展的时代」「从X到Y」) +- 同一段落内同义词轮换(「开发者…工程师…实践者…建设者」) +- 公式化开头(「随着技术的快速发展…」) +- Em dash 使用频率超过 1/1000 字 +- 粗体过度使用 + +### P2 — 时间允许时修复 + +- 通用结论(「未来可期!」「前景光明!」) +- 强制三段式列举 +- 统一段落长度(无变化) +- 系词回避(「作为…」「拥有…」「提供…」) +- 过渡短语堆积(「此外」「更重要的是」「综上所述」) + +--- + ## 核心规则速查 在处理文本时,牢记这 5 条核心原则: @@ -40,6 +78,7 @@ metadata: 3. **变化节奏** - 混合句子长度。两项优于三项。段落结尾要多样化 4. **信任读者** - 直接陈述事实,跳过软化、辩解和手把手引导 5. **删除金句** - 如果听起来像可引用的语句,重写它 +6. **保留中文标点** - 句号用。,逗号用,顿号用、书名号用《》或「」,引号用「」或『』,不要替换为英文标点 --- @@ -403,37 +442,402 @@ metadata: --- +## Tier 1 词表汇总(必替词 — 来自模式 1-24) + +以下词汇在任意上下文均应替换为更自然的表达: + +| 违规词 | 改为 | +|--------|------| +| 标志着、见证了 | (陈述事实本身) | +| 至关重要的/关键的/核心的/关键性的 | 重要、主要 | +| 凸显/彰显了…的重要性 | 直接陈述事实 | +| 象征着 | (描述实际现象) | +| 深入探讨 | 探讨、研究、分析 | +| 复杂/复杂性 | 复杂、细节多 | +| 关键(形容词) | 重要、主要 | +| 格局(抽象)/织锦 | 领域、情况、局面 | +| 展示(动词)/体现/彰显 | 显示、说明 | +| 充满活力的/活力的 | (描述实际活跃程度或删除) | +| 拥有(夸张)/设有/提供(夸张) | 有 | +| 作为/充当/代表/标志着 | 是 | +| 深入/深刻的 | 详细、全面 | +| 持久的/持续的 | 长期、一贯 | +| 增强/强化/加持 | 加强、提高 | +| 培养/促进/推动 | 帮助、促使 | +| 获得(资源) | 拿到、得到 | +| 与…保持一致 | 符合、配合 | +| 宝贵的/有价值的 | 有用、重要 | +| 深入浅出 | (直接说内容) | +| 因此/于是(推理痕迹) | 所以、这导致 | +| 总而言之/综上所述 | (直接说结论) | +| 值得注意的是 | (直接陈述) | +| 实际上/其实(铺垫) | (直接说事实) | + +--- + +## Tier 2 / Tier 3 词表(avoid-ai-writing 扩展) + +### Tier 2 — 同段落出现 2 次以上时标记 + +以下词汇单独出现可接受,但同一段落出现 2 次以上则需替换: + +| 违规词 | 改为 | +|--------|------| +| 引领 / 驱动 | 领导、带来、造成 | +| 赋能 | 使能够、让 | +| 激活 / 激发 | 启动、引起 | +| 释放(潜力) | 解开、发挥 | +| 强化 / 加持 | 加强、巩固 | +| 构建(生态) | 建立、搭建 | +| 迭代 | 更新、改进 | +| 聚焦 | 关注、针对 | +| 颠覆 | 打破、改变 | +| 助力 | 帮助、推动 | +| 升级 | 提高、提升 | +| 夯实 | 巩固、打好 | +| 深耕 | 专注、长期做 | +| 践行 | 实践、执行 | +| 共创 | 一起做、合作 | +| 协同 | 合作、配合 | +| 洞察 | 看法、理解 | +| 重塑 | 改变、改造 | +| 贯通 | 打通、连接 | +| 蝶变 | 巨变、转变 | +| 多元 | 多种、多样 | +| 全方位 | 全面、各方面 | +| 精准 | 准确、精确 | +| 高效 | 快、效果好 | +| 敏捷 | 快、灵活 | +| 可持续 | 长期、持久 | +| 智能化 | 自动、聪明 | +| 极致 | 最好、最高 | +| 革新 | 改革、创新 | +| 破局 | 突破、解决 | +| 链接 | 连接、联系 | +| 闭环 | 完整、闭合 | +| 矩阵 | 组合、系列 | +| 赛道 | 领域、行业 | +| 生态(比喻) | 系统、社区、领域 | +| 玩法 | 方式、模式 | +| 打法 | 做法、策略 | +| 势能 | 势头、趋势 | +| 解锁 | 发挥、实现 | + +### Tier 3 — 高密度时标记(占全文 3% 以上) + +以下词汇在文本中占比超过 3% 时标记: + +创新(的)、重要/重要性、有效(地)、动态、可持续(性)、显著、卓越、领先、突破性、前沿/先进、世界级、一流 + +**Tier 3 短语(出现 2 次以上,或 3 种以上堆叠时标记):** +- 新兴领域 / 新兴行业 +- 深度融合 +- 多元协同 +- 社区驱动 +- 长期可持续性 +- 用户参与度 +- 去中心化计算 +- 代币化激励机制 +- 为长期设计 + +--- + +## 新增模式(25-42,来自 avoid-ai-writing v3.4.0 + 原创模式) + +### 25. 空心强化词(Hollow Intensifiers) + +**问题:** 用「真的」「确实」「相当」「坦白说」等词强化本来就很弱的观点。 + +**改写前:** +> 这真的/确实/相当重要,我们必须认真对待。 + +**改写后:** +> 这一点很重要,我们需要认真对待。 + +--- + +### 26. 推理链痕迹(Reasoning Chain Artifacts) + +**问题:** 刻意展示「思考过程」,如「因为X,所以Y,所以Z」的多步推导。 + +**改写前:** +> 由于市场需求增长(X),企业开始扩张(Y),因此行业整体产值提升(Z)。 + +**改写后:** +> 行业产值提升了。企业在扩张,因为需求在增长。 + +--- + +### 27. 确认循环(Acknowledgment Loops) + +**问题:** 不断确认读者可能同意的内容,拖慢节奏。 + +**改写前:** +> 您可能已经注意到……正如我们之前提到的……如您所见…… + +**改写后:** +> (直接陈述,不需要引导语) + +--- + +### 28. 信心校准短语(Confidence Calibration Phrases) + +**问题:** 用「也许」「可能」「某种程度上」等过度自我保护。 + +**改写前:** +> 这可能/也许/某种程度上是最好的选择。 + +**改写后:** +> 这是最好的选择。(或者直接说「我不确定这是不是最好的选择」) + +--- + +### 29. 过度结构化(Excessive Structure) + +**问题:** 清单、标题、编号过多,或每段都有小标题;列表超过 5 项且每项结构相同。两者本质相同——都是结构代替内容。 + +**改写前:** +> 一、背景。二、现状。三、挑战。四、机遇。五、未来展望。 +> 我们需要:1. 提升认知 2. 建立信任 3. 优化体验 4. 降低成本 5. 增加收益 6. 扩展渠道 + +**改写后:** +> 合并为自然段落,或只保留最重要的 1-2 个结构元素。列表只保留 2-3 项,其余并入正文。 + +--- + +### 30. 情感平线(Emotional Flatline) + +**问题:** 全篇语气平稳,没有任何起伏,读起来像数据报告。 + +**改写前:** +> 第一季度完成。第二季度启动。第三季度评估。第四季度总结。 + +**改写后:** +> 加入具体反应:「第一季度如期完成。唯一的意外是……」(让人感觉到真实的人在处理真实的情况) + +--- + +### 31. 「值得」模糊背书(Worth [Verb]ing) + +**问题:** 用「值得…」「值得关注」「值得一看」代替直接评价。 + +**改写前:** +> 这款产品值得一试。AI 领域有几个趋势值得关注。 + +**改写后:** +> 这款产品适合……AI 领域近期有三个变化……(直接说为什么) + +--- + +### 32. 读者引导框架(Reader-Steering Frames) + +**问题:** 告诉读者什么是有趣的、什么值得关注,而不是让内容本身显示。 + +**改写前:** +> 这里有一个有趣的发现……值得注意的是……重点是…… + +**改写后:** +> (直接呈现发现,让读者自己判断是否有趣) + +--- + +### 33. 通用未来叙事结尾(Generic Future-Narrative Closers) + +**问题:** 用「可能成为」「将成为」「预示着…的未来」等模糊未来预测结尾。 + +**改写前:** +> X 可能成为下一个最重要的技术叙事。 + +**改写后:** +> X 正在获得关注。如果趋势持续,……(具体说明会怎样) + +--- + +### 34. Hedge 堆叠预测(Hedge-Stacked Predictions) + +**问题:** 多个可能性词叠加,让预测毫无意义。 + +**改写前:** +> 这可能会/也许/可能最终/或许根本上改变…… + +**改写后:** +> 这会改变……(如果不确定,就说「我不确定这会不会改变」) + +--- + +### 35. 「真正/实际」形容词膨胀(Real/Actual Adjective Inflation) + +**问题:** 用「真正的」「实际的」「真实的」来强化本来就模糊的概念。 + +**改写前:** +> 真正的代币经济、实际的应用场景、真实的用户需求 + +**改写后:** +> 代币经济、应用场景、用户需求(加「真正的」反而暗示之前说的不是真的) + +--- + +### 36. 标签堆叠(Hashtag Stuffing) + +**问题:** 文章末尾或开头堆积过多标签。 + +**改写前:** +> #AI #人工智能 #科技 #未来 #创新 #数字化 + +**改写后:** +> 最多保留 1-2 个最相关的标签,或完全删除。 + +--- + +### 37. 裸名词短语子弹列表(Bare Noun Phrase Bullet Lists) + +**问题:** 连续出现 5+ 个「adj + noun」结构的无动词短语列表。 + +**改写前:** +> - 创新的解决方案 +> - 高效的性能表现 +> - 可靠的安全保障 +> - 卓越的用户体验 +> - 领先的技术架构 + +**改写后:** +> 把这些短语变成有动词的完整句子,或合并到段落中。 + +--- + +### 38. 虚假广度构造(False Breadth Construction) + +**问题:** 用「无论你是X还是Y」来假装覆盖广泛受众。 + +**改写前:** +> 无论你是初学者还是专家,新手还是老兵…… + +**改写后:** +> (删除这种结构,直接说内容本身) + +--- + +### 39. 虚假让步结构(False Concession Structure) + +**问题:** 假装有对立面,实际上没有。 + +**改写前:** +> 虽然存在一些挑战,但总体上……(挑战根本没有被认真讨论) + +**改写后:** +> 认真说明挑战是什么,以及为什么还是值得做。 + +--- + +### 40. 修辞性问题开场(Rhetorical Question Openers) + +**问题:** 以设问句开头却不回答,引导进入正文。 + +**改写前:** +> 什么是AI?让我们一起来探讨…… + +**改写后:** +> 直接开场:「AI是指……」或直接进入主题。 + +--- + +### 41. 缺失的桥接句(Missing Bridge Sentences) + +**问题:** 段落之间跳跃太大,没有过渡。 + +**改写前:** +> 段落A讲产品功能。段落B突然跳到市场分析。 + +**改写后:** +> 在段落间添加一句过渡:「功能的提升直接影响了下个月的市场表现。」 + +--- + +### 42. 中文标点被替换为英文标点(Punctuation Replacement — Chinese → English) + +**问题:** LLM 在重写中文文本时,会将中文标点(。,、;:?!""「」『』)替换为英文标点(.,,;:?!""''),这是明显的 AI 痕迹。 + +**需要保留的中文标点:** + +| 中文标点 | 说明 | +|---------|------| +| 。 | 句号 | +| , | 逗号 | +| 、 | 顿号 | +| ; | 分号 | +| : | 冒号 | +| ? | 问号 | +| ! | 感叹号 | +|「」 | 中文引号(最常用) | +| 『』 | 中文引号(引号内再用引号) | +| 《》 | 书名号 | +| () | 括号 | +| —— | 破折号(中文用双破折号) | +| …… | 省略号(中文用六个点) | + +**改写前(标点被替换):** +> 这个问题很重要。我来帮你分析。首先,检查配置文件。其次,重启服务。最后,告诉我结果。 + +**改写后(保留中文标点):** +> 这个问题很重要。我来帮你分析:首先,检查配置文件;其次,重启服务;最后,告诉我结果。 + +**注:** 中文冒号通常在左冒号前不加空格,与英文用法不同。中文分号(;)在列举时可用,英文分号(;)在中文文本中不应出现。 + +--- + ## 快速检查清单 在交付文本前,进行以下检查: - ✓ **连续三个句子长度相同?** 打断其中一个 - ✓ **段落以简洁的单行结尾?** 变换结尾方式 -- ✓ **揭示前有破折号?** 删除它 +- ✓ **补充说明前有破折号?** 删除它 - ✓ **解释隐喻或比喻?** 相信读者能理解 - ✓ **使用了"此外""然而"等连接词?** 考虑删除 - ✓ **三段式列举?** 改为两项或四项 +- ✓ **中文标点被替换为英文标点?** 检查句号(。而非.)、逗号(,而非,)、分号(;而非;)、引号(「」而非"") --- -## 处理流程 +## 处理流程(双通道 Rewrite 模式) + +### 第一步:识别与分级 1. 仔细阅读输入文本 -2. 识别上述所有模式的实例 -3. 重写每个有问题的部分 -4. 确保修订后的文本: +2. 对照 42 种模式逐一检查,标注: + - 匹配的 AI 模式类型 + - 对应严重级别(P0/P1/P2) + - 原文引用 + +### 第二步:初稿重写 + +3. 按 P0 → P1 → P2 顺序修复所有问题 +4. 重写问题片段,确保: - 大声朗读时听起来自然 - 自然地改变句子结构 - 使用具体细节而不是模糊的主张 - 为上下文保持适当的语气 - 适当时使用简单的结构(是/有) -5. 呈现人性化版本 -## 输出格式 +### 第三步:自审(Second-Pass Audit) + +5. 重读重写后的文本,问自己:「这段文字为什么明显是 AI 写的?」 +6. 列出残留的 AI 痕迹 +7. 按自审结果再次修订 + +### 第四步:输出 -提供: -1. 重写后的文本 -2. 所做更改的简要总结(如果有帮助,可选) +8. 呈现人性化版本 +9. (可选)标注主要修改点和严重级别 + +## 输出格式(Rewrite 模式) + +提供以下四个部分: + +1. **发现的问题(Issues Found)** — 按 P0/P1/P2 分级,每条含原文引用 + 模式类型 +2. **重写后的文本(Rewritten Version)** — 清除所有 AI 痕迹的干净版本 +3. **主要修改(What Changed)** — 改动摘要 +4. **二次审计(Second-Pass Audit)** — 重读 rewrite,确认幸存模式已被消除 --- @@ -477,6 +881,42 @@ metadata: --- +**中文标点保留示例:** + +以下示例展示如何保留中文标点: + +**改写前(标点被替换为英文,AI 痕迹明显):** +> 这个问题非常重要。我来帮你分析。首先,检查配置文件。其次,重启服务。最后,告诉我结果。「AI写作」是一款专业工具。 + +**改写后(保留中文标点):** +> 这个问题非常重要。我来帮你分析:首先,检查配置文件;其次,重启服务;最后,告诉我结果。《AI写作》是一款专业工具。 + +**所做更改:** +- 句号。(.)→ 。,保留 +- 逗号(,)→ ,保留 +- 分号(;)→ ;保留(中文分号在列举时分隔用) +- 引号「AI写作」→ 《AI写作》,书名号保留 +- 删除了"非常"(Hollow Intensifier,模式25) +- 删除了"首先、其次、最后"的三段式结构(模式10) +- "告诉我结果"改为更直接的表述 + +--- + +## 上下文配置(可选) + +根据不同场景,可以调整严格程度: + +| 场景 | 特点 | +|------|------| +| **微信公众号** | 标准规则,允许少量 emoji(段尾 1-2 个) | +| **技术博客** | Tier 2/3 词表更宽松,格局/织锦等隐喻性技术词可保留 | +| **投资者邮件** | 更严格的促销语言规则,更少感叹号 | +| **正式报告** | 标准规则,允许更多编号列表 | +| **社交媒体** | 最宽松规则,允许更口语化表达 | +| **客服话术** | 允许适度友好语气但禁聊天机器人痕迹 | + +--- + ## 参考 本技能基于 [Wikipedia:Signs of AI writing](https://en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing),由 WikiProject AI Cleanup 维护。那里记录的模式来自对维基百科上数千个 AI 生成文本实例的观察。