Video Learning Skill 视频内容学习技能。从视频链接中提取音频、转写文字,分析内容、截图学习,最终输出文字+图片+总结的完整学习报告。 功能 音视频提取:yt-dlp + ffmpeg 语音转文字(whisper) 文字内容分析 关键时间点截图学习 自动清理临时文件 依赖 yt-dlp ffmpeg whisper browser(OpenClaw内置) 使用 当用户给一个视频链接要"学习"、"分析"、"提取内容"时自动触发。 License MIT