Skip to content

Commit cd95cac

Browse files
committed
feat: release v0.74.0 - Chrome Bridge 浏览器自动化集成
🎉 重大功能 - Chrome Bridge: 完整的浏览器自动化控制系统 - 零配置自动连接:扩展自动加载和配置 - AI 原生集成:作为 MCP 工具支持自然语言控制 - 支持导航、页面读取、元素交互、表单操作等 🐛 Bug 修复 - WebSocket 路由修复 (Axum 路径参数语法) - Chrome 扩展存储清理 - 扩展重复注入防护 - 剪贴板权限添加 🔧 代码质量 - 修复 33+ Clippy 警告 - 所有 259 个测试通过 - ESLint 无警告 📝 文档 - Chrome Bridge 使用指南 - API 技术文档 - 快速参考卡片
1 parent 0686737 commit cd95cac

108 files changed

Lines changed: 18913 additions & 1918 deletions

File tree

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

RELEASE_NOTES.md

Lines changed: 38 additions & 30 deletions
Original file line numberDiff line numberDiff line change
@@ -1,39 +1,47 @@
1-
## ProxyCast v0.73.0
1+
# Release v0.74.0
22

3-
发布日期:2026-02-27
3+
## 🎉 重大功能
44

5-
### ✨ 新功能
5+
### Chrome Bridge - 浏览器自动化集成
66

7-
#### 记忆管理系统
8-
- 新增多层记忆架构:支持组织策略、项目记忆、用户记忆、项目本地记忆四层配置
9-
- 新增记忆画像(MemoryProfile):可配置学习状态、擅长领域、解释风格、难题偏好
10-
- 新增记忆设置页面(settings-v2/general/memory),支持记忆来源、自动记忆、画像等配置
11-
- 新增记忆层级指标统计(memoryLayerMetrics),量化各层记忆贡献
12-
- 新增 memory profile prompt 服务,将记忆画像自动合并到系统提示词
7+
实现了完整的 Chrome 浏览器自动化控制系统,AI 可以在对话中直接操作浏览器。
138

14-
#### Agent 增强
15-
- Agent 支持上下文准备轨迹(ContextTrace)事件,前端可展示上下文注入过程
16-
- 新增 instruction discovery 模块,自动发现项目级指令文件
17-
- 新增 shell security 和 tool permissions 模块
18-
- 新增 hooks 模块,支持 Agent 生命周期钩子
19-
- SessionConfigBuilder 支持 include_context_trace 配置
9+
#### 核心特性
2010

21-
#### 技能与处理器
22-
- 新增 skill matcher 模块,优化技能匹配逻辑
23-
- 新增 processor steps registry,统一步骤注册管理
11+
- **零配置自动连接**:打开 Chrome Profile 时自动加载扩展并配置连接
12+
- **双通道架构**:Observer 通道(页面监控)+ Control 通道(命令控制)
13+
- **AI 原生集成**:作为 MCP 工具集成到 Aster Agent,支持自然语言控制
14+
- **多 Profile 支持**:可同时管理多个独立的 Chrome Profile
2415

25-
#### 渠道管理
26-
- 新增 ChannelsConfig 配置类型与渠道管理 UI 组件
16+
#### 支持的操作
2717

28-
### 🐛 修复
29-
- 修复 workspace_mismatch 错误:会话切换 workspace 时自动更新 working_dir,不再阻断用户操作
30-
- 修复前端 lint 错误:清理未使用的导入和不必要的 try/catch 包装
31-
- 修复 Config 测试中缺少 channels 字段导致编译失败的问题
18+
- **导航**:打开 URL、刷新、前进、后退
19+
- **页面读取**:获取页面内容(Markdown 格式)、标题、URL
20+
- **元素交互**:点击、输入文本、滚动
21+
- **表单操作**:批量填写表单字段
22+
- **标签页管理**:获取标签页列表、切换标签页
3223

33-
### 🔧 优化与重构
34-
- 优化 unified memory API 和前端调用
35-
- 移除废弃的 external-tools 设置页面
24+
#### 使用示例
3625

37-
### 📦 技术细节
38-
- 54 个文件变更,+2279 行,-410 行
39-
- 新增 10 个文件,涵盖记忆管理、Agent 安全、技能匹配等模块
26+
用户:帮我在 Google 上搜索 "Rust"
27+
AI 自动执行:打开 Google → 输入搜索词 → 点击搜索 → 读取结果 → 总结
28+
29+
## 🐛 Bug 修复
30+
31+
- WebSocket 路由修复:从 `/Proxycast_Key={key}` 改为 `/:key`
32+
- Chrome 扩展存储清理:删除旧配置缓存
33+
- 扩展重复注入防护:使用 IIFE 包装
34+
- 剪贴板权限:添加 `clipboardRead` 权限
35+
36+
## 🔧 代码质量改进
37+
38+
- 修复 33+ Clippy 警告
39+
- 所有 259 个测试通过
40+
- ESLint 无警告
41+
42+
## 📝 文档
43+
44+
新增:
45+
- `CHROME_BRIDGE_AI_USAGE.md` - AI 使用指南
46+
- `CHROME_BRIDGE_QUICKSTART.md` - 快速参考
47+
- `CHROME_BRIDGE_USAGE.md` - API 文档
Lines changed: 71 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,71 @@
1+
# Proxycast Chrome Bridge 扩展
2+
3+
用于把 Chrome 页面能力接入 Proxycast 的浏览器桥接通道,供各业务 AI Agent 通过统一 `browser_execute_action` / MCP 浏览器工具调用。
4+
5+
## 功能
6+
7+
- Observer 通道自动连接:`/proxycast-chrome-observer/Proxycast_Key=...`
8+
- 页面信息上报:标题、URL、Markdown
9+
- 远程指令执行:`open_url` / `click` / `type` / `scroll` / `switch_tab` / `go_back`
10+
- 弹窗配置:`serverUrl``bridgeKey``profileKey`、监控开关、手动抓取
11+
12+
## 安装
13+
14+
1. 打开 Chrome `chrome://extensions`
15+
2. 打开右上角「开发者模式」
16+
3. 点击「加载已解压的扩展程序」
17+
4. 选择目录:`extensions/proxycast-chrome`
18+
19+
## 配置
20+
21+
点击扩展图标打开弹窗,配置:
22+
23+
- `Server URL`:Proxycast 服务地址,例如 `ws://127.0.0.1:8999`
24+
- `Bridge Key`:Proxycast 服务 API Key(与后端 `Proxycast_Key` 一致)
25+
- `Profile Key`:浏览器会话隔离键(建议与业务场景对应,如 `research_a`
26+
27+
点击「保存并重连」后,扩展会建立 observer WebSocket 连接。
28+
29+
## 验证
30+
31+
1. 在 Proxycast 设置中查看 `get_chrome_bridge_status``observer_count` 应大于 0
32+
2. 调用 `browser_execute_action`
33+
34+
```json
35+
{
36+
"profile_key": "default",
37+
"action": "navigate",
38+
"args": { "url": "https://example.com" }
39+
}
40+
```
41+
42+
3. 再调用 `browser_execute_action`
43+
44+
```json
45+
{
46+
"action": "read_page"
47+
}
48+
```
49+
50+
如果返回 `success=true``data.markdown` 有内容,说明链路可用。
51+
52+
## 自动化联调脚本
53+
54+
仓库提供了桥接链路的端到端联调脚本(模拟 observer/control 双端):
55+
56+
```bash
57+
npm run bridge:e2e -- --server ws://127.0.0.1:8787 --key proxy_cast --profile default
58+
```
59+
60+
脚本会验证:
61+
62+
- observer/control 握手
63+
- 双向心跳 ack
64+
- `wait_for_page_info=true` 命令链路(`command_result` + `page_info_update`
65+
- 普通命令链路(`command_result`
66+
67+
## 兼容说明
68+
69+
- 扩展只负责浏览器侧采集与动作执行。
70+
- Agent 侧通过 `aster_agent_cmd``unified_chat_cmd` 注册的浏览器 MCP 兼容工具访问。
71+
- 若你同时使用独立 Chrome Profile(Tauri `open_chrome_profile_window`),请在对应 Profile 内安装该扩展,并使用不同 `profileKey` 做隔离。

0 commit comments

Comments
 (0)