一个专业的AI产品评估与数据集生成平台,帮助开发者更好地评估和改进AI产品。
- 支持多种评估方式:
- 人工评估:自定义评分标准和评估说明
- LLM自动评估:使用GPT-4、Claude等模型进行自动评估
- 代码评估:通过自定义代码进行评估
- AI辅助生成测试数据集
- 支持自定义生成模板
- 批量生成能力
- 查看历史评估记录
- 追踪性能变化趋势
- 导出评估报告
- Next.js 14
- TypeScript
- Tailwind CSS
- React Hook Form
- Zod
- Headless UI
- 安装依赖:
npm install- 运行开发服务器:
npm run dev- 访问 http://localhost:3000 查看应用
ai-eval-platform/
├── app/ # Next.js 应用目录
│ ├── evaluate/ # 评估功能页面
│ ├── dataset/ # 数据集生成页面
│ └── dashboard/ # 评估记录页面
├── components/ # 可复用组件
├── public/ # 静态资源
└── styles/ # 样式文件
- 进入评估中心
- 上传评估数据(JSON格式)
- 选择评估方式
- 配置评估参数
- 开始评估
- 进入数据集生成页面
- 填写数据集信息
- 设置生成模板
- 指定生成数量
- 开始生成
欢迎提交Issue和Pull Request来帮助改进这个项目。
MIT