您好，模型训练需要跑多久，大概有多少参数量 #2

dgo2dance · 2024-02-26T09:53:59Z

您好，模型训练需要跑多久，大概有多少参数量

WeiminLee · 2024-02-27T02:24:41Z

看论文里面介绍大概几千条train数据，分4个阶段来训练。具体时间没有更多详细信息，估计需要使用A100（80G）*8

niuzaisheng · 2024-02-27T02:43:23Z

上游模型是CogAgent，参数量有18B，其中有 110 亿个视觉参数和 70 亿个语言参数。
在A100（80G）* 8 上训练约8小时。

dgo2dance · 2024-02-27T12:40:41Z

上游模型是CogAgent，参数量有18B，其中有 110 亿个视觉参数和 70 亿个语言参数。在A100（80G）* 8 上训练约8小时。

在CogAgent基础上训练是不

niuzaisheng · 2024-02-28T02:00:24Z

上游模型是CogAgent，参数量有18B，其中有 110 亿个视觉参数和 70 亿个语言参数。在A100（80G）* 8 上训练约8小时。

在CogAgent基础上训练是不

是，在 CogAgent-Chat 版本基础上微调。

tiandazhao · 2024-03-08T08:40:39Z

cogagent不支持中文，未来你们呢有支持中文的规划吗？或者有什么方案吗？

niuzaisheng · 2024-03-08T08:53:07Z

cogagent不支持中文，未来你们呢有支持中文的规划吗？或者有什么方案吗？

我们训练集同时提供了中英文两种标注，ScreenAgent在训练的时候也同时用这两种语言的标注数据，测试集合提供的是英文版本，感兴趣可以尝试一下中文环境下的效果。另外，GUI界面如果大部分为中文的情况下性能会受限，这与上游模型选择的图像编码器有关，仍需更大量的数据在含有汉字的图像、PDF、截图上进行训练。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

您好，模型训练需要跑多久，大概有多少参数量 #2

您好，模型训练需要跑多久，大概有多少参数量 #2

dgo2dance commented Feb 26, 2024

WeiminLee commented Feb 27, 2024

niuzaisheng commented Feb 27, 2024

dgo2dance commented Feb 27, 2024

niuzaisheng commented Feb 28, 2024 •

edited

Loading

tiandazhao commented Mar 8, 2024

niuzaisheng commented Mar 8, 2024

您好，模型训练需要跑多久，大概有多少参数量 #2

您好，模型训练需要跑多久，大概有多少参数量 #2

Comments

dgo2dance commented Feb 26, 2024

WeiminLee commented Feb 27, 2024

niuzaisheng commented Feb 27, 2024

dgo2dance commented Feb 27, 2024

niuzaisheng commented Feb 28, 2024 • edited Loading

tiandazhao commented Mar 8, 2024

niuzaisheng commented Mar 8, 2024

niuzaisheng commented Feb 28, 2024 •

edited

Loading