感谢 上海人工智能实验室书生浦语大模型 以及 熊玉洁导师 的支持,感谢实训营提供的赞助和机会。
- Center 文件下的
DASHSCOPE_API_KEY
- WebSearch 文件下的
BOCHA_API_KEY
- mapSearch 文件夹下的高德地图 Key
- model文件夹下两个文件下的 key
- 然后直接运行 center.py 即可(建议debug,所耗费 Token 较多)
MultiAgent-Search是基于InternLM书生浦语大模型实现的多智能体项目,在图寻地址方面为全球首创,旨在利用多Agent识别上海市松江大学城图像,识别过程很好地模拟了人类思考图像位置的过程,以进行图像寻址,如:上海工程技术大学松江校区-图书馆等,在图像寻址功能上超越了ChatGPT4o与文心一言3.5等大模型。
结论: ChatGPT4o
在图像寻址上效果并不好,没有达到人类思考图像位置的能力。
结论: 同理,可以发现文心一言3.5
在图像寻址上效果并不好,也并没有达到人类思考图像位置的能力。
@misc{Wu2024MultiAgentSearch,
title={MultiAgent-Search: 基于多智能体识别图像位置},
author={Yuhang Wu and Henghua Zhang},
year={2024},
url={<url id="cuqmhcd43355nsg2o9dg" type="url" status="parsed" title="GitHub - Wuyuhang11/MultiAgent-Search" wc="6723">https://github.com/Wuyuhang11/MultiAgent-Search</url>},
}