Firefly开源社区

打印 上一主题 下一主题

[技术讨论] 多模型同时推理,npu推理速度问题

13

积分

0

威望

0

贡献

技术小白

积分
13

多模型同时推理,npu推理速度问题

发表于 2022-11-2 14:13:46      浏览:5124 | 回复:1        打印      只看该作者   [复制链接] 楼主
问题描述及复现步骤:
我这边多个模型同时推理,时间成倍增加,
比如:1个模型 假设推理时间是50毫秒,两个模型同时推理测试是100毫秒,这个现象是正常的吗?多模型推理时间上可以优化加快吗

firefly日志.txt

9 Bytes, 下载次数: 2, 下载积分: 灯泡 -1 , 经验 -1

回复

使用道具 举报

789

积分

2

威望

4

贡献

技术大神

Rank: 3Rank: 3

积分
789
发表于 2022-11-3 14:22:54        只看该作者  沙发
这个现象是正常的,多个模型不能并行执行,在底层会维护一个fifo排队执行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

友情链接 : 爱板网 电子发烧友论坛 云汉电子社区 粤ICP备14022046号-2
快速回复 返回顶部 返回列表