Firefly开源社区

[技术讨论] RK3576 NPU 速度比 RK3588 慢一半

9

积分

0

威望

0

贡献

吃瓜的群众

积分
9
发表于 2025-2-5 16:54:32     
问题描述及复现步骤:
同样代码跑 yolov5 推理, 使用 firefly 的 rk3576 box 与 firefly的 rk3588 开发板对比 ,

3576 的推理速度 为 40ms 一帧 , 3588 推理速度 <20ms 一帧  ! 慢一倍, 是 3576 盒子的 NPU 有降频吗?


RK 官方 rknn_model_zoo 里的 3576 性能 某些情况比 rk3588 还要强。


det.zip

101.27 KB, 下载次数: 2, 下载积分: 灯泡 -1 , 经验 -1

回复

使用道具 举报

1035

积分

0

威望

0

贡献

中级创客

Rank: 4

积分
1035
发表于 2025-2-5 17:09:37     
命令行输入看下版本:ffgo version
回复

使用道具 举报

9

积分

0

威望

0

贡献

吃瓜的群众

积分
9
发表于 2025-2-5 17:18:19     
OS:         Ubuntu 22.04.5 LTS
MODEL:         Firefly RK3576-FIREFLY-AIBOX Linux
FIREFLY: v3.11-37-g59c5c6fc
DATE:         20240912
KERNEL:         Linux version 6.1.75-g1b2c33009112 (lanzj@tchip14) (HEAD: 1b2c33009112/2409131133) (sdk version: rk3576_linux_release_20240827_v1.0.0d.xml) (aarch64-none-linux-gnu-gcc (GNU Toolchain for the A-profile Architecture 10.3-2021.07 (arm-10.29)) 10.3.1 20210621, GNU ld (GNU Toolchain for the A-profile Architecture 10.3-2021.07 (arm-10.29)) 2.36.1.20210621) #3 SMP Fri Sep 13 11:37:11 CST 2024

回复

使用道具 举报

1035

积分

0

威望

0

贡献

中级创客

Rank: 4

积分
1035
发表于 2025-2-5 17:57:56     
先让cpu跑最高频: echo performance | tee $(find /sys/devices -name *governor)
然后再将你的程序跑在大核再测试:taskset -c 4-7 ./your_task

3576的npu是双核的,每核3T;而3588是三核心,每核2T。
回复

使用道具 举报

58

积分

0

威望

0

贡献

技术小白

积分
58
发表于 2025-2-6 09:29:30     
是否一并统计了前处理、后处理等耗时,可以参考官方文档用相关接口查看NPU推理耗时和对比各层耗时

回复

使用道具 举报

9

积分

0

威望

0

贡献

吃瓜的群众

积分
9
发表于 2025-2-6 18:42:57     
dengkx 发表于 2025-2-5 17:57
先让cpu跑最高频: echo performance | tee $(find /sys/devices -name *governor)
然后再将你的程序跑在大 ...

管用!, 主要是 dmc 和 npu 自动降频导致的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

友情链接 : 爱板网 电子发烧友论坛 云汉电子社区 粤ICP备14022046号-2
快速回复 返回顶部 返回列表