86.25 KB, 下载次数: 1, 下载积分: 灯泡 -1 , 经验 -1
Multius 发表于 2024-6-17 15:11
可能是 FireflyChat 占用了内存导致的,执行 `sudo systemctl stop FireflyChat` 命令关闭 FireflyChat 后 ...
Multius 发表于 2024-6-17 15:52
使用的具体是 Qwen 的哪一个模型?模型最终编译出来的 bmodel 文件有多大体积?
bing20138 发表于 2024-6-17 16:06
难道是因为这个原因?
bing20138 发表于 2024-6-17 16:02
qwen-7b_int4_1dev.bmodel 4.78GB
bing20138 发表于 2024-6-17 16:52
这样改还是会内存报错
bing20138 发表于 2024-6-17 16:48
换QWEN1.5会报AttributeError: module 'sophon.sail' has no attribute 'EngineLLM'
bing20138 发表于 2024-6-17 18:02
我现在LLM-TPU工程,执行./run.sh --model qwen1.5-1.8b --arch soc会报cp: cannot stat 'chat.cpython-310 ...
Multius 发表于 2024-6-18 09:23
这个./run.sh 脚本有问题,在机器上编译是生成不了x86的.so文件的,这里需要修改这个脚本或者参考./run.s ...
欢迎光临 Firefly开源社区 (https://dev.t-firefly.com/) | Powered by Discuz! X3.1 |