您尚未登录。

楼主 # 今天 14:18:46

double33
会员
注册时间: 2021-11-30
已发帖子: 34
积分: 44

记录分享在RK1820协处理器上探索语音交互

一个完全不懂LLM的哞哞,硬着头皮搞AI语音交互的探索之路
1820_20260331-1417.jpg

一、跑demo:
    Qwen2.5最多只能跑3B,再大的话内存不够加载不起来,首词响应时间(TTFT):87.316 ms;生成速度:94.14 Tokens/s。
    Qwen3 1.7B可以,4B跑不起来。
    实际跑起来回答速度还是非常快的。

    谈谈功耗:
    1、只加载,不推理功耗大概有4W多。

    2、推理时,有12W多,不过NPU好像还没满负荷,所以实际还可能更高。
    image.png
    image1.png


....更新待续

离线

页脚

工信部备案:粤ICP备20025096号 Powered by FluxBB

感谢为中文互联网持续输出优质内容的各位老铁们。 QQ: 516333132, 微信(wechat): whycan_cn (哇酷网/挖坑网/填坑网) service@whycan.cn


太原小智科技有限责任公司 - 东莞哇酷科技有限公司联合开发