本文通过多组压力测试,系统评估了轻量级大语言模型 `gemma3:270m` 在 2 核 2GB 低配云服务器上的推理性能与并发承载能力。结果表明:单并发下模型运行稳定,但并发数超过 5 时延迟急剧上升、生成速度骤降,100 并发直接导致服务不可用。测试为资源受限环境下的 LLM 部署提供了实用参考。
阅读全文...
公告
这里是公告
最新文章
最新评论
网站资讯
文章数目 :
19
已运行时间 :
1836 天
本站总字数 :
15.06 W
本站总访问量 :
3391
最后更新时间 :
2天前
