为什么Qwen模型总给我一种又土又low的感觉?
来源:
编辑:
时间:2025-06-23 11:15:18

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章

热门文章
- 熊猫烧香技术含量高吗?高在哪里?
- arm在低功耗下的效率是x86的两倍以上,为何掌机还不使用arm芯片?
- MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响?
- golang 与rust 在服务器程序领域相比较,各有什么优劣势?
- Rust据说是这样先进,那Rust编译器也总该是Rust写的吧?
- 为什么要使用 Go 语言?Go 语言的优势在哪里?
- 当年的东莞究竟有多疯狂?
- 为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要?
- 《长安的荔枝》演员表删除那尔那茜,会对这部剧有哪些影响?
- 特斯拉宣布将于 6 月 22 日开始 Robotaxi 公开试运营,这将对自动驾驶行业带来哪些影响?
