新知答主@刘聪NLP
点击文末「阅读原文」查看完整内容、交流
测试是从简单到复杂,从单一的静态页面,到最后实现一个小工具。先说我的总体感受,强,很强,审美变好了,项目代码的完成度很高,跟 1T 参数的 K2 不相上下,有的一拼,但部署成本少了一半。
第一个「生成一个打工人时钟的 html 页面」,这里主要看单一 HTML 生成效果是否美观。这个配色就很 Qwen,基本信息都包含,「不过有些人在休息,有些人还在写测试文章」,哈哈哈!

第二个「根据给定的内容生成 PPT」我用的是前两天的《Agent 时代上下文工程的 6 大技巧》。
内容显示是完整的,PPT 页数切换很炫酷,闪瞎了我的狗眼,就是内容呈现相较于换页就显得有点朴素了~但是整体我还是满意的。
第三个,上点难度,「创建一个红白机风格的贪吃蛇游戏」。
这个很棒,我是玩了半天,不过我觉得现在生成贪吃蛇游戏对于大多数大模型来说都是小 case 了。现在想想一年前的大模型 code 能力,再想想现在大模型 code 能力,只感叹大模型现在进步真的挺快了,尤其是开源大模型追闭源大模型,也很快了。
第四个,生成可爱风格的五子棋游戏。
可爱风格五子棋游戏界面,画面有两个模式按钮「人人对战」和「人机对战」,界面整体采用马卡龙色调,棋盘简洁清晰,棋子设计成卡通小动物(如猫咪和小熊),背景带有轻微渐变和星星点缀,界面边缘圆润,按钮 Q 萌,整体风格温馨可爱,适合儿童或休闲玩家使用,2D 插画风。
纯一次生成的看着还可以,像那么一回事儿,但是你人机对战,是不是有点呆了呀。
于是我直接将 Qwen-Coder 配到了Cline里,看看在 Agent 下效果如何,同时也能考察 Qwen-Coder 的 Agent 能力。实话实说,真实好了不少,我觉得Qwen-Coder 这波的审美也是在线的,不过可能是因为前面一个太呆了,导致我大意了,竟然没下赢。
第五个,再次升级,「生成一个 AI 围棋对战游戏」。
这个是参考好友@洛小山,前两天测试 k2 的例子。这是一个 AI 围棋对战游戏项目,使用 FastAPI后端转发AI消息,前端采用 Tailwind CSS + JavaScript 实现。
核心功能包括:支持用户与传统算法 AI 或大模型 AI(OpenRouter、Qwen、Kimi)对局,提供多种游戏模式(人人、AI 对战、观战),实现完整的中国围棋规则(气的计算、提子、死活判定、占领面积计算、数子计分),要有棋盘视觉提示、悔棋系统等功能。

我觉得生成内容还是很好的,前后端都生成了,不过我不懂围棋,我感觉它在瞎下,但是我真不懂,哈哈哈!不过整体框架啥的弄得都挺好的,效果真不错,Qwen 这波开源救我老命了。
第六个「生成一个通过点击立方体的各个面,逐渐展开为完整平面的交互动画」。
这是好友@卡尔 测试 K2 的例子,Claude4 是跑不出来的,Kimi K2 生成也是有 bug,但动画本身都很流畅。
Qwen这个说实话,面没对上,没有那么好,不过我后面又加上一句「展开需要符合客观事实」,然后面能对上,但是展开的顺序还是有点问题。这个确实有点难了。
第七个「生成一个小工具,直接将文章链接转成 md,方便复制」。功能完全实现了,并且在前面预览的也很好,格式、图片也都搞下来了,支持一键复制。
所以,vibe coding 盛行的时代,想快速实现一个小的工具,真的太方便了,你只要能描述清楚你的需求即可,即使你描述不清楚,你也可以让大模型帮你润色,现在真是太方便了。

这次 Qwen-Coder 的实测表现真的是效果炸裂,尤其是在审美、代码完整度、工具调用等方面,用起来真爽。
重点是依旧开源!现在的开源大模型的代码能力,也正在从「能写点代码」进化为了「写得又快又好、还能直接使用」。
最后想说,开源界最早是 Qwen 打下基础,后来DeepSeek 爆火,加之 Kimi、Minimax 等都加入,中国开源大模型不断更新,真幸福!中国开源模型就是遥遥领先,不接受任何反对!
答主@卜寒兮
点击文末「阅读原文」查看完整内容、交流
- 代码能力小测
我简单测试了下模拟物理场景的代码能力。首先是一个生成可交互的动画效果的任务,完成起来完全没有压力。
然后是生成一个 3D 迷宫游戏,从场景搭建、迷宫生成、角色控制到动画和碰撞检测。
重点在于使用 Three.js 和其相关的加载器和控制器,并强调了版本兼容性(r128)、程序化纹理生成、动画混合、以及角色朝向的精确计算。是一个比较复杂的项目,需要对 Three.js 有较好的理解。
效果大概是这样,完成的也不错:
作为对比,这是 Claude 生成的效果:
- Agent 能力
这次发布,除了 Qwen3-coder 模型本体,Qwen 还推出了 Qwen Code 智能体,本质上是一个命令行工具, 基于 Gemini Code 开发的,通过 Qwen Code 可以更好发挥 Qwen3-coder 模型的 Agentic 和工具使用的能力。
使用 Qwen Code,首先保证安装了 Node.js 环境,如果还没安装,可以执行: curl -qL https://www.npmjs.com/install.sh | sh
然后通过 npm 全局安装 Qwen code: npm install -g @qwen-code/qwen-code
然后在终端运行 qwen 指令就进入 Qwen Code 环境了,不过在使用之前,还需要授权一下 API key,Qwen Code 支持 OpenAI SDK 调用 LLM,在配置页面选择 OpenAI:

填入你的阿里云百炼平台的 API Key,把 API 的Base url 也替换为阿里云百炼平台的,然后模型填入 qwen3-coder-plus,确认就完成授权了。

现在就可以跟 Qwen code 进行对话了,Qwen code 在 Gemini CLI 的基础上开发而来,包括很很多基础工具调用能力,比如基础的文件读写、命令行工具等等。

1、测试了一下 Qwen Code 对于代码项目的理解能力,直接让他生成 GitHub 上 Qwen Code 的项目结构:

可以看到它对整个项目的架构和功能模块理解得很全面。继续让它生成一份 wiki 资料,然后它直接给出一个完整的 wiki 文档: 幸运飞艇开奖网

Qwen Code 推出给了可以给国内很多不方便使用 Gemini CLI、Claude Code 等工具的人一个选择,也能很轻松用上 Agentic 命令行工具,开展更多的自动化开发工作。个人感觉这个工具的重要性不亚于 Qwen3 Coder 模型本身。你可以用它搜索代码库,协助代码开发,自动化工作流,或者进行代码的重构和优化等等。不过由于时间有限,还没来得及做更多的能力测试,后面我会继续使用 Qwen Code,有了新的体验和发现,也会及时更新在这里。
另外,让我比较欣赏的一点是一直以来 Qwen 对社区三方工具的兼容性和适配性做的都很好,而且能感觉到是在积极主动的做这件事。
这次的 Qwen3-Coder 也是一样,除了在 Gemini CLI 基础上开发的 Qwen Code 命令行工具,现在还可以将 Qwen3-Coder 和 Claude Code、Cline 等工具搭配起来使用,尽可能发挥它的 Agentic 能力。
总的来说,个人认为 Qwen3-Coder 并非一次简单的模型迭代,我更愿意称它是一次系统性的工程实践,为下一代代码大模型的发展搭建了更高的阶梯。一个能够自主发现问题、解决问题、并从解决过程中学习和提升的 Code Agent,或许已经离我们不远了。Qwen3-Coder,正是朝着这个方向迈出的坚实而关键的一步。
答主@安小强
点击文末「阅读原文」查看完整内容、交流
谢邀。Qwen3-Coder-480B-A35B-Instruct,480B 参数的 MOE 模型(35B 激活参数)原生支持 256K 上下文,可外推扩展到 1M 上下文。许多榜单分数确实赶上 Claude Sonnet 4了(甚至略有超过)。但这不是一个单纯的 coding模型,而是一个奔着 Agent 去的完整编程解决方案。这次阿里发布的 Qwen3-Coder,不能只看模型,得把模型和它的配套工具 qwen-code 放在一起看,这才是它的全貌.

Qwen Code 是一个命令行 AI 工作流工具,源自Gemini Cli,专为 Qwen3-Coder 模型优化,具有增强的解析器支持 & 工具支持。
效果上我最关注的是能否替代 Claude Code。前段时间月之暗面刚刚发布的 Kimi K2,已经做得很好了,这次阿里的 Qwen3 Code,更是令人惊喜。我这里已经启动了,正在深入体验。测试了1个火柴人格斗双人对战的小游戏,一次就过,没有bug (攻击、碰撞检测、移动、双人键盘操控、死亡判定都没有问题),就是画面简陋了些:

值得一提的是,阿里云百炼里面,除了这次开源的模型以外,还有 1 个 100 万上下文长度的 qwen3 coder 模型(应该是用 yarn 技术做了外推的,但暂时不知道是否有其它优化),另外这两个模型还送 1000000 tokens……果然大家卷起来之后,我们这些开发者就舒服了(狗头)。做了许多测试,编写前端代码的通过率很高(页面审美上稍弱一点,但出错率很低),编写后端代码的通过率也很不错。总体感受上比之前月之暗面 kimi k2 + claude code 的体验还丝滑一些,弱于 claude code + claude 4。text base rpg,还不错(有小bug,比如战斗后生命-12了,人还活着……):

text based rpg
3d 场景测试:

空间理解测试:莫比乌斯环(里面的圈对了,外面的不太对)

另外 Gemini cli 本事支持 yolo 模式(全自动模式),我看了一下 qwen code,果然也支持。
通过 claude code router,能很轻松把 qwen3 code 模型接入到 claude code中。
claude code 的 Agent 设计用起来还是比 gemini cli 稳定一些(比qwen code cli也一样)。如图,这是一句话通过 Claude Code + Qwen3 Code 生成的弹球游戏,一次过,无bug:

幸运飞艇官网 qwen3 code + claude code 做的 doodle jump (依然无报错一次过,就是主角丑萌了一点):

以前 Claude 模型的编程能力是一座无法逾越的大山,现在已经不是了。Qwen3 Coder 和 Kimi K2 都一定程度跟上了它的能力,而且还在快速进步中。
真好。
京公网安备11000000000001号
京ICP备11000001号
还没有评论,来说两句吧...