火柴人双人武器对决(Qwen3Coder 挑战 Claude4 知乎 50 项目实测千问 AI 编程大模型)

火柴人双人武器对决(Qwen3Coder 挑战 Claude4 知乎 50 项目实测千问 AI 编程大模型)

admin 2025-11-01 热文 2 次浏览 0个评论

新知答主@刘聪NLP

点击文末「阅读原文」查看完整内容、交流

测试是从简单到复杂,从单一的静态页面,到最后实现一个小工具。先说我的总体感受,强,很强,审美变好了,项目代码的完成度很高,跟 1T 参数的 K2 不相上下,有的一拼,但部署成本少了一半。

第一个「生成一个打工人时钟的 html 页面」,这里主要看单一 HTML 生成效果是否美观。这个配色就很 Qwen,基本信息都包含,「不过有些人在休息,有些人还在写测试文章」,哈哈哈!

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

第二个「根据给定的内容生成 PPT」我用的是前两天的《Agent 时代上下文工程的 6 大技巧》。

内容显示是完整的,PPT 页数切换很炫酷,闪瞎了我的狗眼,就是内容呈现相较于换页就显得有点朴素了~但是整体我还是满意的。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

第三个,上点难度,「创建一个红白机风格的贪吃蛇游戏」。

这个很棒,我是玩了半天,不过我觉得现在生成贪吃蛇游戏对于大多数大模型来说都是小 case 了。现在想想一年前的大模型 code 能力,再想想现在大模型 code 能力,只感叹大模型现在进步真的挺快了,尤其是开源大模型追闭源大模型,也很快了。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

第四个,生成可爱风格的五子棋游戏。

可爱风格五子棋游戏界面,画面有两个模式按钮「人人对战」和「人机对战」,界面整体采用马卡龙色调,棋盘简洁清晰,棋子设计成卡通小动物(如猫咪和小熊),背景带有轻微渐变和星星点缀,界面边缘圆润,按钮 Q 萌,整体风格温馨可爱,适合儿童或休闲玩家使用,2D 插画风。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

纯一次生成的看着还可以,像那么一回事儿,但是你人机对战,是不是有点呆了呀。

于是我直接将 Qwen-Coder 配到了Cline里,看看在 Agent 下效果如何,同时也能考察 Qwen-Coder 的 Agent 能力。实话实说,真实好了不少,我觉得Qwen-Coder 这波的审美也是在线的,不过可能是因为前面一个太呆了,导致我大意了,竟然没下赢。

第五个,再次升级,「生成一个 AI 围棋对战游戏」。

这个是参考好友@洛小山,前两天测试 k2 的例子。这是一个 AI 围棋对战游戏项目,使用 FastAPI后端转发AI消息,前端采用 Tailwind CSS + JavaScript 实现。

核心功能包括:支持用户与传统算法 AI 或大模型 AI(OpenRouter、Qwen、Kimi)对局,提供多种游戏模式(人人、AI 对战、观战),实现完整的中国围棋规则(气的计算、提子、死活判定、占领面积计算、数子计分),要有棋盘视觉提示、悔棋系统等功能。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

我觉得生成内容还是很好的,前后端都生成了,不过我不懂围棋,我感觉它在瞎下,但是我真不懂,哈哈哈!不过整体框架啥的弄得都挺好的,效果真不错,Qwen 这波开源救我老命了。

第六个「生成一个通过点击立方体的各个面,逐渐展开为完整平面的交互动画」。

这是好友@卡尔 测试 K2 的例子,Claude4 是跑不出来的,Kimi K2 生成也是有 bug,但动画本身都很流畅。

Qwen这个说实话,面没对上,没有那么好,不过我后面又加上一句「展开需要符合客观事实」,然后面能对上,但是展开的顺序还是有点问题。这个确实有点难了。

第七个「生成一个小工具,直接将文章链接转成 md,方便复制」。功能完全实现了,并且在前面预览的也很好,格式、图片也都搞下来了,支持一键复制。

所以,vibe coding 盛行的时代,想快速实现一个小的工具,真的太方便了,你只要能描述清楚你的需求即可,即使你描述不清楚,你也可以让大模型帮你润色,现在真是太方便了。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

这次 Qwen-Coder 的实测表现真的是效果炸裂,尤其是在审美、代码完整度、工具调用等方面,用起来真爽。

重点是依旧开源!现在的开源大模型的代码能力,也正在从「能写点代码」进化为了「写得又快又好、还能直接使用」。

最后想说,开源界最早是 Qwen 打下基础,后来DeepSeek 爆火,加之 Kimi、Minimax 等都加入,中国开源大模型不断更新,真幸福!中国开源模型就是遥遥领先,不接受任何反对!

答主@卜寒兮

点击文末「阅读原文」查看完整内容、交流

- 代码能力小测

我简单测试了下模拟物理场景的代码能力。首先是一个生成可交互的动画效果的任务,完成起来完全没有压力。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

然后是生成一个 3D 迷宫游戏,从场景搭建、迷宫生成、角色控制到动画和碰撞检测。

重点在于使用 Three.js 和其相关的加载器和控制器,并强调了版本兼容性(r128)、程序化纹理生成、动画混合、以及角色朝向的精确计算。是一个比较复杂的项目,需要对 Three.js 有较好的理解。

效果大概是这样,完成的也不错:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

作为对比,这是 Claude 生成的效果:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

- Agent 能力

这次发布,除了 Qwen3-coder 模型本体,Qwen 还推出了 Qwen Code 智能体,本质上是一个命令行工具, 基于 Gemini Code 开发的,通过 Qwen Code 可以更好发挥 Qwen3-coder 模型的 Agentic 和工具使用的能力。

使用 Qwen Code,首先保证安装了 Node.js 环境,如果还没安装,可以执行: curl -qL https://www.npmjs.com/install.sh | sh

然后通过 npm 全局安装 Qwen code: npm install -g @qwen-code/qwen-code

然后在终端运行 qwen 指令就进入 Qwen Code 环境了,不过在使用之前,还需要授权一下 API key,Qwen Code 支持 OpenAI SDK 调用 LLM,在配置页面选择 OpenAI:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

填入你的阿里云百炼平台的 API Key,把 API 的Base url 也替换为阿里云百炼平台的,然后模型填入 qwen3-coder-plus,确认就完成授权了。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

现在就可以跟 Qwen code 进行对话了,Qwen code 在 Gemini CLI 的基础上开发而来,包括很很多基础工具调用能力,比如基础的文件读写、命令行工具等等。

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

1、测试了一下 Qwen Code 对于代码项目的理解能力,直接让他生成 GitHub 上 Qwen Code 的项目结构:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

可以看到它对整个项目的架构和功能模块理解得很全面。继续让它生成一份 wiki 资料,然后它直接给出一个完整的 wiki 文档: 幸运飞艇开奖网

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

Qwen Code 推出给了可以给国内很多不方便使用 Gemini CLI、Claude Code 等工具的人一个选择,也能很轻松用上 Agentic 命令行工具,开展更多的自动化开发工作。个人感觉这个工具的重要性不亚于 Qwen3 Coder 模型本身。你可以用它搜索代码库,协助代码开发,自动化工作流,或者进行代码的重构和优化等等。不过由于时间有限,还没来得及做更多的能力测试,后面我会继续使用 Qwen Code,有了新的体验和发现,也会及时更新在这里。

另外,让我比较欣赏的一点是一直以来 Qwen 对社区三方工具的兼容性和适配性做的都很好,而且能感觉到是在积极主动的做这件事。

这次的 Qwen3-Coder 也是一样,除了在 Gemini CLI 基础上开发的 Qwen Code 命令行工具,现在还可以将 Qwen3-Coder 和 Claude Code、Cline 等工具搭配起来使用,尽可能发挥它的 Agentic 能力。

总的来说,个人认为 Qwen3-Coder 并非一次简单的模型迭代,我更愿意称它是一次系统性的工程实践,为下一代代码大模型的发展搭建了更高的阶梯。一个能够自主发现问题、解决问题、并从解决过程中学习和提升的 Code Agent,或许已经离我们不远了。Qwen3-Coder,正是朝着这个方向迈出的坚实而关键的一步。

答主@安小强

点击文末「阅读原文」查看完整内容、交流

谢邀。Qwen3-Coder-480B-A35B-Instruct,480B 参数的 MOE 模型(35B 激活参数)原生支持 256K 上下文,可外推扩展到 1M 上下文。许多榜单分数确实赶上 Claude Sonnet 4了(甚至略有超过)。但这不是一个单纯的 coding模型,而是一个奔着 Agent 去的完整编程解决方案。这次阿里发布的 Qwen3-Coder,不能只看模型,得把模型和它的配套工具 qwen-code 放在一起看,这才是它的全貌.

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

Qwen Code 是一个命令行 AI 工作流工具,源自Gemini Cli,专为 Qwen3-Coder 模型优化,具有增强的解析器支持 & 工具支持。

效果上我最关注的是能否替代 Claude Code。前段时间月之暗面刚刚发布的 Kimi K2,已经做得很好了,这次阿里的 Qwen3 Code,更是令人惊喜。我这里已经启动了,正在深入体验。测试了1个火柴人格斗双人对战的小游戏,一次就过,没有bug (攻击、碰撞检测、移动、双人键盘操控、死亡判定都没有问题),就是画面简陋了些:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

值得一提的是,阿里云百炼里面,除了这次开源的模型以外,还有 1 个 100 万上下文长度的 qwen3 coder 模型(应该是用 yarn 技术做了外推的,但暂时不知道是否有其它优化),另外这两个模型还送 1000000 tokens……果然大家卷起来之后,我们这些开发者就舒服了(狗头)。做了许多测试,编写前端代码的通过率很高(页面审美上稍弱一点,但出错率很低),编写后端代码的通过率也很不错。总体感受上比之前月之暗面 kimi k2 + claude code 的体验还丝滑一些,弱于 claude code + claude 4。text base rpg,还不错(有小bug,比如战斗后生命-12了,人还活着……):

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

text based rpg

3d 场景测试:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

空间理解测试:莫比乌斯环(里面的圈对了,外面的不太对)

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

另外 Gemini cli 本事支持 yolo 模式(全自动模式),我看了一下 qwen code,果然也支持。

通过 claude code router,能很轻松把 qwen3 code 模型接入到 claude code中。

claude code 的 Agent 设计用起来还是比 gemini cli 稳定一些(比qwen code cli也一样)。如图,这是一句话通过 Claude Code + Qwen3 Code 生成的弹球游戏,一次过,无bug:

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

幸运飞艇官网 qwen3 code + claude code 做的 doodle jump (依然无报错一次过,就是主角丑萌了一点):

Qwen3-Coder 挑战 Claude4 ?知乎 50+ 项目实测千问 AI 编程大模型

以前 Claude 模型的编程能力是一座无法逾越的大山,现在已经不是了。Qwen3 Coder 和 Kimi K2 都一定程度跟上了它的能力,而且还在快速进步中。

真好。

转载请注明来自Nkqfj,本文标题:《火柴人双人武器对决(Qwen3Coder 挑战 Claude4 知乎 50 项目实测千问 AI 编程大模型)》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...