admin管理员

文章19771
浏览58643

搜索

« 2025年11月 »
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

火柴人双人武器对决（Qwen3Coder 挑战 Claude4 知乎 50 项目实测千问 AI 编程大模型）

admin 2025-11-01 热文 2 次浏览 0个评论

新知答主@刘聪NLP

点击文末「阅读原文」查看完整内容、交流

测试是从简单到复杂，从单一的静态页面，到最后实现一个小工具。先说我的总体感受，强，很强，审美变好了，项目代码的完成度很高，跟 1T 参数的 K2 不相上下，有的一拼，但部署成本少了一半。

第一个「生成一个打工人时钟的 html 页面」，这里主要看单一 HTML 生成效果是否美观。这个配色就很 Qwen，基本信息都包含，「不过有些人在休息，有些人还在写测试文章」，哈哈哈！

Qwen3-Coder 挑战 Claude4 ？知乎 50+ 项目实测千问 AI 编程大模型

第二个「根据给定的内容生成 PPT」我用的是前两天的《Agent 时代上下文工程的 6 大技巧》。

内容显示是完整的，PPT 页数切换很炫酷，闪瞎了我的狗眼，就是内容呈现相较于换页就显得有点朴素了~但是整体我还是满意的。

第三个，上点难度，「创建一个红白机风格的贪吃蛇游戏」。

这个很棒，我是玩了半天，不过我觉得现在生成贪吃蛇游戏对于大多数大模型来说都是小 case 了。现在想想一年前的大模型 code 能力，再想想现在大模型 code 能力，只感叹大模型现在进步真的挺快了，尤其是开源大模型追闭源大模型，也很快了。

第四个，生成可爱风格的五子棋游戏。

可爱风格五子棋游戏界面，画面有两个模式按钮「人人对战」和「人机对战」，界面整体采用马卡龙色调，棋盘简洁清晰，棋子设计成卡通小动物（如猫咪和小熊），背景带有轻微渐变和星星点缀，界面边缘圆润，按钮 Q 萌，整体风格温馨可爱，适合儿童或休闲玩家使用，2D 插画风。

纯一次生成的看着还可以，像那么一回事儿，但是你人机对战，是不是有点呆了呀。

于是我直接将 Qwen-Coder 配到了Cline里，看看在 Agent 下效果如何，同时也能考察 Qwen-Coder 的 Agent 能力。实话实说，真实好了不少，我觉得Qwen-Coder 这波的审美也是在线的，不过可能是因为前面一个太呆了，导致我大意了，竟然没下赢。

第五个，再次升级，「生成一个 AI 围棋对战游戏」。

这个是参考好友@洛小山，前两天测试 k2 的例子。这是一个 AI 围棋对战游戏项目，使用 FastAPI后端转发AI消息，前端采用 Tailwind CSS + JavaScript 实现。

核心功能包括：支持用户与传统算法 AI 或大模型 AI（OpenRouter、Qwen、Kimi）对局，提供多种游戏模式（人人、AI 对战、观战），实现完整的中国围棋规则（气的计算、提子、死活判定、占领面积计算、数子计分），要有棋盘视觉提示、悔棋系统等功能。

我觉得生成内容还是很好的，前后端都生成了，不过我不懂围棋，我感觉它在瞎下，但是我真不懂，哈哈哈！不过整体框架啥的弄得都挺好的，效果真不错，Qwen 这波开源救我老命了。

第六个「生成一个通过点击立方体的各个面，逐渐展开为完整平面的交互动画」。

这是好友@卡尔测试 K2 的例子，Claude4 是跑不出来的，Kimi K2 生成也是有 bug，但动画本身都很流畅。

Qwen这个说实话，面没对上，没有那么好，不过我后面又加上一句「展开需要符合客观事实」，然后面能对上，但是展开的顺序还是有点问题。这个确实有点难了。

第七个「生成一个小工具，直接将文章链接转成 md，方便复制」。功能完全实现了，并且在前面预览的也很好，格式、图片也都搞下来了，支持一键复制。

所以，vibe coding 盛行的时代，想快速实现一个小的工具，真的太方便了，你只要能描述清楚你的需求即可，即使你描述不清楚，你也可以让大模型帮你润色，现在真是太方便了。

这次 Qwen-Coder 的实测表现真的是效果炸裂，尤其是在审美、代码完整度、工具调用等方面，用起来真爽。

重点是依旧开源！现在的开源大模型的代码能力，也正在从「能写点代码」进化为了「写得又快又好、还能直接使用」。

最后想说，开源界最早是 Qwen 打下基础，后来DeepSeek 爆火，加之 Kimi、Minimax 等都加入，中国开源大模型不断更新，真幸福！中国开源模型就是遥遥领先，不接受任何反对！

答主@卜寒兮

点击文末「阅读原文」查看完整内容、交流

- 代码能力小测

我简单测试了下模拟物理场景的代码能力。首先是一个生成可交互的动画效果的任务，完成起来完全没有压力。

然后是生成一个 3D 迷宫游戏，从场景搭建、迷宫生成、角色控制到动画和碰撞检测。

重点在于使用 Three.js 和其相关的加载器和控制器，并强调了版本兼容性（r128）、程序化纹理生成、动画混合、以及角色朝向的精确计算。是一个比较复杂的项目，需要对 Three.js 有较好的理解。

效果大概是这样，完成的也不错：

作为对比，这是 Claude 生成的效果：

- Agent 能力

这次发布，除了 Qwen3-coder 模型本体，Qwen 还推出了 Qwen Code 智能体，本质上是一个命令行工具，基于 Gemini Code 开发的，通过 Qwen Code 可以更好发挥 Qwen3-coder 模型的 Agentic 和工具使用的能力。

使用 Qwen Code，首先保证安装了 Node.js 环境，如果还没安装，可以执行： curl -qL https://www.npmjs.com/install.sh | sh

然后通过 npm 全局安装 Qwen code： npm install -g @qwen-code/qwen-code

然后在终端运行 qwen 指令就进入 Qwen Code 环境了，不过在使用之前，还需要授权一下 API key，Qwen Code 支持 OpenAI SDK 调用 LLM，在配置页面选择 OpenAI：

填入你的阿里云百炼平台的 API Key，把 API 的Base url 也替换为阿里云百炼平台的，然后模型填入 qwen3-coder-plus，确认就完成授权了。

现在就可以跟 Qwen code 进行对话了，Qwen code 在 Gemini CLI 的基础上开发而来，包括很很多基础工具调用能力，比如基础的文件读写、命令行工具等等。

1、测试了一下 Qwen Code 对于代码项目的理解能力，直接让他生成 GitHub 上 Qwen Code 的项目结构：

可以看到它对整个项目的架构和功能模块理解得很全面。继续让它生成一份 wiki 资料，然后它直接给出一个完整的 wiki 文档：幸运飞艇开奖网

Qwen Code 推出给了可以给国内很多不方便使用 Gemini CLI、Claude Code 等工具的人一个选择，也能很轻松用上 Agentic 命令行工具，开展更多的自动化开发工作。个人感觉这个工具的重要性不亚于 Qwen3 Coder 模型本身。你可以用它搜索代码库，协助代码开发，自动化工作流，或者进行代码的重构和优化等等。不过由于时间有限，还没来得及做更多的能力测试，后面我会继续使用 Qwen Code，有了新的体验和发现，也会及时更新在这里。

另外，让我比较欣赏的一点是一直以来 Qwen 对社区三方工具的兼容性和适配性做的都很好，而且能感觉到是在积极主动的做这件事。

这次的 Qwen3-Coder 也是一样，除了在 Gemini CLI 基础上开发的 Qwen Code 命令行工具，现在还可以将 Qwen3-Coder 和 Claude Code、Cline 等工具搭配起来使用，尽可能发挥它的 Agentic 能力。

总的来说，个人认为 Qwen3-Coder 并非一次简单的模型迭代，我更愿意称它是一次系统性的工程实践，为下一代代码大模型的发展搭建了更高的阶梯。一个能够自主发现问题、解决问题、并从解决过程中学习和提升的 Code Agent，或许已经离我们不远了。Qwen3-Coder，正是朝着这个方向迈出的坚实而关键的一步。

答主@安小强

点击文末「阅读原文」查看完整内容、交流

谢邀。Qwen3-Coder-480B-A35B-Instruct，480B 参数的 MOE 模型（35B 激活参数）原生支持 256K 上下文，可外推扩展到 1M 上下文。许多榜单分数确实赶上 Claude Sonnet 4了（甚至略有超过）。但这不是一个单纯的 coding模型，而是一个奔着 Agent 去的完整编程解决方案。这次阿里发布的 Qwen3-Coder，不能只看模型，得把模型和它的配套工具 qwen-code 放在一起看，这才是它的全貌.

Qwen Code 是一个命令行 AI 工作流工具，源自Gemini Cli，专为 Qwen3-Coder 模型优化，具有增强的解析器支持 & 工具支持。

效果上我最关注的是能否替代 Claude Code。前段时间月之暗面刚刚发布的 Kimi K2，已经做得很好了，这次阿里的 Qwen3 Code，更是令人惊喜。我这里已经启动了，正在深入体验。测试了1个火柴人格斗双人对战的小游戏，一次就过，没有bug （攻击、碰撞检测、移动、双人键盘操控、死亡判定都没有问题），就是画面简陋了些：

值得一提的是，阿里云百炼里面，除了这次开源的模型以外，还有 1 个 100 万上下文长度的 qwen3 coder 模型（应该是用 yarn 技术做了外推的，但暂时不知道是否有其它优化），另外这两个模型还送 1000000 tokens……果然大家卷起来之后，我们这些开发者就舒服了（狗头）。做了许多测试，编写前端代码的通过率很高（页面审美上稍弱一点，但出错率很低），编写后端代码的通过率也很不错。总体感受上比之前月之暗面 kimi k2 + claude code 的体验还丝滑一些，弱于 claude code + claude 4。text base rpg，还不错（有小bug，比如战斗后生命-12了，人还活着……）：