终极无敌版地下城勇士(刚刚)

终极无敌版地下城勇士(刚刚)

admin 2025-10-10 资讯 2 次浏览 0个评论

一个国产AI,前脚还被人当笑话看,后脚就把谷歌最新的模型给干趴下了。

这事就发生在这几天,主角叫DeepSeek。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

幸运飞艇168

就在一个月前,它还病得不轻。你让它写个代码,它总在最关键的地方,给你塞进一个莫名其妙的“极”字。

一个好好的指令,叫“time。Second”,从它嘴里出来,就变成了“time。Se极”。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

对普通人来说,这可能就是个错别字。但对程序员来说,这就是灾难。整个程序会因为这一个字,直接瘫痪。

当时,一堆程序员在网上骂,说这玩意儿根本没法用在正经工作上。大家还给这个毛病起了个外号,叫“极你太美”。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

谁也没想到,一个月后,它回来了。

不但病好了,还带着一身杀气。

它换了个新名字,叫DeepSeek-V3。1-Terminus。Terminus,是终点的意思。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

他们做的第一件事,就是把那个讨人厌的“极”字,从系统里连根拔起。我们用当初最容易出错的那些话反复试它,那个字再也没出现过。

代码干干净净,一点毛病没有。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

光是治好这个“口吃”的毛病,还算不上什么。

他们还顺手解决了另一个大麻烦:说话中英夹杂。

很多AI都有这个问题,你跟它说中文,它回你的话里偏要夹几个英文单词。反过来也一样。这感觉很别扭,像跟一个假洋鬼子聊天。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

之前DeepSeek自己也承认有这个问题,说以后会改。

现在,它改好了。

新版本说话干净利落,你说中文,它就老老实实回中文。你说英文,它也绝不串味。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

从修复一个字的bug,到梳理清整个语言系统,这不像是在打补丁,更像是在做一次脱胎换骨的大手术。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

<h3>硬仗来了</h3>

自己的毛病都治好了,接下来就是出门跟人比划比划了。

这次更新,最狠的地方不在于改了什么,而在于它超越了谁。

谷歌的Gemini 2。5 Pro,算是现在全球最顶尖的模型之一。可在好几场硬碰硬的考试里,DeepSeek的分数,比它还高。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

尤其是在一个叫“人类最后的考试”的测试里,这名字听着就吓人,难度也确实变态。DeepSeek之前的成绩一直很一般,是它的弱项。

这次,它的分数直接飙升了36。48%。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

一下子,最短的那块木板,变成了最长的那块。

这还不算完。

现在的AI,不光要会聊天,还得会“干活”。也就是让它自己上网找资料,自己分析东西,自己写代码。这种能力,圈内人管它叫“Agent”。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

考验AI干活能力的比赛里,比如一个叫SWE-bench的软件工程测试,DeepSeek的分数也超过了谷歌。

它现在更像一个能干的助理,而不是一个只会聊天的匣子。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

一个月前,他们说自己“迈向了Agent时代的第一步”。

现在看来,这第二步迈得又狠又准,直接踩到了巨人的肩膀上。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

<h3>终点站,还是火车站?</h3>

它也不是无敌的。

在另外几个和代码有关的小测试里,它的分数反而降了一点点。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

这感觉就像一个偏科生,恶补了自己最差的科目,考了全班第一,但原来最擅长的科目,因为没怎么复习,退步了一两名。

这点小退步,跟它取得的巨大进步比起来,根本不算什么。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

幸运飞艇预测 现在最让人好奇的,是它的新名字。

Terminus,终点。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

什么东西的终点?是这个版本的终点,意思是已经打磨到头了,没法再好了?

还是说,这是一个旧时代的终点,是它追赶别人阶段的结束,接下来,要开始领跑了?

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

网上的人已经吵翻了。

大家不再关心那个“极”字的笑话,而是在疯狂地问:DeepSeek-V4什么时候出?下一个大招是什么?

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

从一个被人嘲笑的bug,到一个能跟全球霸主掰手腕的狠角色,它只用了一个月。

这个名叫“终点”的版本,给所有人的感觉,都更像是一个新的起点。

刚刚,DeepSeek-V3.1终极版重磅发布!最大提升超36%,R2还远吗?

转载请注明来自Nkqfj,本文标题:《终极无敌版地下城勇士(刚刚)》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...