热点资讯
h 你的位置:成人色情综合网 > h > 巨屌 DeepSeek-R1大战豆包、Kimi,国产AI大模子第一花落谁家?
巨屌 DeepSeek-R1大战豆包、Kimi,国产AI大模子第一花落谁家?发布日期:2025-07-03 11:27    点击次数:91

巨屌 DeepSeek-R1大战豆包、Kimi,国产AI大模子第一花落谁家?

日活用户糟塌2000万,与中国移动、华为、金山办公、祥瑞汽车等企业接踵达成协作,DeepSeek迎来了高光时刻。在互联网巨头争相进入AI行业的今天,企业为竣事本事当先,纷繁斥巨资买数据和算力芯片,打造万卡集群。关联词DeepSeek却聘用了名满寰球的以“花小钱办大事”门道,推出的V3模子侦探本钱仅557.6万好意思元,最新的R1模子,则以V3模子为基座,堪称能力不输OpenAI诞生的o1大模子。在侦探本钱仅为其他AI大模子数相当之一的前提下,DeepSeek-R1确切能够捏平o1大模子,顾盼国内诸多AI大模子吗?推论出真知,小雷决定将其与国内用户数目较高、名气较大的豆包、Kimi、文心一言、通义千问四款AI大模子进行对比,测试DeepSeek-R1是否真如宣传中一般苍劲。

图片巨屌

挑战四大AI大模子,DeepSeek技高一筹?架构优化、算力升级后、参数目增多后,AI大模子的功能愈发丰富,值得挖掘的细节也越来越多。本次测试,小雷聘用了咱们日常使用较多的推行分析、创意写稿、数学推理三个花式。参与测试的五款大模子,具体版分内别为DeepSeek-R1、豆包云雀、Kimi-k1.5、文心3.5、通义千问2.5,均可免费使用。推行分析:DeepSeek-R1顾盼群雄为加速使命成果,不少职场东说念主士会使用AI器具维护追思文档、PDF等文献。小雷挑选了京东、第一财经蚁合发布的《2024年青东说念主活命相貌及营销趋势》文档,测试各大AI大模子能否追思出重心推行,匡助小雷快速了解2024年年青销耗群体的特质。此前小雷评测AI大模子时,曾吐槽AI大模子难以分析出文档的中枢推行,导致输出的驱散车轱辘话走动转,但短短三四个月期间畴昔,AI大模子的文档追思能力已获取了飞跃性的莳植。本轮测试中,除了通义千问莫得显着进步,追思的推行过于毛糙,信息缺失严重外,其他几款大模子均证实出色,尤其是豆包和Kimi,不但追思出了2024年的十大趋势,还对2025年的活命相貌趋势算计进行了归类。同期,Kimi还指出,90后和00后销耗占比过半,强调了年青销耗群体的紧迫性。文心一言证实则中规中矩,追思出了2024年的十大趋势,却忽略了2025年算计的有关推行。

图片

(图源:通义千问截图)算作本次评测的主角,DeepSeek-R1证实更为出色,在追思出的每一个趋势下,还会加入一些数据或居品算作事例,与不雅点彼此印证,增强推行的可靠性。好多AI撰写的著述能够一眼认出,原因就在于AI生成的推行较为空匮,没能落到实处,往往穷乏例证,DeepSeek-R1显着已进入了更高级次。

图片

(图源:DeepSeek截图)总的来说,本轮测试中DeepSeek-R1讲解了我方名副其实,证实超越其他四款AI大模子。而另外四款AI大模子中,豆包和Kimi的证实则显着高出一个档次,免费版的文心3.5证实一般,通义千问则证实较差。创意推行撰写:DeepSeek再胜一场2月5日,演义平台阅文集团和数字出书社汉文在线接连晓谕,已接入DeepSeek-R1,将通过AI提高着者的创作成果,但AI确切能够取代网文作家吗?小雷条件AI大模子以古龙作风写一篇5000字到10000字的武侠演义,并输入大纲:天南剑宗第一妙手叶飞霜与太说念教掌门慕容宸约战华山之巅,两边各带本门弟子助阵。慕容宸却黧黑与五大黑说念势力协作,企图透彻消释天南剑宗。关联词天南剑宗实则为六扇门安插在江湖的势力,主意就是借助这次门派约战引出黑说念势力,并将其一举消释。在黑说念势力联手太说念教围攻天南剑宗弟子时,六扇门雄师背后包抄,透彻消释了为祸一方的黑说念势力和太说念教。与此前松手范围的测试不同,写武侠演义虽有大纲律例,但可证实空间极大,各大AI大模子之间的差距和作风也会证实出较为显着的各异。本轮测试中,豆包和Kimi在撰写时,分裂为其取名为《剑影风浪录》和《龙影霜华录》,与古龙大多数演义的取名作风并不相符,反而更像梁羽生的风气。DeepSeek-R1、文心一言并未为演义取名,通义千问则是浮浅地定名为《华山之巅》。

图片

(图源:豆包截图)推行方面,通义千问依然是倒数,穷乏细节描摹和鼎新,小雷未提到的东说念主名或帮派称号,通义千问也莫得主动加入任何一个。Kimi生成的推行质地更好一些,细节较为丰富,关于大纲的清爽也愈加到位,但与通义千问疏通,只是是在大纲原定的东说念主物着笔。DeepSeek-R1、文心一言、豆包生成的推行质地更好,东说念主物、招式、门派称号王人全,且剧情存在不少鼎新,还主动丰富了细节。举例DeepSeek-R1撰写的演义中,两位主东说念主公原来是好一又友,因女东说念主反目构怨,为续写埋下了伏笔;文心一言生成的推行中,叶飞霜在战役中差点走火入魔,获取师兄相助才反败为胜;豆包则主动续写了一段推行,加入了叶飞霜功成名就后,被身边厚交反水的情节。

图片

(图源:DeepSeek截图)缺憾的是,文心一言生成的推行残暴了大纲中的六扇门,将故事全都写成了江湖恩仇,豆包续写的推行邪派描述太少,导致小雷对其的评分稍许裁减了一些。这一轮测试DeepSeek-R1的证实依然远远当先其他AI大模子,但并不是其他几款AI大模子证实不好,文心一言和豆包的证实仍是极端了小雷的预期,只是DeepSeek-R1的证实太好了,有神志纠葛、剧情鼎新,尤其是收尾部分的推行,颇有古龙遗凮。现阶段AI大模子写演义依然会有些吃力,需要用户尽可能将大纲细化。小雷仓卒中想出的大纲过于无极,能够是通义千问和Kimi证实不好的原因之一。数学推理:AI大模子耐久的痛2024年苹果工程师曾发表了一篇论文,吐槽AI大模子并莫得实在的数学推理能力,AI企业的宣传存在夸大身分。随后,各大AI企业纷繁以“复杂推理”为噱头,继续推出了全新的大模子版块。关联词数月期间畴昔,AI大模子确切具备推理能力了吗?本轮测试小雷聘用的数学题是2024年高考一卷第十四题,具体推行为:甲、乙两东说念主各有四张卡片,每张卡片上标有一个数字,甲的卡片上分裂标出奇字1,3,5,7,乙的卡片上分裂标出奇字2,4,6,8,两东说念主进行四轮比赛,在每轮比赛中,两东说念主各自从我方捏有的卡片中立时选一张,并比拟所选卡片上数字的大小,数字大的东说念主得1分,数字小的东说念主得0分,然后各自弃置此轮所选的卡片弃置的卡片在而后轮次中不可使用则四轮比赛后,甲的总得分不小于2的概率为?(正确谜底:1/2)站在东说念主类的角度上,这说念题的难度其实并不高,哪怕将每一种可能全部列出来再计较,所需的期间也不会绝裁夺。关联词在AI大模子眼中,这说念题却是难上了天,DeepSeek-R1、豆包给出的谜底都是17/24,Kimi、文心一言、通义千问给出的谜底分裂是1971/4096、243/256、551/576,果然再一次全部殉国。

图片

(图源:DeepSeek截图)随后小雷又用OpenAI的o1、o3 mini、GPT-4o三款大模子进行了计较,这三款大模子都算出了正确谜底,但细节上也存在一些问题,如o1模子输出推行时出现了2=1/2,但不影响其计较出了正确谜底。该情况标明,在数学推理方面,DeepSeek-R1与OpenAI旗下的大模子可能还有一定的差距。

图片

卡通动漫(图源:o1大模子截图)最道理的不是这些离谱的谜底,而是AI大模子的推理历程,DeepSeek-R1和Kimi-k1.5会不休打断我方的念念考历程,聘用新的有磋磨。数学推理依然是现时AI大模子难以攻克的关口,前两项测试当先其他国产AI大模子的DeepSeek-R1,也在本轮测试中未能拉开差距。

图片

著名之下无虚士,DeepSeek的荣耀实至名归2024年12月,DeepSeek-V3大模子刚上线之时,小雷便对其进行了测试。其时小雷的评价是,DeepSeek-V3在推行追思、翰墨生成方面能够失色豆包、Kimi,但功能丰富性远不足其他AI智能体。仅一个多月期间畴昔,基于V3大模子调度的R1大模子就竣事了质的飞跃,在推行追思、翰墨生成方面相较鼎鼎有名的豆包、Kimi、文心一言、通义千问等AI大模子果然当先不少。固然,数学推理方面人人照旧通常地“菜”,OpenAI仍处于当先地位。DeepSeek-R1只是作念到能力强,无法酿成这样大的影响,最缺欠的是其侦探本钱节略只消600万好意思元,远低于GPT-4,算计只消GPT-5的1/200致使更低。

图片

(图源:豆包AI生成)畴昔咱们的领会中,莳植AI大模子的行业需要堆算力、买数据,AI企业也如实在这样作念,如小米要建万卡集群、字节极端绸缪在2025年插足400亿元购买AI算力芯片。Macquarie分析师质疑DeepSeek避讳了诞生本钱,经过他们的计较,R1大模子的侦探本钱应该在26亿好意思元掌握。DeepSeek却告诉咱们,只需要数百万好意思元,折合东说念主民币不到9位数,就能侦探出失色OpenAI o1大模子的居品。因DeepSeek-R1的冲击,最近一段期间全球算力芯片主要提供者NVIDIA股价沿途狂跌,近两天虽有所回暖,但依然未能回到巅峰时期。借助DeepSeek-R1的超卓证实,DeepSeek转眼成为了AI行业的香饽饽,与百行万企巨头达成协作,致使在工业AI界限实力轶群的华为,也让小艺接入了DeepSeek-R1。因用户数目太多,近期DeepSeek官网常常出现就业器发愤,API调用充值进口也因东说念主数太多被关闭。DeepSeek-R1侦探和推理本钱虽低,可无数用户涌入,DeepSeek现时领有的算力,已无法得志用户的需求。中国企业最擅长的就是从1到正无限,DeepSeek指明了说念路,其他AI企业将快速跟上。DeepSeek若想留下这波流量,增多算力范围、提高用户体验近在眉睫。

End

2024科技大盘货:

1、24年最伟大10款科技居品榜单出炉:款款王炸,AI为王!

2、雷科技裁剪2024买了啥?手机、耳机最受宠,可穿着无东说念主问津?

手机行业的2024:

1、2024年十大爆款手机:款款都暴戾,国产好坏了

2、24年国产手机赢麻了!苹果三星全面糜烂

3、2024旗舰手机盘货:影像和AI才是本年的缺欠词

4、千元机,逆袭了!!!

5、2024年,线下手机透彻杀疯了!

6、2024年,细离异机杀疯了!

7、果味手机,透彻火了!!!

8、2024年手机狂卷翻新:十大本事升起,一切为了“更实用”

9、手机影像卷疯了!九大趋势下,安卓全面碾压iPhone

10、2024年,年度最不消的手机遐想!

11、24年手机确立开倒车!录像头减少、屏幕变小,连充电都慢了!

智能硬件的2024:1、2024年,无线耳机杀疯了!2、2024年的通顺相机:大疆GoPro影石斗法,“御三家”死磕居品3、智能清洁的2024:七大硬核本事糟塌,居品翻新空间依然远大4、2024年平板电脑卷疯了:AI强化坐褥力,告别“泡面盖”5、2024年熟悉硬件大爆发!5款经典居品,款款AI运行6、2024年智能眼镜杀疯了!不单是AI,还有这七大变化7、智能腕表2024的五大趋势:健康、AI、颜值、续航…… 8、2024年度电视盘货:MiniLED成白菜价,国产旗舰狂卷画质9、2024年年度游戏机出炉!性能升级成大主题,“移动时间”来了10、智能门锁狂卷2024:价钱战、AI化和出海成了主旋律?11、仅重19g!24年鼠标太能卷了:有的带屏幕,有的模块化PC行业的2024:1、2024年8大年度PC榜单出炉:靠遐想翻新,用AI破局2、PC DIY的2024:从低迷中走出,大厂纷繁押注AIAI软件的2024:1、2024年十大国产大模子盘货:款款超能打,黑马却是这家?2、九大年度APP出炉!要么AI原生行使,要么AI重塑行使3、AI输入法谁最强?2024年度大模子输入法榜单来了!4、AI影像,透彻爆发!!!科技公司的2024:1、苹果的2024:居品宽广,AI遇阻,生态墙倒塌!2、高通骁龙的2024:从移动之王到智能世界的基石3、联发科的2024:甜点芯守基本盘,旗舰芯冲高端,靠AI赢麻了智能汽车的2024:1、2024十大爆款神车出炉!比亚迪占了一半,智能化还只是小众需求2、自主五常销量公布:比亚迪赢麻了,25年五常变四强?3、2024智驾风浪榜:华为小鹏争霸,“蔚小理”加速,老车企回身4、2024年汽车十大本事趋势盘货:智能化成了潮流的大标的5、25年车圈淘汰赛加速!哪吒、远航危急了,微袖珍车被逼上末路?汽车公司的2024:1、2024,比亚迪活成“卷王”2、2024年,鸿蒙智行透彻杀疯了!!!3、2024深蓝汽车赢麻了!多亏了华为?4、小鹏汽车的2024:献艺教科书式逆袭,四面出击下忧患犹存5、假想的2024:Mega发兵不利,卖车、智驾、出海谨言慎行

6、暴涨300%!赛力斯过肥年:问界太猛了!巨屌

本站仅提供存储就业,总共推行均由用户发布,如发现存害或侵权推行,请点击举报。