体育游戏app平台很短的时辰内飞快激励了不少一又友的关怀-Kaiyun网页版·(中国)开云官方网站登录入口

栏目分类

新闻: 资讯; 娱乐; 新闻; 旅游; 汽车; 电影

热点资讯

欧洲杯体育成交额4638.3万元-Kaiyun网页版·(中国

欧洲杯体育适度2025年3月31日-Kaiyun网页版·(中

开yun体育网较2024年12月31日加多701户-Kaiy

你的位置：Kaiyun网页版·(中国)开云官方网站登录入口 > 新闻 > 体育游戏app平台很短的时辰内飞快激励了不少一又友的关怀-Kaiyun网页版·(中国)开云官方网站登录入口

体育游戏app平台很短的时辰内飞快激励了不少一又友的关怀-Kaiyun网页版·(中国)开云官方网站登录入口

发布日期：2026-04-13 02:24 点击次数：66

体育游戏app平台很短的时辰内飞快激励了不少一又友的关怀-Kaiyun网页版·(中国)开云官方网站登录入口

破钞了 DeepSeek V3 的 263 倍的算力的 Grok3，就这？

　　作家 | 极客公园张勇毅

　　北京时辰 2 月 18 日，马斯克与 xAI 团队，在直播中证据发布了 Grok 最新版块 Grok3。

　　早在本次发布会之前，依靠着各种联系信息的抛出，加上马斯克本东说念主 24/7 络续交的预热炒作，让公共对 Grok3 的期待值被拉到了空前的经由。在一周前，马斯克在直播中磋议 DeepSeek R1 时，还信心满满地示意「xAI 行将推出更优秀的 AI 模子」。

　　从现场展示的数据来看，Grok3 在数学、科学与编程的基准测试上依然特别了当今整个的主流模子，马斯克以致声称 Grok 3 改日将用于 SpaceX 火星任务策划，并展望「三年内将收尾诺贝尔奖级别冲突」。

　　但这些当今齐只是马斯克的一家之言。笔者在发布后，就测试了最新的 Beta 版 Grok3，并冷落了阿谁经典的用来刁难大模子的问题：「9.11 与 9.9 哪个大？」

　　缺憾的是，在不加任何定语以及标注的情况下，堪称当今最聪惠的 Grok3，仍然无法正确回复这个问题。

　　Grok3 并没准确识别出这个问题的含义 | 图片来源：极客公园

　　在这个测试发出之后，很短的时辰内飞快激励了不少一又友的关怀，无专有偶，在国际也有好多近似问题的测试，举例「比萨斜塔上两个球哪个先落下」这些基础物理/数学问题，Grok3 也被发现仍然无法大意。因此被戏称为「天才不肯意回复浮浅问题」。

　　Grok3 在践诺测试中的许多知识问题上出现「翻车」 | 图片来源：X

　　除了网友自愿测试的这些基础知识上 Grok3 出现了翻车，在 xAI 发布会直播中，马斯克演示使用 Grok3 来分析他堪称时常玩的 Path of Exile 2 (放逐之路 2) 对应的作事与升华恶果，但践诺上 Grok3 给出的对应谜底绝大部分齐是舛错的。直播中的马斯克并莫得看出这个廓清的问题。

　　Grok3 在直播中也出现给出数据多量舛错的情况 | 图片来源：X

　　因此这个诞妄不仅成为了国际网友再次嘲讽马斯克打游戏「找代练」的实锤根据，同期也为 Grok3 在践诺期骗中的可靠性，再次打上了一个大大的问号。

　　关于这么的「天才」，不管践诺才略几何，改日被用于火星探索任务这么的很是复杂的期骗场景，其可靠性齐要打上一个大大的问号。

　　当今，繁密在几周前取得 Grok3 测试经验、以及昨天刚刚用上几个小时的模子才略测试者，关于 Grok3 现时的阐扬，齐指向了一个疏导的论断：

　　「Grok3 是很好，但它并不比 R1 或 o1-Pro 更好」

　　「Grok3 是很好，但它并不比 R1 或 o1-Pro 更好」 | 图片来源：X

　　Grok3 在发布寺东说念主方的 PPT 中，在大模子竞技场 Chatbot Arena 中收尾「遥遥起初」，但这其实也期骗了一些小小的作图妙技：榜单的纵轴仅列出了 1400-1300 分段的名次，让原来 1% 的测试收尾差距，在这个 PPT 展示中齐变得荒谬廓清。

　　官方发布 PPT 中的「遥遥起初」恶果 | 图片来源：X

　　而践诺的模子跑分收尾，Grok3 其实也只比 DeepSeek R1 以及 GPT4.0 收尾了不到 1-2% 的差距：这对应了不少用户在践诺测试中「并无廓清辩认」的体感恶果。

　　践诺上的 Grok3，只比自后者高了 1%-2% | 图片来源：X

　　此外天然在分数上，Grok3 进步了当今公开测试的整个模子，但这少许并不被好多东说念主买账：毕竟 xAI 在 Grok2 期间就有在这个榜单中「刷分」，跟着榜单对回复长度作风作念降权处理而大幅裁汰分数的情况，因此时常被业内东说念主士诟病「高分蠢笨」。

　　不管是榜单「刷分」，如故配图盘算上的「小妙技」，齐展示出的是 xAI 以及马斯克本东说念主关于模子才略「遥遥起初」这件事的执念。

　　而为了这些差距，马斯克所付出的代价堪称腾贵：在发布会中，马斯克用近乎骄贵的口气示意，用了 20 万张 H100（马斯克直播中示意使用「进步 10 万」张) 检修 Grok3，总检修小时数达到两亿小时。这让一部分东说念主认为这是对 GPU 行业的又一个紧要利好，并认为 DeepSeek 给行业带来的转机是「愚蠢」的。

　　不少东说念主认为堆砌算力将会是模子检修的改日 | 图片来源：X

　　但践诺上，有网友对比了使用 2000 张 H800 检修两个月得出的 DeepSeek V3，策划出 Grok3 其践诺的检修算力破钞是 V3 的 263 倍。而 DeeSeek V3 在大模子竞技场榜单上与得分 1402 分的 Grok3 的差距，以致还不到 100 分长途。

　　从这些数据出炉之后，就有不少东说念主快速坚决到，在 Grok3 登顶「寰球最强」的背后，其实是模子越大，性能越强的逻辑，依然出现了廓清的角落效应。

　　即使是「高分蠢笨」的 Grok2，其背后也有着 X（Twitter）平台内海量的高质地第一方数据算作撑捏来使用。而到了 Grok3 的检修中，xAI 天然也会遭受 OpenAI 现时不异遭受的「天花板」——优质检修数据的不及，让模子才略的角落效应飞快曝光。

　　关于这些事实，最早坚决到况且亦然最深入瓦解的东说念主，细目是 Grok3 的开导团队与马斯克，因此马斯克也在外交媒体上不休示意现时用户体验到的版块「还只是只是测试版」「圆善版将在改日几个月推出」。马斯克本东说念主更是化身 Grok3 居品司理，建议用户告成在磋议区响应使用时所遭受的多样问题。

　　他八成是地球上粉丝数目最多的居品司理 | 图片来源：X

　　但不到一天之内，Grok3 的阐扬，无疑给寄但愿依靠「纵欲飞砖」检修出才略更强的大模子的自后者敲响了警钟：根据微软公开的信息揣度，OpenAI GPT4 参数体积为 1.8 万亿参数，比较 GPT3 依然升迁了进步 10 倍，而神话中的 GPT4.5 的参数体积以致还会更大。

　　模子参数体积飞涨的同期检修老本也在飙升 | 图片来源：X

　　有 Grok3 在前，GPT4.5 以及更多想要不绝「烧钱」，以参数体积来取得更好模子性能的选手，齐不得不磋议到依然近在目下的天花板，应该如何冲突。

　　此时此刻，OpenAI 的前首席科学家 Ilya Sutskever 在昨年 12 月曾示意「咱们所熟练的预检修将会收尾」，又被东说念主重新谨记来，并试图从中找到大模子检修的真确出息。

　　Ilya 的不雅点，依然为行业敲响了警钟 | 图片来源：X

　　彼时， Ilya 准确预猜测了可用的新数据接近零落，模子难以再不绝通过获取数据来升迁性能的情况，并这种情况神色为化石燃料的破钞，示意「正如石油是有限资源一样，互联网中由东说念主类生成的内容亦然有限的」。

　　在 Sutskever 展望中，预检修模子之后的下一代模子将会有「真确的自主性」。同期将具备「近似东说念主脑」的推理才略。

　　与如今预检修模子主要依赖的内容匹配（基于模子此前学习的内容）不同，改日的 AI 系统将能够以近似于东说念主脑「念念维」的步地，来迟缓学习并开导起经管问题的要领论。

　　东说念主类对某一个学科作念到基本的闪耀，只需要基本专科竹帛即可收尾，但 AI 大模子却需要学习数以百万计的数据智力收尾最基础的初学恶果，以致当你换了个问法之后，这些基础的问题也无法正确瓦解，模子在真确的智能上并莫得得到升迁：著述来源提到的那些基础但 Grok3 仍然无法正确回复的问题，即是这种好意思瞻念的直不雅体现。

　　但在「力大飞砖」以外，Grok3 淌若确实能向行业揭示「预检修模子行将走到尽头」这个事实，那它对行业仍然称得上有着紧要的启发趣味。

　　偶然，在 Grok3 的怒潮逐步褪去之后，咱们也能看到，更多近似李飞飞「在特定数据集的基础上 50 好意思元微调出高性能模子」的案例出现。并在这些探索中，最终找到真确通向 AGI 的说念路。

海量资讯、精确解读，尽在新浪财经APP

职守剪辑：韦子蓉体育游戏app平台

上一篇：欧洲杯体育金条价钱847元/克-Kaiyun网页版·(中国)开云官方网站登录入口

下一篇：开云(中国)kaiyun网页版登录入口不外不会连续延迟“阿卡姆”系列的故事-Kaiyun网页版·(中国)开云官方网站登录入口