欧洲新闻网 | 中国 | 国际 | 社会 | 娱乐 | 时尚 | 民生 | 科技 | 旅游 | 体育 | 财经 | 健康 | 文化 | 艺术 | 人物 | 家居 | 公益 | 视频 | 华人 | 有福之州
投稿邮箱:uscntv@outlook.com
主页 > 财经 > 科技 > 正文

“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

2024-08-16 11:18 差评  -  167381

有个怪事儿,前段时间,大模型竞技场上,一位代码为 sus-column-r 的匿名模型横空出世。

没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将。。。

累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,综合能力已经和 5 月 13 号发的 GPT-4o ( API 版本 )并列第三了。

图片

看这势头,当时就有不少人猜测,这可能是 OpenAI 那个迟迟没向大众公布的,神秘的 “ 草莓 Q* ” 项目。

图片

图片

然而,就在昨天,这个困扰大伙儿很久的谜语,终于有答案了。但解开它的,不是 OpenAI ,而是经常被大家忽略,但也在搞 AI 的马斯克

图片

这个匿名的 sus-column-r 模型,其实就是 xAI 要推出的新模型 Grok2 ,现在已经上线会员版的 X 了。

而之所以在大模型竞技场上整这么一出,说白了,是想给昨天的发布热热场子。

像是在官宣推出 Grok2 的博客里,就明晃晃地展示了之前 sus-column-r 积累的战绩,甚至还做了对战胜率表

按照他们自个儿的说法,表里面除了谷歌的 Gemini 1.5 Pro 外,其余无论是 GPT-4o ,还是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下败将 ” 。

图片

图片

当然了,其他的纸面成绩, Grok2 答得也挺不错。光从各个基准的数据来看,它的各项能力,都和市面上最先进的 AI 差不多,这一线大模型的行列,也算是被 Grok 给挤进去了。

图片

不过在世超的标准里,一个模型好不好,光看这些数据也还不行,最重要的是,得看大伙们的实际使用体验。

相较于上次的还只能文字开开玩笑的 Grok1.5 ,这次 Grok2 最明显的一个升级,就是新增了图片功能

但和其他家自己动手搞多模态 AI 不一样,这次马斯克倒挺罕见地选择了和别人合作。

合作的对象,差友们应该还有点印象,就是前两天咱刚写过的 FLUX.1 

图片

看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI 。。。

图片

但没想到集成到 Grok2 里面的 FLUX.1 ,还真撞出了一点不一样的火花

倒也不是说,在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI , Grok2 的整活能力可以称得上是一骑绝尘。

同样是迪士尼公主的一个提示词, Grok2 在尺度上就比其他模型要大胆的多。

图片

而且, Grok2 还能直接对着自己的老板恶搞,比如这是一个爱吃甜品,吃到发胖的马斯克。

图片

转眼,他还能穿越到权力的游戏里,玩角色扮演。

图片

图片

更搞的是,还有网友直接拿 Grok2 生成的图,和视频 AI 配合起来,做起了视频。

图片

不过, Grok2 这么肆无忌惮地恶搞各种公众人物、卡通人物,风险肯定还是有的。

像是有网友生成马里奥抽烟喝酒、观望 “ 911 ” 事件的图片,就已经有人督促任天堂起诉了。

图片

除了新增有图片功能外, Grok2 这次提升的基础能力,咱肯定也得上手测测,看看实力。

图片

考虑到目前 X 上线的,还只是性能差一点的小杯 mini 版,于是世超在大模型竞技场上,试用了下能力更强的 Grok2 ,还拉来了最新版本的 GPT-4o 作比较。

比试第一招,先从 AI 容易犯错的题目开始。前段时间,大模型集体在 “ 小数比较 ” 上翻车,大伙应该都听说过了。

这次再来波经典重现,让它俩来比比 9.5 和 9.11 的大小。

没想到的是, GPT-4o 依旧是死性不改,结果对了,但一看解题思路,完全就是一塌糊涂。反倒是 Grok2 倒有理有据,给出了正确答案。

图片

还有经典的数数问题, GPT-4o 依旧让人大跌眼镜, “ 我一把把把把住了 ” 它竟然数出来 5 个把字, Grok2 这边倒还是稳定发挥。

图片

图片

不过紧接着问它俩这句话的意思, Grok2 就有点露怯了,乱说了一大堆,没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。

图片

接下来世超又试了一些比较基础的常识性问题,比如说 “ 李政道是谁 ” ,它俩回答的,都还算正确。就是不知道为啥, GPT-4o 很容易犯懒,草草几句话就结束了。

而 Grok2 这边,每次给出得答案都挺详细,还贴心地分了类。

图片

图片

反正世超在实际用的时候,是真有感觉到 Grok2 能力的提升

另外,按照官方给的数据,这次 Grok2 在数学这块儿,也能算得贼溜了。

于是我就又翻出了之前 Grok 做错的那道数学题,是一道求导的问题。

图片

结果马斯克还真没忽悠咱,它俩都把这道题给整明白了。

图片

而把 Grok 奶成现在的模样,马斯克在背后出得力可不止一星半点儿。

图片

但有意思的是,马斯克主打的,就是薅自己其他公司的羊毛。。。

先是员工这块儿, xAI 统共就只有 50 来个员工,其中有 11 个都是在特斯拉工作的,而且里面还有 6 个是在 Autopilot 团队工作的,是一点儿都不想避嫌。

据华尔街日报消息,甚至原本要给特斯拉用的 GPU ,也被马斯克要求优先供应给 xAI ,还冠冕堂皇的说,特斯拉现在也没地儿用,在仓库里放着也是放着。

图片

偷完特斯拉的家,还不过瘾,马斯克把手也伸到了 X 上。

就在前两天,科技媒体 Techcrunch 称,为了 “ 悄悄 ” 用用户们的数据训练 AI , X 在更新的时候,还偷摸着把用户的默认设置给改了,而且要关掉还得专门登录网页版。。。

不过总这么偷家,难免会吃上官司。像是马斯克和他的 X ,就被特斯拉的股东,还有好几个国家的数据保护机构给起诉了。

目前,关于特斯拉的案件,已经在特拉华州的一个法院审理了。

而另外几个数据保护机构,也把 X 告得,暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到 “ 4% 平台营业额 ” 的罚款。

图片

图片

但无论如何,在大模型这块儿,马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比,不管是图片生成,还是其他基础能力上, Grok2 都不算差,甚至还整出了一点儿自己的特色

据说, xAI 下一步会把 Grok 更深入地揉到 X 平台上面,而且还要再发一个多模态理解的预览版 AI 。

不知道为啥,世超已经有点期待,马斯克还能整出什么花活儿来了。。。

  声明:文章大多转自网络,旨在更广泛的传播。本文仅代表作者个人观点,与美国新闻网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如有稿件内容、版权等问题请联系删除。联系邮箱:uscntv@outlook.com。

上一篇:赛昉推出64位极低功耗乱序RISC-V CPU内核IP昉・天枢-70
下一篇:美国批准向澳大利亚出售价值约1亿美元“标枪”反坦克导弹

热点新闻

重要通知

服务之窗

关于我们| 联系我们| 广告服务| 供稿服务| 法律声明| 招聘信息| 网站地图

本网站所刊载信息,不代表美国新闻网的立场和观点。 刊用本网站稿件,务经书面授权。

美国新闻网由欧洲华文电视台美国站主办 www.uscntv.com

[部分稿件来源于网络,如有侵权请及时联系我们] [邮箱:uscntv@outlook.com]