CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

AI实力榜大洗牌！OpenAI谷歌强势领跑，Anthropic节节败退

2025-05-17 02:02:43

新智元报道

编辑：英智

【新智元导读】AI市场风起云涌！Poe最新报告揭晓：OpenAI的GPT-4o称霸文本生成，谷歌的Gemini 2.5 Pro领跑推理，Kling在视频领域异军突起，企业如何在这场AI竞赛中抢占先机？

最近，Poe发布了最新的使用报告，报告显示，OpenAI和谷歌的地位越来越稳，势头很猛。

Anthropic就没那么好运，有点掉队了。

AI模型的推理能力，已经成为了各大公司竞争的关键战场。

根据Poe发布的数据，2025年1月到5月这段时间，AI各个主要领域，市场份额都重新洗牌了。

主要结果如下：

文本生成：GPT-4o以35.8%稳居榜首，Claude和Gemini紧随其后。
推理：Gemini-2.5.Pro以31.5%登顶，Claude、DeepSeek-R1、最近推出的o3和o4-mini榜上有名。
图像生成：Imagen3、GPT-Image-1和Flux系列三分天下。
视频生成：Runway暂列第一，Kling-2.0-Master来势汹汹，Veo-2排名第三。

智能体：o3拔得头筹，战胜了Anthropic的Claude和谷歌的Gemini。

截至2025年5月不同类别的AI模型排名

o3驱动的智能体拔得头筹，Claude和Gemini紧随其后。

文本：

GPT-4o稳坐头把交椅，新模型来势汹汹

在文本生成这个领域，OpenAI的GPT-4o是稳稳的第一，用户占比达到35.8%，占据主导地位。

OpenAI新出的GPT-4.1系列也不容小觑，发布没几周，就拿下了9.4%的份额。

谷歌的Gemini 2.5 Pro表现也不错，刚上线不久，就有大约5%的用户选择它。

不过，Anthropic的Claude可就有点惨了，这段时间它的市场份额下降了10%，被OpenAI和谷歌抢走了不少用户。

虽说现在Claude 3.7 Sonnet更受大家欢迎，取代了Claude 3.5 Sonnet，但老版本也还有12%的人在用。

还有DeepSeek，今年年初一炮而红。后来其他公司也推出了不少价格实惠、功能又强的推理模型。

DeepSeek R1的用户占比从2月中旬7%的最高点，下跌到4月底，只剩3%了。

推理：

会解难题成了「制胜法宝」

专门用来推理的模型越来越受欢迎了。

2025年年初开始，推理模型的比例从2%一下子涨到了10%。

Nick Huber表示，这些推理模型别看还在发展初期，但解决复杂问题的能力特别强，给出的答案也更准确。那些喜欢尝鲜的用户发现了它的好处，就算用的时候成本高一点、花的时间长一点，他们也愿意，就为了能得到更好的结果。

在推理模型这个热门领域，谷歌的Gemini 2.5 Pro一骑绝尘。

上线才六周，就占了31%的市场份额，把Claude那些专门做推理的模型都比下去了。

OpenAI在推理模型方面一直在创新。2025年前4个月，就推出了好多款新的推理模型，像o1-pro、o3-mini。

Poe的用户特别愿意尝试OpenAI的新模型，很快就从老版本换成新版本了。

还出现了一些新的混合推理模型，像Gemini 2.5 Flash Preview和Qwen 3，它们能在聊天的时候根据情况调整推理的深度。

不过目前用这些新模型的用户还不多，只占推理模型用户总数的1%左右。

有行业分析师就说了，现在大家都在卷推理能力，这说明AI市场在慢慢成熟。

基础的文本生成功能已经没什么差异化了，想脱颖而出，就得靠这种更高级的能力。

图像：

谷歌Imagen 3「搅局」

图像生成这个领域现在也是竞争白热化。

谷歌的Imagen 3系列模型一路逆袭，2025年市场份额从10%左右涨到了30%，已经能和黑森林实验室的FLUX系列模型「掰掰手腕」了。

到4月下旬，FLUX系列模型的市场份额也就35%左右。

OpenAI的GPT-Image-1也不甘示弱，4月下旬刚接入API，才过了两周，就有17%的用户用它来生成图像了，和它之前在ChatGPT里爆火的情况差不多。

虽然FLUX系列模型在Poe的图像生成领域还是用的人最多，但从数据上也能看出，它的市场份额从45%掉到35%了，被谷歌和OpenAI抢了不少用户。

以前图像生成是Midjourney和Stable Diffusion的天下，现在谷歌、OpenAI和黑森林实验室三足鼎立，竞争特别激烈。

现在图像生成的质量越来越好，对用户给的提示理解得更准，生成速度也更快，已经成为竞争最激烈的战场之一了。

从行业数据能看出，最近这半年，企业对图像生成技术的需求暴增。好多公司的营销部门还有创意机构，都开始用这些技术做设计了。

视频：黑马Kling搅局

在视频生成领域，中国快手实验室新出的Kling系列模型就像一匹黑马，直接拿下了30%左右的市场份额。

其中Kling-2.0-Master最厉害，4月底发布，才过了三周，在Poe上的使用占比就达到21%了。

谷歌的Veo2自从2月发布以来，一直保持着20%左右的份额，表现挺稳定。

但这个领域最早的开拓者Runway就没那么幸运了，在报告期里，它的市场份额从60%大幅下降到20%。

Kling系列能这么快打开市场，说明在新兴的AI领域，就算是一开始领先的公司，如果不持续进步，很快就会被新公司超越。

视频生成特别耗性能，哪怕生成一小段视频，也得需要很强的处理能力。所以和文本、图像生成比起来，用视频生成模型的人相对少一些。

不过现在技术发展快，成本在下降，视频质量在提高，估计2025年用的人会越来越多。

现在已经有不少广告公司、社交媒体博主还有教育平台开始用AI生成视频了，虽然这项技术还有些不足，但大家都看到了它的潜力。

语音：

ElevenLabs称霸，新公司另辟蹊径

在语音领域，ElevenLabs还是稳稳的王者，报告期内，差不多80%的用户都用它来做文本转语音。

不过，Cartesia、Unreal Speech 这些新公司也来分蛋糕了，它们提供了很多不一样的语音选择，还有各种音效，价格也各有优势。

和其他领域的竞争很分散不同，语音AI基本被ElevenLabs垄断了。

专家分析，这是因为它进入市场早，语音库特别丰富，而且一直都在优化，技术比其他公司厉害。

新公司也有自己的办法，它们不跟ElevenLabs正面硬刚，而是找一些细分市场。

比如Unreal Speech就专门给播客和有声书制作方提供服务，能模拟各种专业配音演员的声音，还能表现出不同的情感。

Cartesia则主打多语言、带真实口音的语音，受到很多跨国企业和教育平台的欢迎。

随着文本转语音技术越来越成熟，越来越接近真人说话的水平，在客服、无障碍服务，还有内容创作这些场景用得越来越多。

语音AI对性能要求不高，用起来更方便，预计2025年这个市场还会继续扩大。

o3智能体拔得头筹

在一项针对AI智能体的联网研究测试中，ChatGPT最新的o3模型战胜了Anthropic的Claude和谷歌的Gemini。

不过话说回来，最牛的智能体和人类专家相比，还是有不小的差距。

FutureSearch让11个主流的大模型完成了总共89项实际研究任务，并对每个模型在查找原始资料来源、搜寻数据、收集证据、汇编数据以及验证主张等能力进行了评估。

最后打分结果出来，最高分才0.51，而满分预计是0.8。

也就是说，现在最牛的AI智能体，专业研究人员花点时间，也能轻松「碾压」它们。

这次测评的成绩单如下：

o3（OpenAI）：0.51
Claude 3.7 Sonnet（Think）：0.49
Claude 3.7 Sonnet（Std）：0.48
Gemini 2.5 Pro：0.45
GPT-4.1L：0.42
DeepSeek-R1：0.31
Mistral Small：0.30
GPT-4 Turbo：0.27
Gemma 3：0.20

对比去年GPT-4 Turbo才0.27的分数，在一年时间里，优秀通才研究人员和前沿智能体之间的差距缩小了约45%。

此外，像DeepSeek这样价格便宜的智能体，与来自OpenAI的付费高端产品相比，差距并不大。

OpenAI的o3暂时领跑，Claude和Gemini紧跟其后。

目前看来，闭源模型在搞研究这块更有优势，但开源模型也在疯狂上分。

不过智能体的「短板」也很明显。

跟人类研究员相比，它们在战略规划、全面性、评估资料来源质量等方面更逊一筹，还特别容易忘事，任务做到一半就把之前查到的东西抛脑后了。

更要命的是，好多AI都有「摆烂」倾向，找到差不多能用的答案就收手，不愿意再深挖找更好的。

ChatGPT的o3能拿第一，就是因为它更较真，验证答案特别仔细，也不会轻易放过更好的解决方案。

照这趋势，说不定过不了几年AI就能反超人类研究员了。

不过最近，ChatGPT新版本还因为太过谄媚被吐槽过。AI要想稳定变强，还有很长的路要走。

现在AI智能体给出的结果，还是得自己再检查一遍，可别偷懒直接抄作业！

企业如何应对快速变化的AI市场？

AI市场变得这么快，对那些想用AI的企业来说，既是机会也是挑战。

已经在大规模用AI的企业，要建立一套靠谱的评估体系，别只盯着一家供应商。因为说不定这个月最好用的模型，下个月就不是了。

推理能力越来越重要，以前可能更看重速度和成本，现在大家更关注处理复杂任务时准不准、靠不靠谱。

现在前沿的AI公司不停地推出更厉害的模型，企业很纠结：到底是选定一个平台长期用，还是保持灵活性？

很多企业的AI负责人都选择两手抓，不同的任务用不同的模型，一旦有更好的技术出现，马上就能切换。

从报告里能看出，现在图像、视频、音频这些多媒体相关的AI能力竞争也很激烈。

以后可能得更注重发展一个全面、平衡的AI生态系统，图像、视频、音频生成和文本生成等都很重要。

对企业来说，如果想在AI浪潮里站稳脚跟，最好根据自己的实际需求去挑选AI模型，别盲目追新。

同时，企业也要搭建好技术框架，这样一旦有更好的技术出现，就能马上用起来。

那些只守着过去的AI明星产品的公司，说不定很快就会被市场淘汰。

参考资料：

https://www.forbes.com/sites/johnkoetsier/2025/05/13/chatgpt-beats-claude-googles-gemini-deepseek-in-test-of-ai-agents/?ss=ai

https://analyticsindiamag.com/ai-features/why-claude-is-losing-users/

https://poe.com/zh/blog/spring-2025-ai-model-usage-trends

DeepSeek的横空出世，让AI+腾讯云数据库产生了什么化学反应？

DeepSeek的横空出世，让AI+腾讯云数据库产生了什么化学反应？

量子位 2025-03-04 20:07:47

人形机器人组队进厂打工！5只Figure 02在宝马工厂

人形机器人组队进厂打工！5只Figure 02在宝马工厂

量子位 2024-11-22 10:57:40

老板想本地跑AI，只给10万还想体验满血DS，我该咋办？

老板想本地跑AI，只给10万还想体验满血DS，我该咋办？

量子位 2025-04-14 15:31:01

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

机器之心Pro 2025-05-16 10:21:17

AI辅助编码带来思维方式转变：从人写代码到人审代码

AI辅助编码带来思维方式转变：从人写代码到人审代码

量子位 2025-04-18 17:04:43

宇树机器人复杂环境稳定起立，速度不亚于人类

宇树机器人复杂环境稳定起立，速度不亚于人类

量子位 2025-04-09 10:10:32

和用户“互动”起来：Agent补齐最后一块协议拼图

和用户“互动”起来：Agent补齐最后一块协议拼图

虎嗅APP 2025-05-16 22:01:02

AI正大大降低动漫等虚拟内容制作门槛

AI正大大降低动漫等虚拟内容制作门槛

量子位 2025-04-25 14:16:10

大模型正在打破教育领域的“不可能三角〞

大模型正在打破教育领域的“不可能三角〞

量子位 2025-04-17 19:02:09

单图生成14秒吉卜力动画，分享制作过程

单图生成14秒吉卜力动画，分享制作过程

量子位 2025-04-08 18:23:02

研发自动化的初衷是让每一个研究员都有Agent助理

研发自动化的初衷是让每一个研究员都有Agent助理

量子位 2025-04-23 08:05:00

AI究竟是摧毁教育还是改善教育？

AI究竟是摧毁教育还是改善教育？

量子位 2025-05-14 18:25:44

突破多模态奖励瓶颈！R1-Reward用强化学习赋予模型长期推理能力

突破多模态奖励瓶颈！R1-Reward用强化学习赋予模型长期推理能力

量子位 2025-05-08 17:47:02

o3/o4-mini实测太炸裂：看照片反推定位

o3/o4-mini实测太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17

人人都能做开发者！连小学生都能轻松上手的0代码开发平台来了

人人都能做开发者！连小学生都能轻松上手的0代码开发平台来了

量子位 2025-04-15 11:59:12

传统MVP模型不成立了，AI时代要更多预测刚需场景

传统MVP模型不成立了，AI时代要更多预测刚需场景

量子位 2025-04-22 14:14:16

斩获全球SOTA，竞技场双榜登顶！这款国产语音模型凭什么？

斩获全球SOTA，竞技场双榜登顶！这款国产语音模型凭什么？

智东西 2025-05-16 13:04:49

Nature调查：有多少研究者接受AI撰写论文？又有多少人实际做过？

Nature调查：有多少研究者接受AI撰写论文？又有多少人实际做过？

医咖会 2025-05-16 19:21:54

谷歌最强Agent AlphaEvolve上新，破解百年数学难题

谷歌最强Agent AlphaEvolve上新，破解百年数学难题

量子位 2025-05-16 18:43:11

谷歌股价上涨3%

每日经济新闻 2025-05-16 21:44:06

OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

新智元 2025-05-15 10:43:57

Anthropic 或将推出两款新模型系列

Anthropic 或将推出两款新模型系列

硅星Breaknews 2025-05-16 09:57:09

关税刚和解，又在芯片上搞事！美国全球封锁华为芯片，想打科技战

关税刚和解，又在芯片上搞事！美国全球封锁华为芯片，想打科技战

主持人京京 2025-05-15 22:59:39

小鹏绝地翻盘，头号功臣是她！

华商韬略 2025-03-28 14:19:16

印度通告70国自己胜利！印尼买歼十？特朗普中东卖波音又盖大楼

印度通告70国自己胜利！印尼买歼十？特朗普中东卖波音又盖大楼

人猿星球观察 2025-05-16 11:37:46

唐湘龙陈凤馨：特朗普被中国痛打！去中东疗伤？

唐湘龙陈凤馨：特朗普被中国痛打！去中东疗伤？

人猿星球观察 2025-05-15 16:16:30

静悄悄的饿了么，战斗力到底有多强？

静悄悄的饿了么，战斗力到底有多强？

华商韬略 2025-04-30 14:18:35

两辆私人游艇相遇battle，一方保守一方豪放，这是我该看的福利？

两辆私人游艇相遇battle，一方保守一方豪放，这是我该看的福利？

房东生活看看 2025-05-15 15:59:11

Manus生图功能登场！设计到搭建网站一站式搞定，1000积分免费薅

Manus生图功能登场！设计到搭建网站一站式搞定，1000积分免费薅

机器之心Pro 2025-05-16 14:48:26

中美没休战！美全球禁止使用华为AI芯片！蔡正元：给华为颁勋章

中美没休战！美全球禁止使用华为AI芯片！蔡正元：给华为颁勋章

薰衣草的美丽 2025-05-15 02:33:19

一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致

一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致

机器之心Pro 2025-05-16 15:37:35

Google One订阅用户超1.5亿！含AI功能订阅数成增长主力

Google One订阅用户超1.5亿！含AI功能订阅数成增长主力

智东西 2025-05-16 17:30:20

苦研10年无果，千万经费打水漂！AI黑箱依然无解，谷歌撕破脸

苦研10年无果，千万经费打水漂！AI黑箱依然无解，谷歌撕破脸

新智元 2025-05-17 02:03:25

OpenAI最强写代码AI智能体来了：Codex上线

OpenAI最强写代码AI智能体来了：Codex上线

华尔街见闻官方 2025-05-17 00:56:07

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

医咖会 2025-02-02 19:05:14

全球版“星际之门”首站阿联酋？OpenAI被爆参建5GW数据中心

全球版“星际之门”首站阿联酋？OpenAI被爆参建5GW数据中心

华尔街见闻官方 2025-05-17 03:13:36

AI视觉图灵时代来了！字节OmniHuman，一张图配上音频生成视频

AI视觉图灵时代来了！字节OmniHuman，一张图配上音频生成视频

机器之心Pro 2025-02-05 17:10:00

深夜突袭！OpenAI的AI程序员上线，人类仅需点按钮

深夜突袭！OpenAI的AI程序员上线，人类仅需点按钮

智东西 2025-05-17 07:13:48

能实现良好落地的AI才是真AI：火山引擎发布Seedance 1.0 lite

能实现良好落地的AI才是真AI：火山引擎发布Seedance 1.0 lite

DeepTech深科技 2025-05-14 22:05:14

一句话让DeepSeek控制你的电脑！微软开源神器OmniParser V2

一句话让DeepSeek控制你的电脑！微软开源神器OmniParser V2

量子位 2025-02-18 20:48:36