Gemini 2.5 Pro 为何突然“真香”了?|推理是钥匙,终局是生态

Gemini 2.5 Pro 为何突然“真香”了?|推理是钥匙,终局是生态

简要总结

本期节目主要讨论了谷歌的 Gemini 2.5 Pro 口碑反转的原因,以及 AI 领域的未来发展趋势。主要观点包括:

  • Gemini 2.5 Pro 凭借其强大的推理能力、超长上下文和原生多模态特性,实现了口碑逆转。
  • 谷歌在 AI 领域的策略更偏向 To B 服务,通过全栈自研降低成本,提升 AI 能力。
  • AI 的竞争最终将演变成生态的比拼,而目前 AI 更像是生产力工具,尚未出现真正的消费级 AI 应用。

Gemini 2.5 Pro 初体验

体验者表示,自从使用了 Gemini 后,大部分工作都依赖于它。最初对 Gemini 缺乏信任,会切换不同的模型来处理不同任务,例如使用 GPT 进行总结和头脑风暴,而使用 Gemini 进行深度研究和选题。但经过一周的磨合,Gemini 在日常使用中的占比超过 90%,解决问题的成功率非常高,效率显著提高。体验者表示自己从之前嫌弃谷歌到现在成为 Gemini 的拥护者。

口碑反转:从“嫌弃谷歌嫌弃的要命”到“现在打脸”,Gemini 2.5 Pro 如何一夜“真香”?

Gemini 2.5 Pro 口碑反转的原因在于其技术突破,包括更强的推理能力、100 万 token 的超强上下文和原生多模态。这些技术优势使其在实际应用中表现出色,例如处理带图 PDF 文件并生成可视化图表,准确理解用户意图并完成任务的概率达到 85%。此外,谷歌也调整了定价策略,允许大多数人免费使用新模型,而更深度的 2.5 版本则提供比 OpenAI 更便宜的付费选项。

技术宅 vs 产品经理:谷歌的发布偏技术化、工程化,UI 难用,体验反人类?

谷歌的 Gemini 在产品设计和用户体验方面存在不足,例如 UI 难用,需要用户具备工程化的使用方式。用户需要提升对 Gemini 的提示技巧,并人工拼接使用场景。Gemini 的操作方式反人类,例如先让用户选择模型,但普通用户并不了解不同模型之间的区别和用途。然而,一旦用户理解 Gemini 的能力,就会发现其真正的价值。

真香警告:一旦理解 Gemini 的能力(推理、长文本、原生多模态),就会开启真香模式。

Gemini 的技术优势在于其强大的推理能力、超长上下文和原生多模态。这些优势使其在处理复杂任务时表现出色,例如理解几十页带图的 PDF 文件并生成可视化图表,且无需用户过多干预。Gemini 能够通过推理完成任务,误差度较低,大约 85% 的情况下能够准确理解用户意图并达到目的。

底盘而非产品:Gemini 更像是谷歌 AI 能力的“底盘”,而非独立产品,旨在提升所有产品的“内力”。

Gemini 不像一个独立的产品,而更像是谷歌 AI 能力的“底盘”,旨在提升所有产品的“内力”。谷歌将 AI 作为底层技术,所有产品未来都将基于 AI 重新整合和开发。谷歌不会让客户或用户自己去做整合,而是自己完成,用户只需继续使用其产品即可,但每个产品都将被 AI 升级或重塑。

巨人转身的加速:谷歌内部迭代速度前所未有,“六个月以前的产品已经是上一代”。

谷歌内部的迭代速度前所未有,技术人员表示六个月以前的产品已经是上一代。这种快速迭代在以前的谷歌是没有发生过的。谷歌在数据训练、强化学习和人类反馈学习等方面都取得了进展。

推理的窗户纸:DeepSeek 如何捅破了“推理”这层窗户纸,让行业方向更加明确?

DeepSeek 开源了 R1 模型,捅破了“推理”这层窗户纸,让行业方向更加明确。许多公司开始意识到应该朝着推理的方向发展。谷歌也因此做了大量调整,例如降低 Gemini 2.0 的收费,并更加重视推理能力。

推理是钥匙:AI 下半场,解决实际问题需要推理能力,Agent 等概念都基于此。

AI 的下半场需要用 AI 解决实际问题,而推理是关键。许多概念,如 Agent,都基于推理的突破。Deep Research 本质上也是一个 Agent,它通过分析大量信息源,生成研究报告,并控制幻觉的产生。

To B 的野望:谷歌 Cloud 业务年增长30%,Gemini 的“硬核”能力是否主要为 To B 服务?

谷歌的重点可能不在 To C,而在于 To B。过去四年,谷歌 Cloud 业务平均每年增长 30%,业务占比也在逐年提升。谷歌在 To B 领域的 AI 策略非常激进,通过推理预算等功能控制推理成本和用量。谷歌 Cloud 大会上发布了 Gemini 2.5 和轻量级推理模型,这些都偏向 To B 能力。

全栈自研的底气:从芯片到应用再到云服务,谷歌的全栈投入是其成本和能力优势的关键。

谷歌是唯一一家在 Google Cloud 上提供所有跨平台模态和全栈自研的公司,从芯片设计到基础模型、应用程序社区再到云服务,全部自研。这种全栈投入是其成本和能力优势的关键。

形象比喻:GPT 像“聪明的孩子”,灵光幽默;Google 像“稳重的高材生”,全科但可能不那么有趣。

GPT 像一个聪明的孩子,说话幽默,带出去灵光,适合搞春晚。而 Google 像一个没有什么短板的全科高材生,特别稳重,适合搞科学竞赛。谷歌坚持自己的路线,将 AI 能力渗透到所有 To B 产业中,并告诉大家 AI 应该怎么用。

留住核心人才:谷歌成功留住 DeepMind CEO、谷歌云 CEO 等关键人物,并吸引人才回流。

谷歌成功留住了 DeepMind CEO 和谷歌云 CEO 等关键人物,并吸引了人才回流,例如 Character.AI 的 Norm 和 Attention is All You Need 的联合创作者。这些人才的回归对谷歌的 AI 发展至关重要。

终局之战:AI 的竞争最终是否会演变成生态的比拼?

AI 的竞争最终将演变成生态的比拼。前期可能拼模型和技术,但最终生态才是关键。大厂需要克服内部官僚和固区壁垒,让原有产品真正被 AI 赋能,并让用户使用上新 AI 功能的版本的产品。

被颠覆的品类:AI 将如何重塑现有产品?例如,NotebookLM 可能让传统笔记应用消失。

AI 将重塑现有产品,例如 Google 表格原生集成了 Gemini,NotebookLM 可能会让传统笔记应用消失。Notebook LM 可以帮助用户收集数据、进行头脑风暴并得出结论,无需做笔记。

生产者工具 vs 消费级产品:目前 AI 更像是生产力工具,尚未出现真正的消费级 AI 应用。

目前 AI 更像是一个生产力工具,可以节约时间、提高效率,但尚未出现真正的消费级 AI 应用。AI 还没有到每个人手边至少有两三个 AI 付费工具,或者每天打开 AI 工具几次的程度。

Share

Summarize Anything ! Download Summ App

Download on the Apple Store
Get it on Google Play
© 2024 Summ