张小珺:和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

03:54 模型在分化

通用各项能力的模型 - Gemini/OpenAI

All in Coding+Agentic 能力 - Anthropic

多模态原生 - Thinking Machines Lab

Grok 今天还在摸索自己生态位置

Meta 原创 0-1 的基因还是很弱

最领先的这几家很像 F1 竞赛

我的模型日常使用量:

Grok能比较方便地拿到X上的帖子信息,有一些基于X来源的话题可以展开聊。

Gemini虽然免费,但是基本不用,没有特别强的驱动力去使用它。

OpenAI 有新鲜出笼的模型就用一用,基本也不多用。

21:37 横向全家桶,纵向垂直整合

C端是一个非常明显的头部收敛趋势,ChatGPT可能在C端会收敛掉很多产品

作为投资人或 AI 创业者,一面兴奋是技术每个月都在进步,另一面有点绝望

横向全家桶的例子是ChatGPT,已经包含了Chat+搜索+Coding+Agent+WorkSpace

纵向垂直整合的例子是 Gemini,从 TPU 芯片,到 Gemini 模型,到上面 Agent 应用,再到 Google 文档/Chrome浏览器/安卓操作系统/YouTube视频,可以做超级集成

33:35 智能和产品都重要

过去 3 年一直是对智能上限的探索极度上头,但在过去两个月开始重视产品了

ChatGPT 身上有很多非技术性壁垒,而 Coding 或模型公司只是技术壁垒

OpenAI 是平衡最好的一家,一边探索智能上限,一边又把智能红利转化成产品流量和品牌心智

38:52 做 AI 产品很像挖矿,保鲜窗口很关键

挖矿:第一个做出来让用户惊叹的体验很重要,哪怕 token 消耗很大,只要你是第一个做出来让用户惊叹的 Magic moments,就等于你起码得到了 5 亿美金的营销费用,比如 Perplexity/Cursor/Manus

但这个窗口期又特别有意思,窗口是逐渐在缩短的:从 2 年、1 年、3 个月

产品公司能赢过模型公司做的产品吗?

44:21 L4 级别的体验

最优秀的俩 Agent 都有了 L4 体验:ChatGPT 的 Deep Research + Anthropic 的 Claude Code,分别对应信息搜索+软件开发

今天最大红利还是 language/code 红利,尤其是 code,还不是多模态/世界模型/机器人

Claude Code 最近大杀四方,Claude Code 是一个 L4 的体验

接下来还有哪些领域能有 L4 级别体验?

52:43 对Google看法的转变

一个猜想是,ChatGPT 后面肯定会做广告平台,因为最近招了新的商业化 CEO

但我在想 Google 还是全球最好的广告平台,最后大家产品形态上都会殊途同归,融合到一起的,就是全家桶逻辑,Search 也会演变

55:53 其他话题

AGI有泡沫吗?假如AGI有泡沫,什么事情会是导火索,戳破泡沫?

人类和大猩猩的智能水平差异在哪?

最近湾区有没有什么新的讨论比较高的话题?

“犹太人的金融,华人的AGI”