张小珺:和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

03:54 模型在分化
通用各项能力的模型 - Gemini/OpenAI
All in Coding+Agentic 能力 - Anthropic
多模态原生 - Thinking Machines Lab
Grok 今天还在摸索自己生态位置
Meta 原创 0-1 的基因还是很弱
最领先的这几家很像 F1 竞赛
我的模型日常使用量:
Grok能比较方便地拿到X上的帖子信息,有一些基于X来源的话题可以展开聊。
Gemini虽然免费,但是基本不用,没有特别强的驱动力去使用它。
OpenAI 有新鲜出笼的模型就用一用,基本也不多用。
21:37 横向全家桶,纵向垂直整合
C端是一个非常明显的头部收敛趋势,ChatGPT可能在C端会收敛掉很多产品
作为投资人或 AI 创业者,一面兴奋是技术每个月都在进步,另一面有点绝望
横向全家桶的例子是ChatGPT,已经包含了Chat+搜索+Coding+Agent+WorkSpace
纵向垂直整合的例子是 Gemini,从 TPU 芯片,到 Gemini 模型,到上面 Agent 应用,再到 Google 文档/Chrome浏览器/安卓操作系统/YouTube视频,可以做超级集成
33:35 智能和产品都重要
过去 3 年一直是对智能上限的探索极度上头,但在过去两个月开始重视产品了
ChatGPT 身上有很多非技术性壁垒,而 Coding 或模型公司只是技术壁垒
OpenAI 是平衡最好的一家,一边探索智能上限,一边又把智能红利转化成产品流量和品牌心智
38:52 做 AI 产品很像挖矿,保鲜窗口很关键
挖矿:第一个做出来让用户惊叹的体验很重要,哪怕 token 消耗很大,只要你是第一个做出来让用户惊叹的 Magic moments,就等于你起码得到了 5 亿美金的营销费用,比如 Perplexity/Cursor/Manus
但这个窗口期又特别有意思,窗口是逐渐在缩短的:从 2 年、1 年、3 个月
产品公司能赢过模型公司做的产品吗?
44:21 L4 级别的体验
最优秀的俩 Agent 都有了 L4 体验:ChatGPT 的 Deep Research + Anthropic 的 Claude Code,分别对应信息搜索+软件开发
今天最大红利还是 language/code 红利,尤其是 code,还不是多模态/世界模型/机器人
Claude Code 最近大杀四方,Claude Code 是一个 L4 的体验
接下来还有哪些领域能有 L4 级别体验?
52:43 对Google看法的转变
一个猜想是,ChatGPT 后面肯定会做广告平台,因为最近招了新的商业化 CEO
但我在想 Google 还是全球最好的广告平台,最后大家产品形态上都会殊途同归,融合到一起的,就是全家桶逻辑,Search 也会演变
55:53 其他话题
AGI有泡沫吗?假如AGI有泡沫,什么事情会是导火索,戳破泡沫?
人类和大猩猩的智能水平差异在哪?
最近湾区有没有什么新的讨论比较高的话题?
“犹太人的金融,华人的AGI”