Connect with us

GPLP

前a16z合伙人:ChatGPT未必有网络效应,模型越“商品化”护城河越薄,决定胜负的不是参数,而是分发和渠道

行业事件

前a16z合伙人:ChatGPT未必有网络效应,模型越“商品化”护城河越薄,决定胜负的不是参数,而是分发和渠道

来源:Z Finance

作者:ZF编辑部

Benedict Evans 是一位长期研究科技产业周期的独立分析师与作者,擅长把“新东西”拆成可复用的历史结构。在这次播客中,他开门见山只问一个大问题:AI 是一次平台转移,像 PC、Web、智能手机那样重排入口和分发,还是更像电力、计算那样的基础设施级改造?

为了把这个差别讲清楚,他讲电梯的故事。曼哈顿老楼里曾经有一种有人值守的电梯,没有按钮,只有操纵杆和刹车,门卫像开有轨电车一样把你送到楼层。后来 Otis 推出自动电梯,人走进去按一下按钮,门不会夹人,还得靠营销去强调它的安全和礼貌。今天我们走进电梯不会感叹自动化,也不会说自己在使用电子电梯,它就是电梯。

真正改变世界的技术,最后都会从舞台中心退场,变成背景。你不再讨论它,你只是依赖它。

可现在的 AI 还远没到背景化的阶段,甚至连故事都讲得不统一。一边有人在发布会上谈博士水平的研究员,仿佛智能体已经在门口敲门。另一边又在强调开发平台、工具链和生态,像是在说这不过是更强的软件生产力。

Evans 觉得这是一种天然矛盾。如果你真的拥有接近人的智能体,那软件形态会被改写到面目全非。如果你只是得到了更好用的工具,那世界仍然需要大量软件公司、产品经理和工作流设计。两套叙事可以轮流出现,但很难在同一时间都成立。每当市场试图同时相信两件相互打架的事,泡沫就会变得特别容易发生。

这也就引出他真正关心的一点:应用层为什么会存在?

过去十几年,企业世界把 Excel、邮件、数据库这些通用能力拆成了四五百个 SaaS,每一个都在某个具体行业、具体岗位上,把工作流按得更顺手。Evans 认为 AI 时代可能会重复同一条路,只是对象换成了 ChatGPT。所谓机会,不是再造一个万能聊天框,而是把万能能力拆成可验证、可交付、可嵌入的流程,让用户不需要绞尽脑汁思考该怎么问,而是像按电梯按钮一样自然地按下去。

对大多数用户来说,目前模型之间的差别并不明显,网络效应也未必已经出现,能依赖的往往是品牌、默认设置和习惯。真正的拐点,可能不是下一次基准测试,而是某个产品形态突然出现,让更多人第一次感到无需学习就能用得上。到那一刻,AI 才会从热词退到背景,像电梯一样安静地改变世界。

以下是全文翻译。

8亿周活背后的“虚假繁荣”

Benedict Evans:AI正在重塑科技版图,但一个巨大的疑问依然存在:这仅仅是另一次平台转移,还是某种在规模和影响力上更接近电力或计算本身变革的事物?有些行业可能会被彻底改造,而另一些行业可能几乎感觉不到变化。科技巨头们正在竞相重新调整战略,然而大多数人仍然难以找到一个日常的使用场景。这种张力告诉了我们要关注的重要事情。

ChatGPT目前拥有8亿到9亿的周活跃用户。如果你是那种每天都在使用它数小时的人,请问问自己:为什么有五倍于此的人看过它、理解它、知道它是什么、甚至注册了账号并知道如何使用,却想不出这周或下周能拿它做什么?“AI”这个词有点像“科技”这个词。当某种东西已经存在了一段时间后,它就不再被称为AI了。机器学习现在还算AI吗?我不知道。

在实际的通用语境中,AI似乎意味着“新东西”。而AGI似乎意味着“新的、可怕的东西”。AGI给人的感觉有点像这样:要么它已经到了,只是表现为小型的软件;要么它还有5年才到,而且永远都还有5年。我们不知道这项技术的物理极限在哪里,所以我们要么不知道它能变得多好。你会听到Sam Altman说我们现在已经拥有了博士水平的研究员,而Demis Hassabis则会说:“不,我们没有,闭嘴。”这种非常新、非常巨大、非常令人兴奋且能改变世界的事物,往往会导致泡沫。所以,是的,如果我们现在不在泡沫中,我们也即将进入泡沫。

Erik Torenberg:Benedict,欢迎回到a16z播客。

Benedict Evans:很高兴回来。

Erik Torenberg:我们要讨论的是你最新的演示文稿《AI吞噬世界》(AI Eats the World)。对于那些还没看过的人,或许我们可以分享一下高层次的核心论点,并结合最近的AI发布会来进行背景化的解读。我很好奇你的想法是如何演变的。

Benedict Evans:是的,这很有趣。我在演示文稿的一张幻灯片里引用了我与一家大公司CMO的对话,他说:“我们现在已经看过很多AI演示了。比如,我们看了Google的,看了Microsoft的。我们看了Bain的,也看了BCG的。我们还看了埃森哲的以及我们广告代理商的演示。”

这份文稿大约有90多页。我试图通过它探讨一系列不同的问题。其中之一,我想只是在说:好吧,如果这是一次平台转移,或者比平台转移更宏大的东西,那么平台转移通常是如何运作的?我们在其中通常会看到哪些事情?而在当下,我们又能看到多少这种模式的重演?当然,其中涌现出的模式之一就是泡沫,但其他的模式还包括科技行业内部发生了大量变化。

会有赢家和输家,曾经的主导者最终变得无关紧要,然后会有新的十亿、万亿美元级别的公司诞生。但除此之外,这对科技行业之外意味着什么?因为如果我们回顾过去几波平台转移,有些行业被彻底改变了,有些行业被创造出来又被毁灭了。而对另一些行业来说,这只是一种有用的工具。比如,如果你身处报业,互联网的影响与你身处水泥行业是截然不同的——水泥行业会觉得互联网挺有用,但并没有真正改变这个行业的本质。

所以我试图做的是给人们一种感觉:科技界正在发生什么?我们正在投入多少资金?我们试图做什么?还有哪些未解之谜?科技行业内部可能会发生什么,也可能不会发生什么?但在科技之外,这通常会如何演变?目前似乎正在发生什么?这如何体现为工具、部署、新的用例和新的行为模式?

然后,当我们从所有这一切中后退一步思考,这种事情我们以前经历过多少次了?很有趣。今年夏天我参加了一个播客,开场白我说:“嗯,你知道,我是个中间派。我认为这和互联网或智能手机一样重要,但仅仅是和互联网或智能手机一样重要。”结果视频下面有大概200条YouTube评论说:“你知道吗,这个白痴,他根本不懂这有多大。”而我想的是,嗯,互联网其实已经是一件非常了不起的大事了。

你知道,我在文稿的结尾讲了电梯的例子。因为我住在曼哈顿的一栋公寓楼里,我们有一部有人值守的电梯,这意味着它没有按钮,只有一个加速杆和一个刹车,门卫进来把你载到你的楼层。这就像一辆有轨电车。而在50年代,Otis部署了自动电梯。你走进去,按一个按钮。他们当时的营销口号是:“啊,它有电子礼貌。”这指的是防止夹人的红外线光束。

而在今天,当你走进电梯时,你不会说:“啊,我在用一部电子电梯。它是自动的。”它就只是个电梯。这就如同数据库、Web和智能手机所经历的过程一样。这就是为什么我现在觉得这很有趣,我在LinkedIn和Threads上做过几个关于此的投票……关于机器学习是否仍然算AI?“AI”是不是只是个术语?AI这个词有点像“科技”或“自动化”这两个词。它只在东西是新的时候才适用。一旦某个东西存在了一段时间,它就不再是AI了。所以数据库肯定不是AI。机器学习还是AI吗?

我的意思是,显然有一个学术定义,人们会根据那个定义说:“这家伙是个白痴。”不,我当然可以用学术定义解释什么是AI,但在实际的大众语境中,AI似乎就是指“新东西”。是的。而AGI似乎就是“新的、可怕的东西”。是的。这很有趣。我在想这个。AGI 的落地现状有点像‘近在眼前却远在天边’—— 有人宣称它已具备顶尖专业能力,有人则认为其还处于早期阶段;有人说它 5 年后就能成熟,可多年过去依然停留在‘5 年后’的预判中。你知道,就所有实际目的而言,什么也没发生。

AGI似乎有点像这样。要么它已经在这里了,所以你有Sam Altman说“我们现在就有博士水平的研究员”,而Demis说“什么?不我们没有,闭嘴。”所以要么它已经在这里了,而且只是更多的软件;要么它还有5年,而且永远都是还有5年。这很有趣。

AI是互联网级别的变革,还是移动互联网式的延续?

Erik Torenberg:让我们对比一下以前的平台转移,因为有些人看着互联网会说,嘿,那里诞生了净值万亿美元的新公司,比如Facebook和Google,以及各种各样的新兴赢家。而当他们看移动互联网时会说,嘿,你知道虽然有Uber、Snap、Instagram和Whats App这样的大公司,但这些是十亿美元级或者数百亿美元级的成果,真正的大赢家其实还是Facebook和Google。

所以从某种意义上说,移动互联网或许是维持性的。你可以反驳我对“维持性”与“颠覆性”的定义,但在某种意义上它是维持性的,因为更多的价值流向了现有的巨头或在转变之前就存在的公司。

我很好奇你是如何在此背景下看待AI的。它是赋能型的吗?更多的收益是来自像OpenAI和Anthropic这样紧随其后的新公司,还是更多的收益将被Microsoft、Google、Facebook(Meta)以及那些原本就存在的公司捕获?

(ZF注:维持性创新vs颠覆性创新。源自克莱顿·克里斯坦森《创新者的窘境》。维持性创新指改进现有产品性能以满足主流客户需求,通常有利于大公司巩固地位;颠覆性创新指开辟新市场或以低端切入最终取代现有产品,通常由创业公司主导。)

Benedict Evans:我认为对此有几个答案。其中之一是你必须小心对待这种框架和结构,因为你最终会为了框架和定义争论不休,而不是讨论将会发生什么。你知道它们都有用,但它们都有漏洞。你知道移动互联网所做的是它转移了我们……你知道它从根本上改变了一堆事情。例如,它让我们从Web转向了App,并且它让世界上每个人都有了一部手机。它让世界上每个人都有了一台口袋电脑。所以即使在今天,地球上的消费级PC依然少于10亿台,而智能手机则在50到60亿台之间。而且它使一些以前不可能的事情成为可能,无论是TikTok,还是我认为像在线约会这样的事情。你可以将这些映射为美元价值,你也可以将这些映射为消费者行为和信息获取方式的结构性变化。我认为你完全可以争辩说,如果没有移动互联网,Meta会是一家规模小得多的公司。所以,你知道,关于这些东西的优劣势你可以争论很久。

当然,并非所有的平台转移都是一样的。你知道,你可以做那种标准的这种目的论叙事,说:好吧,先有大型机,然后是PC,然后是Web,然后是智能手机。但你可能想在某个地方把SaaS放进去,你也想把开源放进去,也许你还想把数据库放进去。所以,这些是有用的框架,但它们不具备预测性。它们不会告诉你将会发生什么。它们只是给你一种理解此时此地我们所面临模式的方式。

当然,围绕生成式AI的大辩论是:这仅仅是另一次平台转移,还是比那更多的东西?问题是我们不知道,除了等待观察之外,我们没有任何办法知道。所以这可能像PC、Web、SaaS或开源一样大,或者它可能像“计算”本身一样大。然后你就会看到那些住在伯克利群居房里的非常过度兴奋的人,他们认为这像“火”的发明一样大。好吧,这很好。但这能创造新公司吗?

我的意思是,回到移动互联网时代,你知道,曾经有一段时间人们认为博客会与Web不同,现在看来这很奇怪。就像Google需要一个单独的“博客搜索”一样。这真的很严肃,这在当时确实是个事儿。曾经有一段时间情况真的不明朗,我认为你可以把这一点普遍化。回到90年代中期的互联网,你知道,我们某种程度上知道这将是一件大事。但我们真的不知道它会变成Web。在此之前,我们不知道它会是互联网(Internet)。我们知道会有网络(Networks)。我们不知道它会是互联网。然后不清楚它会是Web。然后也不清楚Web到底怎么运作。

你知道,当Netscape发布时,马克·扎克伯格还在上初中或小学什么的,Larry和Sergey还是学生,Amazon还是一家书店。所以你可以“知道”它,但又“不知道”它。关于智能手机你也可以提出同样的观点。我们知道每个人口袋里都会有一个连接互联网的东西,但不清楚它基本上会是一台来自80年代的过气PC公司(指苹果)和一家搜索引擎公司(指谷歌)做出来的PC。当时并不清楚这东西不会属于诺基亚或微软。看,我认为在对此做出确定性预测时必须超级小心。你能做的是说:好吧,当这种东西出现时,一切都会改变。但这以前已经发生过五次或十次了。

Erik Torenberg:我很好奇你是如何对这个想法产生确信的,或者你是如何得出这个预测的,即“嘿,AI将会像互联网一样大”——这当然很大——但我还没有确信它会比互联网更大。我很好奇是什么激发了这种陈述。然后,什么可能会改变你的想法?你知道,它可能没有互联网那么大,因为互联网显然非常巨大;但也可能,嘿,也许它会更大。

Benedict Evans:我做了一张S曲线略微上升的图表。有人说,这张图的坐标轴是什么?你知道我不想陷入那种争论,比如它是比互联网大5%还是大20%?我认为问题更像是:这是另一个行业周期,还是技术本质发生了更根本的变化?它是更像计算或电力那样的结构性变革,而不只是“我们可以用电脑做更多事情了”?我认为这才是问题所在。

我认为在科技界内部关于这一点的辩论中存在一种有趣的脱节。因为你知道,我看了几周前OpenAI的直播之一,他们花了前20分钟谈论他们明年将如何拥有人类水平、博士水平的AI研究员。然后直播的后半部分是,“哦,这是我们的API技术栈,它将赋能成百上千的新软件开发者,就像Windows一样”,事实上他们甚至引用了比尔·盖茨。你会觉得这两件事不可能同时为真。要么我得到的是一个博士水平的AI研究员——这意味着它像一个博士水平的注册会计师;要么我得到的是一个帮我报税的新软件。到底是哪个?

要么这东西将达到人类水平——这是一个非常非常具有挑战性、问题重重且复杂的陈述;要么这将让我们制造出更多以前做不到的软件。我认为围绕这个话题的对话中存在一种真正的精神分裂,因为一方面是 Scaling Laws ,它会一直扩展下去;与此同时我听到的是“看它写代码多棒”。再说一次,就像,那它是在写代码,还是我们不再需要软件了?因为理论上,如果模型继续扩展,就没人会写代码了。你只会对模型说:“嘿,你能帮我做这件事吗?”

(ZF注:ScalingLaws 指AI模型的性能与计算量、数据量和参数量呈幂律关系的定律。简单来说,投入越多算力和数据,模型越智能。)

Erik Torenberg:是的。这是一种对冲,还是某种顺序问题?

Benedict Evans:部分是顺序问题,但是你知道,原则上,如果你认为这东西会继续扩展,那你为什么要投资一家软件公司?就像我们将会拥有这种像“盒子里的上帝”一样无所不能的东西。

我认为这是一种有趣的挑战,而且我认为这是这次与以前的平台转移有着根本不同的地方。在互联网或移动互联网时代,或者大型机时代……你确实不知道未来几年会发生什么。你不知道亚马逊会变成什么样,你不知道Netscape结局如何,你不知道明年的iPhone会是什么样。但在10年前我们在乎这些的时候……你某种程度上知道物理极限。比如你知道在1995年,电信公司不可能明年就给每个人提供千兆光纤。你知道iPhone不会有这种——比如一整年的电池续航,或者能展开,或者有投影仪,或者能飞之类的。

但我们不知道这项技术的物理极限,因为我们并没有很好的理论来解释它为什么如此有效。甚至,我们也并没有很好的理论来理解什么是人类智能,所以我们不知道它能变得多好。你可以做一个图表,你可以说,好吧,这是调制解调器的路线图,这是DSL的路线图,这是DSL将会达到的速度,然后你可以猜测电信公司部署DSL的速度,然后你可以说,很明显,我们不可能在1998年用流媒体取代广播电视。但我们没有一种等效的方法来为这些东西(AI)建模,以知道它在3年后的基本能力会是什么样子。这就把你带到了那种稍微基于vibes-based的预测,没人真正知道。

所以,你知道,Jeff Hinton说,“嗯,我觉得……”而Demis Hassabis说,“嗯,我觉得……”,但没以此为准,没人真正知道。

Erik Torenberg:然后Andrej Karpathy去Dwarkesh的播客上说:“我觉得,你知道,这还需要十年。”

Benedict Evans:是啊,我知道。我看到那个关于Ilya Sutskever(前OpenAI首席科学家)的Meme,他说:“答案自会揭晓。”然后有人做了一张图——我本来想说是PS的,但他那张当然不是PS的——把他变成了一个穿着橙色衣服的佛教僧侣,就像那种橙色的僧袍。配文是:“未来自会揭晓。”但这就是问题所在。我们不知道。我们没有一种模型来推演这个。

如果算力需求不像带宽那样增长?

Erik Torenberg:是的。那么让我们把这个话题联系到这些公司正在进行的前期投资上。因为我们不知道,所以是否存在过度投资的风险,从而导致某种潜在的泡沫机制?你如何看待这个问题?

Benedict Evans:从决定论的角度来看,非常新、非常巨大、非常令人兴奋且能改变世界的事物,往往会导致泡沫。是的。我不认为有人会否认你现在能看到一些泡沫行为。你知道,你可以争论这是哪种类型的泡沫,但这同样没有太大的预测能力。

你知道,泡沫的特征之一是,当一切顺利时,所有东西都一起上涨,每个人看起来都像个天才,每个人都在加杠杆和交叉杠杆,搞循环收入,这在泡沫破裂前都很棒。然后,当它回落时,你会得到一种棘轮效应。

所以,是的,如果我们现在不在泡沫中,我们也迟早会是。我记得Marc Andreessen说过,1997年不是泡沫,98年也不是泡沫,99年才是泡沫。那么我们现在是在97年、98年还是99年?如果我们要能预测这一点,那我们就生活在平行宇宙里了。

我想,对此也许有两个更具体、更有形的答案。第一个是我们真的不知道这些东西的计算需求将会是多少。预测这一点,感觉很像是在试图预测90年代后期的带宽使用量。想象一下,如果你试图在那时对此进行代数推算。你会说:“好吧,有这么多用户,一个网页消耗多少带宽?这会如何变化?随着带宽变快,这会如何变化?视频会发生什么?什么样的视频?什么带宽?视频的比特率是多少?人们看视频看多久?看多少视频?”

然后你大概可以建立一个电子表格,它会告诉你10年后的全球带宽消耗是多少。然后你可以试着用这个反推这将卖出多少台路由器。你可以得到一个数字,但这不会是正确的数字。你知道,可能的结果范围会有百倍的差异。你现在也可以关于“消耗的代数”提出同样的观点。

所以你知道,现在我们有一群理性的行动者在说:好吧,这东西是变革性的,是一个巨大的威胁。我们现在无法满足需求。据我们所知,需求将继续上升。我们从所有的超大规模云计算厂商那里听到了各种各样的引言,基本上都在说:不投资的下行风险比过度投资的下行风险更大。嗯,那种话通常在失效之前都很管用。

是的。我看到Mark Zuckerberg说了一句略显奇怪的话,他说:“好吧,如果事实证明我们投资过度了,我们可以把这些产能转卖出去。”我当时的反应是,让我打断你一下,Mark。因为如果事实证明你用不上这些产能,那其他人也都会有大量的闲置产能。是的。所有这些现在急需更多产能的人——如果事实证明我们可以用百分之一的算力得到相同的结果——那么这对其他人来说也是真的,不仅仅是对你。所以,是的,在这种投资周期中,往往会出现过度投资,但在那之后,关于会发生什么,你能做的预测非常有限。

我认为看待这个问题更有用的一种方式是思考:好吧,你拥有这些变革性的能力,如果你是Google、Meta或Amazon,这些能力已经在增加你现有产品的价值,而且你将能够利用它们来构建更多东西。你为什么要让别人来做这件事,而不是只要你有能力继续资助并销售你正在构建的东西,就自己来做呢?是的。而且很可能结果是,我们在明年会有模型的演进,意味着你可以用今天1%的算力得到相同的结果。请记住,推理成本已经在以每年20倍、30倍、40倍的速度下降。

是的。但随后使用量会上升。所以正如我所说,这非常像是在试图预测90年代末、2000年代初的带宽消耗。你可以抛出所有的参数,但这得不出有用的结论。你某种程度上只需要后退一步说:“是的,但这互联网玩意儿到底好不好用?”

应用层的机会是解绑SaaS与重构工作流

Erik Torenberg:我很好奇瓶颈是在供给侧还是需求侧?你知道,是更多的技术限制,还是仅仅是“AI到底好不好用”?是否有足够的使用场景来证明这种支出的合理性?你看到了什么,又在预测什么?

Benedict Evans:关于这个问题也许有两个答案。第一个是,我认为我们面临着问题焦点的分化。现在有关于芯片的非常非常细节的对话,然后是关于数据中心以及数据中心融资的非常非常细节的对话。然后再是关于“一家建立在AI之上的新企业级SaaS公司是什么样的”?

它的利润率会是多少?它需要筹集多少资金?所以这里有风险投资层面的对话。在这些对话中,比如,我不懂芯片,我会拼写“紫外线”,但我不知道什么是“极紫外工艺”——这听起来像是有更多的紫罗兰,我不懂。

所以你面临这种局面,就像Milton Friedman的那句名言“没人知道如何制造一支铅笔”。你知道,话题已经转向了部署。

我认为第二个答案可能是,我认为有两种AI部署,或者说生成式AI的部署。其中一种是,有些地方现在非常容易且显而易见地能看到你可以用它做什么,这基本上就是软件开发、市场营销,以及针对许多非常无聊、非常具体的企业用例的点状解决方案。基本上也是像我们这样的人,我们的工作非常开放、自由、灵活,涉及许多不同的事情,且总是在寻找优化工作的方法。

所以你在硅谷会遇到这样的人,他们说:“你知道,我把所有时间都花在dbt上。我不再用Google了。我已经用这个替换了我的CRM。”嗯,然后显然还有写作的人。如果你在写代码,这东西真的很好用。如果你在做市场营销,你知道,所有那些关于大公司的故事,他们以前制作30个素材,现在制作300个。

然后是Accenture、Bain、McKinsey和Infosys等等,他们坐在大公司内部解决非常具体的问题。除此之外,还有一大群其他人看着它说:“还行吧。”你去看看使用数据,你会看到,好吧,ChatGPT有8亿或9亿周活跃用户。5%的人在付费。

然后你去看看所有的调查数据,你知道数据非常碎片化且不一致,但它们大概都指向:发达国家约10%或15%的人每天都在使用它。另外20%或30%的人每周使用它。

如果你是那种每天使用它数小时的人:问问你自己,为什么有五倍于此的人看过它、理解它、知道它是什么、有账号、知道怎么用,却想不出这周或下周能拿它做什么?这是为什么?是的。是因为现在还太早吗?顺便说一句,这也不仅仅是年轻人的事情。所以,仅仅是因为早期吗?是因为错误率吗?是因为你需要把它映射到你每天做的事情上吗?

我以前总是用一个类比,虽然不在当前的演示文稿里,但我以前用过:想象一下你是一个会计师,你第一次看到电子表格软件。这东西几乎可以在10分钟内完成你一个月的工作。你想改变……你想用不同的折现率重新计算那个DCF,那个10年期的DCF。在你问完之前我就已经做好了。而在以前,重新计算所有这些数字可能需要一天、两天或三天的工作。这太棒了。

现在,想象一下你是一名律师,你看到了AI。你会想:“嗯,这很棒。我的会计师应该看看这个。也许下周我在制作计费工时表时会用到它,但这并不是我整天做的事。”Excel并不能做律师每天做的那些事。我认为还有另一类人,他们会觉得:“我不确定该拿这个做什么。”

其中一部分是习惯。一部分是意识到:“不,与其那样做,我可以这样做。”但这也是产品的本质。

就像每位在2014年到2019年期间——我当时在那里——来到a16z的创业者,我相信现在也是一样,你可以看着任何一家走进来的公司说:“那基本上就是一个数据库。那基本上就是一个CRM。那基本上就是Oracle或GoogleDocs。”区别在于,他们意识到在这个行业内部有一个问题或工作流,并想出了如何使用数据库、CRM或基本上5年、10年、20年前的概念来解决该行业人群的问题,并进去把产品卖给他们,弄清楚如何让他们使用它。这就是为什么你看这方面的数据,取决于你怎么统计,典型的美国大公司今天拥有400到500个SaaS应用程序。400到500个SaaS应用,它们基本上都在做一些你可以在Oracle、Excel或电子邮件中做的事情。

是的。这就是另一面。恐怕我在长篇大论了,但这正是“你拿这些东西做什么”的另一面。你是直接去问机器人帮你做件事吗?还是说一个企业销售人员来找你的老板,卖给你一个东西,意味着现在你按下一个按钮,它就会分析你需要的这个流程——而你甚至从未意识到你在做这个流程?是的。我觉得这就是……我的意思是,这就是为什么会有AI软件公司,对吧?真的吗?那不就是他们在做的事吗?他们在“解绑”ChatGPT,就像10年前的企业软件公司在解绑Oracle、Google或Excel一样。

(ZF注:Unbundling/解绑。科技界著名理论,指将一个大而全的平台(如Craigslist或Excel)拆解为多个针对垂直领域的独立产品。Benedict认为现在的AI创业公司本质上是将ChatGPT的通用能力拆解为特定场景的垂直应用。)

Erik Torenberg:你是否持有这样的观点:Excel为会计师所做的事,AI现在正在为程序员和开发者做,但还没完全搞清楚其他职位那种“日常关键工作流”是什么?所以对于非开发者的人来说,目前还不清楚“通过什么我应该每天使用这个好几个小时”?

Benedict Evans:我认为很多人并没有非常适合用这个来完成的任务。还有很多人需要它被包裹在一个产品、一个工作流、工具和UX中,并且有人来对他说:“嘿,你意识到你可以用这个来做这件事吗?”

今年夏天我和Balaji Srinivasan——另一位前a16z合伙人——有过一次对话,他提出了关于“验证”(Validation)的观点。因为这些东西仍然会出错,硅谷的人经常对此挥挥手不以为然,但你知道,有些问题有特定的答案,它必须是正确答案,或者是有限的一组正确答案之一。你能机械地验证它吗?如果不能,让人来验证它是否高效?

所以,你知道,在市场营销的用例中,让机器生成200张图片,然后让人看一遍并挑出10张好的,这比让人画10张好图要高效得多。或者100张……即使你要生成500张图片并挑出100张好的,这也比让人画100张图片效率高得多。

但在另一方面,如果你在做类似数据录入的事情——我写过关于这个的文章,关于OpenAI Deep Research或者叫Launch Deep Research。OpenAI的Deep Research,他们整个营销案例是它跑去收集关于移动市场的数据。我以前是做移动市场分析师的。那些数字全是错的。

他们用来展示“看这多有用”的案例,数字是错的。在某些情况下,它们是错的,因为它们直接从来源抄错了数字。在其他情况下,它们是错的,因为它们使用了不该使用的来源。但是,如果我让一个实习生帮我做,实习生可能也会选那个来源。

回到我关于“验证”的观点:如果你要做数据录入,如果我要让机器从200个PDF中复制200个数字,然后我还得自己检查所有这200个数字,那我不如自己做。是的。所以你面对的是一个旋转的矩阵:你如何将这映射到现有的问题上?

但另一面是,你如何将其映射到你以前做不到的新事物上?这回到了我关于平台转移的观点,因为你知道……我看到人们看着ChatGPT或看着生成式AI说:“嗯,这没用,因为它会犯错。”我认为这有点像在70年代末看着AppleII说:“你能用这些来管理银行吗?”

答案是“不能”。但这有点问错问题了。你能在Netscape浏览器里进行专业视频剪辑吗?不能。但这也是问错问题了。虽然后来,是的,20年后你可以了。但与此同时,它做了很多其他事情。移动设备也是如此。你能用手机取代你的五屏专业编程设备吗?不能。因此它不能取代PC。好吧,猜猜怎么着?

50亿人拥有智能手机,而只有7亿或8亿人拥有消费级PC。所以它某种程度上确实取代了,但它做的是不同的事情。这一点的核心是,新事物——这就是你之前提到的“颠覆”框架——新事物通常在对旧事物重要的事情上表现得不太好或者是很糟糕。但它能做别的事情。所以很多问题在于,好吧,它可能不擅长做某些事,有一类旧任务生成式AI擅长,也有更多旧任务生成式AI可能不太擅长。但还有一大堆你以前从未做过的事情,生成式AI确实非常非常擅长。

然后你如何找到这些事或想到这些事?有多少是用户面对一个通用聊天机器人时自己想出来的?有多少是企业家说:“嘿,我刚刚意识到有一件事是你以前做不到的,现在你看,我给了你一个产品,上面有一个按钮可以帮你做这件事。”对吧?这就是为什么会有软件公司存在,对吧?

Erik Torenberg:在移动互联网时代,你知道,我们看到了一些新的用例,比如坐陌生人的车(Lyft和Uber),或者通过App认识约会对象,或者把闲置卧室租出去等等。这些是围绕那些行为建立的净新公司。

我认为对于AI,仍然存在这样的问题:那些净新的行为是什么?我们开始看到一些了,比如人们与聊天机器人互动和交谈,代替或补充与真人的交流。然后有一个问题是:嘿,这些行为是由现有的模型提供商完成的,还是由企业端和消费端的净新公司完成的?

Benedict Evans:这永远是一个问题:新事物在技术栈向上延伸多远?

你知道,我和另一位前a16z的同事讨论过这个问题,他指出,在90年代中期,人们某种程度上认为操作系统做了一切,Windows应用程序基本上只是薄薄的Win32封装。

是的。你知道,Office基本上只是一个薄薄的Win32封装……因为所有重要的事情都是由OS完成的,无论是文档管理、打印、存储还是显示。这些在DOS时代必须由App自己做的事情——App必须自己处理打印,App必须自己管理显示——到了Windows时代,App以前做的90%的事情现在都由Windows完成了。所以Office就像是一个薄薄的Win32封装,所有困难的事情都由OS完成。

结果证明,虽然那是对的——框架确实有用——但这并不是思考正在发生的事情的有用方式。现在也是一样,这在多大程度上需要对那个市场运作方式、那个市场是什么、以及你会用它做什么有单一的、专门的理解?

我的意思是,我记得我们在a16z时投资了一家名为Everlaw的公司,那是云端的法律发现软件。是的。然后机器学习出现了,现在它们可以做翻译了。他们会担心律师们说“好吧,我们不再需要你们了,我们只要去AWS买个翻译App和情感分析App就行了”吗?不,那不是律师事务所的工作方式。律师事务所想买的是能销售的东西……想买的是法律发现软件管理系统。他们不想通过调用API来自己写软件。我的意思是,非常非常大的律所可能会,但典型的律所不会那样做。人们买的是解决方案,他们买的不是技术。

这里也是一样。这些模型在技术栈中向上延伸多远?你可以把多少东西变成一个小部件?你可以把多少东西变成一个LLM请求?而在多大程度上,结果证明你需要那个专用的UI?

有趣的是,你可以在Google身上看到这一点。因为Google曾有一个完整的理念,即一切都将只是一个Google搜索,Google会计算出那个查询是什么。但猜猜怎么着?你知道,现在的Google Flights并不是一个Google搜索框。你知道,到了某个点……

关于这一点有一件有趣的事,我认为思考GUI在做什么很有趣。GUI做的一件显而易见的事是,它使Office能够拥有500个功能,而你可以找到它们。至少你不需要记住键盘命令,你现在实际上可以拥有无限的功能,你可以不断添加菜单和对话框,最终你的屏幕空间会不够放对话框,但你可以拥有数百个功能,而无需人们记住键盘指令。

但另一面是:你处于Workday、Salesforce或任何企业软件、航空公司网站或Airbnb的那个对话框或那个屏幕的工作流中。屏幕上并没有600个按钮。屏幕上有7个按钮,因为那家公司的一群人坐下来思考过:“用户在这里应该被问什么?我们要给他们什么问题?在这个流程的这个点应该有什么选择?”

这反映了大量的机构知识、大量的学习、大量的测试和大量关于“这应该如何工作”的深思熟虑。而当你给某人一个原始的提示框,然后你说:“好吧,你来告诉这东西怎么做这件事。”你会觉得:“但这需要我闭上眼睛,绞尽脑汁,从第一性原理思考这究竟是如何运作的?”

我总是把机器学习比作给你“无限的实习生”。所以,你知道,想象一下你有一个任务,你有一个实习生,而这个实习生不知道什么是风险投资。他们能有多大帮助?比如,他们不知道公司会发布季度报告,不知道我们有Bloomberg账号可以查倍数,也不知道你应该用PitchBook来查这个数据而不是用Google。这就是我关于Deep Research的观点——不,你应该用这个来源,而不是那个来源。

你是想必须从头开始搞清楚这些,还是想让一群懂这行的人花5年时间搞清楚屏幕上应该有哪些选择供你点击?我的意思是,这是旧的用户界面理念,即“计算机永远不应该问你一个它本该自己知道的问题”。而当你面对一个空白的原始聊天机器人屏幕时,它实际上是在问你所有事情。它不仅是问你一个问题。它是在问你关于你想要什么以及你打算如何做这件事的绝对所有细节。

Erik Torenberg:你提到ChatGPT不像是一个产品,更像是一个伪装成产品的聊天机器人。我很好奇,当我们回顾这次平台转移时,你认为会有另一个类似iPhone或Excel风格的产品来定义这次平台转移,而ChatGPT做不到吗?还是说世界必须追赶上来,学会如何使用ChatGPT或类似的东西?

Benedict Evans:这两者可能都是真的。因为这就像……我们花了一段时间才意识到你会如何使用GoogleMaps,你能用Google做什么,以及你可以如何使用Instagram。所有这些产品都随时间发生了巨大的演变。所以部分原因是,你会逐渐意识到你可以用这个做什么。比如你意识到“那现在只是一个Google搜索请求了”。你意识到你可以那样做,你意识到“我花了几个小时做这个,但我刚意识到,其实我只需要做一个数据透视表”。

是的。但另一面是,你仍然期望人们自己从第一性原理出发去搞清楚怎么用。而在这种情况下,有一群——真的100个、1000个、10000个——非常聪明的人坐下来,试图搞清楚那些东西是什么,然后把它作为一个产品展示给你,这是很有用的。

我认为这方面的另一面是,你知道总是有这些先驱产品。所以像在Instagram之前有很多其他东西。是的。你知道,YouTube一开始不是YouTube。我想它一开始是视频约会网站。有很多尝试做在线约会的项目,它们都还行,直到Tinder把整个模式彻底翻转过来。所以,总是有很多东西……那个短语叫什么来着?局部最大值?

事实上,这正是我们在iPhone推出之前的处境,因为我在那之前的十年就在移动行业工作。当时感觉不像是我们在等待某个东西。感觉就像它是行得通的。就像每年网络都变得更快,手机变得更好,每年都好一点点,我们有App,我们有应用商店,我们有3G,我们有摄像头,事情似乎每年都好一点。然后iPhone来了,它就是——你知道,打破了图表。你知道如果你画一条线是这样走的,然后有一条线是那样走的,指指数级跳跃。虽然还要记得,iPhone也花了两年时间才真正跑通,因为价格不对,功能集不对,分销模式也不太管用。

所以,是的,你可以认为一切都很顺利,然后某个东西出现了,你意识到“不,哦不,不,不,那是……”这对Google来说也是一样的。你知道,在Google之前就有搜索这个东西。只是它不太好用。在Facebook之前有很多社交类的东西,那是催化它的东西。

所以,你知道,我只是从决定论的角度认为,整件事还处于非常早期的阶段,感觉理所当然会有几十个、几百个新事物出现。否则,a16z就应该关门,把钱退给LP,因为基础模型将包揽一切。我不认为你们会那样做。至少我希望不会。

Erik Torenberg:如果我们对过去几年有什么遗憾的话,那就是没有投得更大。我认为我们没有充分意识到,在各个子领域会有多么专业化。无论是语音还是图像生成,或者任何子行业,都会有净新公司被创造出来,它们会比模型提供商做得更好。甚至在每个类别中会有多个模型提供商。

你知道,在Web2.0时代,我们总是押注类别赢家,类别赢家会拿走大部分市场。但这些市场太大了,而且有太多的专业知识和专业化需求,以至于在每个类别中都可以有赢家。不仅仅是模型提供商通吃,甚至在包括模型提供商在内的每个类别中,随着专业化程度的提高,市场大到足以容纳多个赢家。

Benedict Evans:我认为那是对的。而且我认为,类别本身并不清晰,对吧?你知道很多时候你认为“这是一个类别”,结果发现不,它实际上是另一回事,类别以不同的方式被解绑、捆绑和重新组合。

我的意思是,我记得1995年我还是个学生的时候,我想我的PC上有四个或五个不同的网页浏览器,甚至有Web服务器。因为TimBerners-Lee最初的网页浏览器里有一个网页编辑器,因为他认为这有点像网络驱动器,是一个共享系统,并没有意识到……或者说不完全是一个出版系统。所以你会把网页放在你的PC上,你得让PC开着,这样你的同事才能看到你的Word文档或网页。所以再次强调,就像我们真的不知道……

我只是不断回到这一点。我觉得我们目前问的大多数问题可能都是错误的问题。

为什么ChatGPT可能没有网络效应?

接上你刚才说的一点,我正在思考的一件有趣的事是观察OpenAI。因为,你知道,我对“脱节”很着迷,我们现在有一个有趣的脱节:如果你看基准测试得分,那些通用基准测试显示模型基本上都是一样的。如果你每天花几个小时使用它们,那么你会产生这种观点:“哦,我喜欢Claude的语气多过GPT,我喜欢GPT5.1多过GPT4.9”或者不管它叫什么鬼名字。如果你每周只用一次,你真的注意不到这些东西。基准测试得分都差不多。

但使用量却不是这样。Claude基本上没有消费者使用量,即使它的基准测试得分是一样的。然后是ChatGPT,然后在图表下方很远的地方才是Meta和Google。有趣的是,你再读所有的AI新闻简报,上面会说“Meta输了,他们出局了,他们死定了,Mark Zuckerberg正在花十亿美元雇一个研究员试图回到游戏中”。但从消费者端来看,这是分发的问题。

这里有趣的事情是,我正在绕圈子想表达的是:对于一个休闲的消费者用户来说,如果模型确实是大宗商品,并且还没有网络效应或“赢家通吃”效应——这些可能会出现,但我们现在还没有。像“记忆”这样的东西虽然有粘性,但不是网络效应,而且它可以被复制。那么你靠什么竞争?

你仅仅是靠成为公认的品牌,添加更多功能、服务和能力,让人们不切换吗?这有点像Chrome浏览器发生的事情。Chrome没有网络效应,它实际上也没有比别的浏览器好多少。也许比Safari好一点,但你知道,你用Chrome是因为你习惯用Chrome。

还是说,你会因为分发或在其他地方涌现的网络效应而被甩在后面,与此同时你还没有自己的基础设施?

我想表达的是,虽然你有这8亿或9亿周活跃用户,但这感觉非常脆弱。因为你真正拥有的只是默认设置的力量和品牌。你没有网络效应。你并没有真正的功能锁定。你没有更广泛的生态系统。你也没有自己的基础设施。所以你无法控制你的成本基础。你没有成本优势。你每个月都会收到Satya(微软CEO萨提亚·纳德拉)寄来的账单。

因此,你必须在两个方向上尽可能快地通过构建产品、在模型之上构建东西来突围——这回到了我们之前的对话:它仅仅是模型吗?是的。现在,你必须在模型之上的每个方向构建东西。它是一个浏览器。它是一个社交视频应用。它是一个应用平台。它是这个,它是那个。就像那个迷因图里的人,对着地图,上面连满了红线。它是所有这些东西。我们要把它们都在昨天建好。

然后在平行线上,它是基础设施……你需要和Nvidia、Broadcom、AMD打交道……和Oracle以及石油美元打交道。因为你正试图从这个惊人的技术突破和这8、9亿的“哇塞”时刻,争分夺秒地转向某种具有真正粘性、可防御、可持续的商业价值和产品价值的东西。

Erik Torenberg:是的。当你评估超大规模厂商之间的竞争格局时,你认为哪些问题对于决定谁将获得持久的竞争优势,或者这场竞争将如何演变最重要?

Benedict Evans:嗯,这有点回到你关于“维持性优势”的观点。我们谈到了Google,如果我们思考向移动端的转移……对于Meta来说,这被证明是变革性的,它让产品变得更有用了。是的。对于Google来说,结果证明移动搜索就是搜索。地图可能变了,YouTube变了一点,但基本上对于Google搜索来说,移动搜索就是搜索,只是意味着更多人在更多时间做更多搜索。是的。

现在的默认观点似乎是:嗯,Gemini和其他任何模型一样好。下周,比如新模型发布,我还没看今天发布的GPT5.1的基准测试。它比Gemini好吗?可能吧。下个月它还会更好吗?不一定。所以,这是既定事实。比如,你有了一个前沿模型。好吧。

那要花多少钱?选个数字,一年2500亿美元,一年1000亿美元。这是什么?这是我们之前关于CapEx(资本支出)的对话。好的。Google付得起,因为他们有钱。他们有来自其他所有业务的现金流。所以,你做了这个,你现有的产品得到了……你优化了搜索。你优化了广告业务。你构建了新的体验。

也许你会发明AI时代的iPhone。也许根本就没有AI时代的iPhone。也许别人做了,然后你做一个Android并直接抄袭它。嗯,所以行吧,这是新的“移动时代”。我们继续。搜索是搜索。AI是AI。我们会做新东西。我们会把它变成一个功能。我们只是继续做下去。

对于Meta,感觉在“这对搜索意味着什么”上有更大的问题。或者这对内容、社交、体验和推荐意味着什么,这使得他们拥有自己的模型变得更加迫切,就像Google一样。

对于Amazon。好的。在一方面,这是大宗商品基础设施,我们将作为大宗商品基础设施来销售它(指AWS)。而在另一方面,也许退一步说……如果你不是Hyperscaler,如果你是一个网络出版商、营销人员、品牌、广告商、媒体公司,你可以列出一张问题清单,但你现在甚至不知道问题是什么。

这是什么?如果我问聊天机器人一件事而不是问Google,会发生什么?即使从Google的角度来看是Google的聊天机器人,那也没关系。但作为营销人员,那意味着什么?如果我想要一个食谱,LLM直接给了我答案,如果我的生意是做食谱的,那意味着什么?

你是否有一种分裂——这也是一个Amazon的问题——购买决策是如何发生的?购买一个我以前不知道存在的物品的决策是如何发生的?如果我在客厅挥动手机说“我应该买什么?这会带我去哪里?”会发生什么?这种方式在过去是不会发生的。所以在下游有很多问题,这些问题会上溯到Meta,某种程度上也会上溯到Google。这就给Amazon带来了一个长期的更大问题。

LLM是否意味着Amazon终于可以在大规模推荐、发现和建议方面做得非常好了?这是它过去真正做不到的,因为它拥有的是那种纯粹的大宗商品零售模式。

Apple……Apple有点处于另一边。有趣的是,他们在两年前就提出了关于Siri应该是什么的极其令人信服的愿景。只是结果证明他们做不出来。有趣的是,其他人也做不出来。你回去看他们展示的Siri演示,你会想:“好的,所以我们有多模态、即时、端侧、使用工具、代理式、多平台的实时电子商务,而且没有提示注入问题,零错误率。”听起来不错。我的意思是,有人把这个做出来了吗?没有。Google和OpenAI都没有把这个做出来。我认为Google或OpenAI无法交付Apple两年前展示的那个Siri演示。我的意思是,他们可能做个演示,但他们无法让它持续、可靠地工作。那个产品今天也不在Android上。

而Apple……对我来说,Apple面临着最具有智力趣味的问题。我看到Craig Federighi(苹果高级副总裁)提出了这一点,意思是:“我们没有自己的聊天机器人,这没关系。我们也没有YouTube或Uber。”

解释为什么这是不同的,这是一个比听起来更难回答的问题。当然,答案是:如果这实际上从根本上改变了计算的本质,那就是个问题。如果它只是你像Google一样使用的一项服务,那就不是问题。这有点像关于Siri去向的问题。

但这里有一个有趣的反例,就是思考2000年代微软发生了什么。整个开发环境离他们而去,2001年之后几乎没人构建Windows App了,但你需要使用互联网。要使用互联网,你需要一台PC。

你要买什么PC?那时候Apple真的不算玩家,刚刚回到游戏中。Linux对任何正常人来说显然不是选项。所以你买WindowsPC。所以基本上,微软输掉了平台战争,却卖出了多一个数量级的PC。好吧,不是他们卖的,而是因为微软输掉的互联网,导致WindowsPC的销量增加了一个数量级。

然后直到移动时代,他们才连同设备和开发环境一起输掉了。所以这里有这类问题:如果所有新东西都是建立在AI上的,而我是通过从AppStore下载的一个App来访问它,这对Apple来说在多大程度上是个问题?你需要发生一种更根本的转变,才会让这对Apple构成问题。

即使你假设那种完全的……比如“大灾变”降临,我们都去住在那种像《瓦力》里的人一样的太空舱里睡觉。不是《飞屋环游记》。是的,是什么来着?那个有捡垃圾机器人的电影。那是哪部?Wall-E。Wall-E。是的。你知道那部电影里坐在太空舱里的人。

也许我们会成为那样的人。如果是那样,那也行。但有一种中间情况,比如软件的整个本质发生了变化,不再有App了,你只是去问LLM一件事。好吧。你问LLM事情的那个设备是什么?嗯,它可能得有一个漂亮的大彩屏。它可能得有一整天的电池续航。可能需要麦克风。可能需要一个好摄像头。

听起来有点像iPhone。是的。那我会买一个价格只有十分之一、只能用LLM的设备吗?不,因为我仍然想要好摄像头、好屏幕和好电池续航。所以,并不是……当你开始深究时,有一堆有趣的战略问题。

好吧,这对Amazon意味着什么?这些问题与“这对Google意味着什么”或“这对Apple意味着什么”完全不同。这对Facebook意味着什么?或者这对Salesforce意味着什么?这对Uber意味着什么?

然后回到我们在对话开始时说的,这对Uber意味着什么?好吧,他们的运营效率提高了X%,现在的欺诈检测更有效了。好的,也许他们会有自动驾驶汽车,那是另一个对话。但假设没有自动驾驶汽车,那是完全另一回事。否则作为Uber,这改变了什么?嗯,并没有改变很多。

Erik Torenberg:我想稍微把视角拉远一点。这有助于框架化……你做这些演示文稿已经有一段时间了。你知道,你甚至把频率提高到了每年两次,因为变化太大了。你在每次演示中所做的一件事就是你以提出非常棒的问题而闻名,并记录下哪些是值得问的重要问题。

我很好奇,当你回顾过去,也许是2022年后ChatGPT时代,或者GPT-3时代,你当时问的问题,再映射到现在,我们在多大程度上对其中一些问题有了方向?或者在多大程度上它们是相同的问题,或者是新的、不同的问题?

如果我在读完你最初的演示文稿后昏迷了——假设是GPT-3发布后的那一份——然后现在醒来看到这一份,有哪些最令人惊讶的事情,或者我们学到的更新了那些问题的事情?

Benedict Evans:所以我认为今年我们有很多新问题。我觉得你可以列出一个清单,比如在23年春天可能有半打问题:开源、中国、Nvidia、Scaling是否继续?图像生成会发生什么?OpenAI的领先优势能保持多久?那些问题在23年和24年并没有真正改变。大多数问题还在那里。

比如Nvidia的问题没怎么变。关于中国的答案,关于会有多少个模型的答案?答案是:好吧,会有很多。任何能花几百……能花几十亿美元的人都可以拥有一个前沿模型。中国在AI领域的技术投入和产业布局为前沿模型研发提供了基础。这在23年初就相当明显了。大家花了一段时间才明白这一点。大模型和小模型,我们会有在设备上运行的小模型吗?不,因为小模型的能力移动得太快了,无法将前沿模型缩小到设备上。

但这些问题在两年、两年半里没怎么变。我认为我们现在有一堆更多的产品战略问题。因为你看到了真正的消费者采用,OpenAI和Google向不同方向构建东西,Amazon向不同方向走,Apple尝试了显然失败了然后又再次尝试做东西。有一种感觉是,行业里发生的不仅仅是“好吧,让我们再建一个模型并花更多钱”。是的,现在有更多的问题和更多的决策。现在在科技之外也有更多问题,当然比如在零售媒体方面,你如何开始思考你会用这个做什么?

再次强调,我文稿中的经典框架是:

第一步:你把它做成一个功能,你吸收它,做那些显而易见的事。

第二步:你做新东西。

第三步:也许有人会来,把整个行业翻个底朝天,完全重新定义问题。

所以你可以做一个Imagine if:

第一步是,你是湾区或华盛顿特区某家沃尔玛的经理。第一步是“帮我找到那个指标”。

第二步是“帮我建立一个仪表盘”。

第三步是“今天是黑色星期五,我在管理华盛顿特区外的沃尔玛。我应该担心什么?”这可能是错误的例子。

但这就像,Amazon的第一步是“你买了灯泡,所以给你推荐这个;你买了气泡膜,所以这是打包胶带”。但Amazon实际上应该做的是说:“嗯,看来这个人正在搬家。我们将向他们展示房屋保险广告。”这是Amazon的关联系统无法获得的,因为他们的购买数据中没有这个。

我们仍然非常处于起步阶段,我们还在第一步,但我们在思考更多。第二步、第三步会是什么?除了简单的愚蠢自动化之外,新的收入会来自哪里?我们将用这个构建什么新东西?这实际上在哪里可能会重新定义或改变市场的样子?

这显然是任何内容行业从业者的一个大问题。是的。你知道,如果我能直接去问LLM这个问题,那意味着什么?哪些类型的内容是基于Google将那个问题路由给你而存在的?哪些类型的问题、哪些类型的内容实际上不是那个问题?

比如,我是想要一个肉酱意面食谱,还是想听Stanley Tucci谈论在意大利做饭?我是只想要那个SKU,还是想搞清楚我应该买哪种产品?Amazon非常擅长给你SKU,但在告诉你“你想要哪种滑雪板”方面做得很糟糕。我是只想要幻灯片,还是想花一周时间与贝恩咨询的一群合伙人讨论我该如何思考这个问题?我是只想要钱,还是想与a16z的运营团队合作?我在这里究竟在做什么?

我认为LLM正开始以许多不同的方式使这个问题具体化。是的,比如我在这里实际上想做什么?我是只想要一个计算机现在可以为我回答的东西,还是我想要一些不是那个的东西?因为LLM可以做一堆计算机以前做不到的事情,对吧?计算机以前做不到的那件事是我的生意吗?还是我实际上在做别的事情?

Erik Torenberg:我们即将以一种更精细的方式弄清楚,对于许多许多这类事情来说,真正的“待完成的工作”是什么。

Benedict Evans:是的。你知道回到互联网时代,关于报纸的一个观察是,报纸看着互联网,谈论专业知识、策展和新闻业以及其他一切,却没有真正说:“好吧,我们其实是一家轻型制造公司和一家本地分销及卡车运输公司。”是的。那是问题所在。直到互联网到来之前,那不是你会思考的对话。然后互联网突然让这一点变得清晰,并突然创造了一种以前不存在的“解绑”。

所以会有那样的事情:在LLM出现并指出来之前,你并未意识到自己是那样。有人带着LLM来说:“我可以用这个来做这件事。”而你并没有真正意识到那是你防御性或盈利能力的基础。我的意思是,这就像关于美国医疗保险的笑话:美国医疗保险盈利的基础是让事情变得非常非常无聊、困难和耗时。利润就来自那里。也许不是,我不了解那个行业,但为了论证,假设那是你的防御性。好吧,LLM移除了无聊、耗时、麻木的任务。是的。那么,哪些行业是受此保护的?他们并没有意识到这一点。

这些,你知道,就像你可以在90年代中期问关于互联网的问题,或者十年后问关于移动互联网的问题。通常,事后看来,你问的一半问题都是错的。我的意思是,我记得作为2000年的一名新手分析师,每个人都在说:“3G的杀手级用例是什么?3G有什么好用例?”结果证明,把互联网随时随地装在口袋里就是3G的用例。但这并不是人们当时在问的问题。我相信现在也是这样,会有很多事情发生并被构建出来,你去看了之后会意识到:“哦,原来你会那样做这件事。你可以把它变成那个。”

除了“更聪明的软件”,我们离AGI还有多远?

Erik Torenberg:是的。我肯定你有过这种看到创业者的经历。你知道,偶尔他们进来推销这个东西。你会说:“哦,好吧。你可以把它变成那个。我没……我没意识到它是那个。”是的。不,百分之百。

让你离开前的最后一个问题是,如果我们谈论从现在起两三年后,或者你在做一个演示文稿,你说:“哦,这实际上比互联网更大,或者也许这就像计算本身一样。”需要什么条件为真?需要发生什么?什么会改变我们的想法?

Benedict Evans:我的意思是,我有点,你知道,回到我关于犹太人和基督徒的观点:弥赛亚来了,什么也没发生。我们忘记了……我的意思是也许有两种非常简短的方式来思考这个问题。

其中之一是,我认为我们忘记了iPhone有多巨大,互联网有多巨大。你仍然可以在科技界找到声称智能手机没什么大不了的人。这就是人们抱怨我的基础,比如“这个白痴认为生成式AI就像那些愚蠢的手机一样大”。拜托。

我认为另一个答案是,我不想卷入关于什么是推理能力、基准测试之类的争论,你知道你需要看很多5小时长的播客听人们谈论这些东西……但我们现在拥有的东西并不能替代一个真人——除了在一些非常狭窄和受到严格限制的护栏之外。这就是为什么,你知道,Demis Hassabis指出现在说我们拥有博士水平的能力是荒谬的。

我们需要看到一些真正能改变我们对这东西能力认知的事情。是的。让它实际上成为一个“人”,而不是“它有时能非常好地做这些像人一样的事情,但其他时候不行”。

这是一个,你知道,一个非常艰难的概念性思考,因为,你知道,我是故意的。我意识到我没有给你一个可证伪的答案。但我不确定对此什么才是可证伪的答案。你什么时候知道这是AGI?你知道,这就是LarryTesler的那句话:“AI就是任何还不能工作的东西。”一旦人们说它能工作了,人们就会说:“好吧,那这就不是AI,那只是软件。

(ZF注:LarryTesler定理:计算机科学家LarryTesler的名言:”AI is whatever hasn’t been done yet.”。意指一旦AI解决了某个问题(如OCR、国际象棋),人们就不再视其为智能,而只是算法或软件。)

这变成了一种,你知道,有点像喝醉的哲学研究生那样的对话,就像它是一场技术对话一样。

Erik Torenberg:就像,你有考虑过吗,Erik,也许我们都不是真的。那是个想法。

Benedict Evans:对此我唯一能给出的有形答案是:我们现在拥有的不是那个(AGI)。它会成长为那个吗?我们不知道。你可能相信它会。我不能告诉你你错了。我们只能等着瞧。

Erik Torenberg:我认为这是一个结束的好地方。这个演示文稿是《AI吞噬世界》。我们会附上链接。它非常棒。Benedict,非常感谢你来播客讨论它。

Benedict Evans:当然。多谢。

原文:AI Eats the World: Benedict Evans on the Next Platform Shift

https://www.youtube.com/watch?v=RH9vJNxFKDA

编译:Carl Zhang

更多关于 行业事件的文章

  • 行业事件

    CPO,过热了?

    By

    来源:半导体行业观察 作者:邵逸琦 在AI基础设施被资本与产业合力推向发展高潮的当下,凡是与“光”“互联”“带宽”“功耗”挂钩的技术方向,都极易被贴上“下一代核心技术”的标签,迅速成为市场追逐...

  • 行业事件

    VC的钱“烧不起”了,智谱、MiniMax等大模型独角兽 IPO进程加速

    By

    来源:IT桔子 作者 | 吴梅梅 中国AI大模型头部公司的基调在2025年发生了转变:从早期的宏观规模叙事转向切实的经营盈利压力。 与此同时,其组织架构、高管人事变动也颇为频繁。IT 桔子曾盘...

  • 行业事件

    银价飙涨130%创新高,光伏厂商紧急涨价

    By

    来源:时代财经 作者 | 何明俊 光伏组件要涨价了? 12月22日,白银现货价格持续大幅上涨,再创历史新高。同花顺iFind数据显示,伦敦银现价盘中最高触及69.450美元/盎司,年内涨幅超1...

  • 行业事件

    今年冬天,年轻人买羽绒服追求折扣

    By

    每年冬天,羽绒服都是社交平台的高频词。但今年再谈起,情况却有点变了。一边雪场和户外圈,在进行一场“装备内卷”,中产们动不动一套滑雪羽绒服上万;而另一边,大量普通人却开始仔细“研究”:充绒量多少...

  • 行业事件

    新能源渗透率触及60%临界点,中国车市2025篇将如何结尾?

    By

    来源:autocarweekly 作者:萝吉 今年 10 月份国内乘用车市场同比下滑 9.66% 时,我用了 ” 大跌 ” 来形容,没想到,11 月份的情况不但没有好转...

To Top