+ 我要发布
我发布的 我的标签 发现
浏览器扩展
斑点象@Edge

大多数人工智能初创公司都注定要失败

大多数人工智能初创公司注定要失败的说法可能相当平凡。毕竟,大多数 创业公司都注定要失败,只是从数字上看。 我想说一些更具挑衅性的话。几乎所有在后 ChatGPT 炒作中形成的初创公司,以及专门给自己贴上“AI 初创公司”标签的初创公司都注定要失败。 现在,我是一名风险投资人,长期投资于人工智能——事实上,我最初离开对冲基金界是因为我看到人工智能发生了很多事情。所以,我绝对不是一个人工智能怀疑论者。 话虽如此,我从根本上认为,从投资者的角度来看,在当前的炒作周期中获得的大部分资金都是毫无价值的。 如果你在一个周末建造了它,其他人也可以 让我们解决最简单的情况。 我遇到过许多初创公司,他们基本上将一些生成式 AI API 粘合在一起,进行一些提示性工程,并在其上添加前端用户界面。其中一些产品 令人印象深刻 在抛光和功能方面。 这些公司也注定要要么成为完全正常的企业(但不是初创公司,按照保罗·格雷厄姆的经典定义),要么死亡。 显然,如果你在一个周末建造了它,其他人也可以这样做。现在,假设你是一个编码天才。名副其实的 10X 程序员神童!世界上的其他人可能需要几个周末......但它将被建造起来。 如果你基本上免费赠送你的项目产品,只是玩得开心,没什么大不了的。 但是,如果您开始收费并且客户开始大量依赖它,那么其他人可能会进来并稍微削弱您。也许你的仍然更好。变得更好往往会推动产品的采用和选择。 但是,如果它实际上很重要(即,要求支付意愿很高并且经常被使用),这就是经济和竞争的诅咒发挥作用的地方。人们会复制你并争夺你的利润。 没有防御性,没有差异化=没有利润。这是基本的经济学。 甚至 Alphabet、Meta 或 OpenAI 也没有任何防御性 好的,这就是 Econ 101 和 Startup 101。这并不是这个地区所独有的。每个炒作周期的本质特征是人们忘记了这些规则的存在,然后在周期结束时重新发现它们,让他们感到懊恼。 但是,请注意,我主要谈论的是这些初创公司,它们只是将 ChatGPT 等 API 粘合到 UI 中。 这些显然几乎没有区别和防御性。即使你的UI更好,其他人也可以来复制它。 不过,我的观点比那些微不足道的例子更广泛。 现在让我们将相同的逻辑应用于 ChatGPT、Bard、LlaMA 等 LLM 的底层技术本身。 如果我告诉你,我有一个很棒的技术,每个人都想使用它,并创造它,我所要做的就是: 在互联网上收集所有文本 使用大量 GPU 和数百万美元进行训练 它建立在众所周知的技术之上,其中大部分是开源的 这是站得住脚的吗?对于小型初创公司来说,第 1 点和第 2 点可能有一定程度的技术或后勤困难,但对于其他大公司来说,这两者都不是特别不可逾越的——尤其是与第 3 点的事实相结合时。所有这些东西都建立在 transformer 和 LLM 的相同底层架构上。 这些LLM没有真正的护城河。任何大型互联网公司都可以复制它们。 事实上,甚至 Alphabet/Google 内部也这么说过。 这同样适用于所有图像和视频生成式 AI。只需将第 1 点替换为图像或视频(旁注:如果 Alphabet 可以扼杀对 YouTube 的轻松访问,视频可能是一个例外)。 但是,如果我拥有最好的 AI 呢版本? 好的,我们已经确定,仅仅在其他人的技术面前构建一个 API 并不是非常有用(我们的微不足道的案例)。我们现在还讨论了为什么 LLM 这个不那么微不足道的案例从根本上是站不住脚的。 如果我灵活地使用上面的第 3 点,并提出 LLM 的最佳版本会怎样?或者就其他人工智能领域而言,类似的东西? 嗯,从理论上讲,这很有趣。当然,整个行业的技术前沿发展速度有多快 整个行业 。 这就像拥有最快的 CPU......在90年代 如果我在 1990 年代告诉你我拥有最好的 CPU 怎么办?我的速度是英特尔的 3 倍! 考虑到开发 CPU 的成本和难以置信的难度,这在技术上确实令人印象深刻!当然,问题是,你能年复一年地重复这一壮举吗?因为你的问题是,考虑到当时半导体技术的发展速度(摩尔定律),你在一两年内(也许)有优势。英特尔和其他所有公司都将与您的性能相媲美。如果你有一些特殊的调味料可以让你持续保持领先,这是一回事,但更有可能的是,你只是偶然发现了一组特定的优化,其他人都会很快采用。 同样的问题也存在于今天的人工智能中。前沿发展得太快了,整个人工智能学术和行业研究界的前沿几乎可以肯定比你的一家公司拥有更多的火力。 顺便说一句,当我们谈论火力时,这个挑战即使在最大规模的情况下也适用。例如,中国——从所有悄无声息的轶事来看——在人工智能发展的速度上没有跟上全球(集中在美国)研究界的步伐。基本上,每个分支专有模型的人都会很快落后,并最终采用全球最先进的技术。人工智能甚至比半导体更糟糕,因为所有这些都往往是开源的,这使得在算法能力方面保持任何长期优势变得更加困难。 因此,除非你能够使那一两年的优势真正发挥作用,否则你不会得到任何持久的价值——如果你仔细想想,这实际上是非常困难的。 等等,那么什么是可以辩护的? 好的,我们已经经历了这个消除过程。实际上还剩下什么? 可怕的哥斯拉规模计算 好吧,你可以拥有一些计算密集型的东西,只有你才能经济地进行训练或推理。在我看来,这不太可能,因为人工智能在降低实现特定结果所需的数据和计算量方面取得了进展。但是,请注意,我的观点有些不受欢迎。您可以自己决定这一点是否正确(我在上面的链接文章中谈到了这一点)。然而,至少从投资者的角度来看,即使这是一个 是 真正的优势,我不确定我是否对一个创业战略感到兴奋,即积累比谷歌、Facebook、百度更多的 GPU/ASIC/FPGA,你有什么...... 真实世界的专有数据 其次,您可以在一个不能简单地从互联网上收集数据的地方进行操作。例如,医疗保健数据被孤立在医院中,或者今天根本没有收集。或者,蛋白质折叠或药代动力学反应数据必须通过真实世界的实验精心收集。或者一大堆其他东西......所有这些都有一个共同的特点,即它不存在于纯数字世界中,也不能简单地从互联网上刮掉。 这就是我看到大多数人工智能初创公司的价值所在。在这些地方,您不能简单地决定去收集数据,而没有高昂的成本、时间和简单的物理世界混乱。这些初创公司可以简单地驾驭人工智能改进的浪潮——没关系,无论如何,算法都是商品化的——但是唯一拥有并持有专有的、几乎不可能获得真实世界数据的人。 创造的价值并不意味着获得的价值 请注意,我提到了初创公司。许多人忘记了,仅仅因为价值是在社会层面上创造的,这并不一定意味着价值被公司捕获。1990 年代的互联网繁荣创造了大量的网络基础设施,但这些公司从他们的投资中实现了巨大的负投资回报率。不过,这对于将社区带到网上非常有用,但这是社会效益,而不是公司的投资回报率。 在最近的一个案例中,你知道 Azure 实际上运行了大量的私有区块链吗?由于各种原因,很难真正公布他们的财务业绩,但许多大公司都在 Azure 上运行这些东西,使Microsoft成为区块链的大赢家之一。(是的,还有一个单独的问题,即私有区块链是否真的与数据库有什么不同。但这与我的观点无关。 同样的事情也可能发生在 OpenAI上,OpenAI主要看起来像Microsoft的研发实验室。Microsoft在Azure中提供计算资源,作为回报,OpenAI开发工具,然后Azure将作为托管服务提供。然后,Azure 可以从 ChatGPT 和其他可以作为即用即付 API 调用的东西中赚到一大笔钱。当然,这看起来也与 Bard 和 Google Cloud Compute 等相同。 这一原则贯穿了当今大多数人工智能领域。将会产生很多价值,这些价值只会累积到社会中,而不会被任何私人玩家捕获。顺便说一句,这真是太棒了——这就是技术成为我们在社会和宏观经济学中为数不多的“免费午餐”之一的原因。 还将产生大量价值,这些价值将被现有的行业现有企业利用其市场力量和规模简单地捕获。这对社会来说不是免费的午餐,但也是资本主义的运作方式,并且经常仍然为社会创造“剩余”(Econ表示“好东西”)。 最后,有一个相当小的份额,既可以产生价值,又可以累积给新的、年轻的公司,理想情况下,这些公司可以出现并取代现有公司(这就是健康的市场营业额发生的方式)。 这些公司将产生超额回报,并成为明天的知名科技公司——当然,从理论上讲,这也是风险投资公司所寻找的。实际上,大多数投资者现在在向人工智能初创公司(甚至是声称拥有“人工智能战略”的大型上市公司)投入资金时更加不分青红皂白。因此,大多是把钱冲进下水道。 人工智能将改变世界。但大多数人工智能初创公司都注定要失败。