虽然这场聊天涵盖了多个方面,比如数据质量的重要性以及实时数据在生成式人工智能中的作用,但其中一个重要的收获是,在人工智能仍处于早期阶段,优先考虑产品与市场的契合度而非规模非常重要。

GenAI遭受数据过载的困扰,应专注于更小、更具体的目标

 

“没有数据就没有人工智能,没有非结构化数据就没有人工智能,没有大规模的非结构化数据就没有人工智能。”数据管理公司 DataStax 的董事长兼首席执行官切特·卡普尔(Chet Kapoor)说道。 卡普尔在 2024 年 TechCrunch Disrupt 大会上开启了一场关于现代人工智能应用背景下“新数据管道”的对话,风险投资公司 NEA 的合伙人凡妮莎·拉尔科(Vanessa Larco)和数据集成平台 Fivetran 的首席执行官乔治·弗雷泽(George Fraser)也加入了这场对话。

虽然这场聊天涵盖了多个方面,比如数据质量的重要性以及实时数据在生成式人工智能中的作用,但其中一个重要的收获是,在人工智能仍处于早期阶段,优先考虑产品与市场的契合度而非规模非常重要。对于那些希望进入令人眼花缭乱的生成式人工智能世界的公司,建议很直接——一开始不要过于雄心勃勃,要专注于实际的、渐进的进展。原因是什么呢?我们实际上仍在摸索这一切。 “对于生成式人工智能来说,最重要的是一切都取决于人。”卡普尔说,“那些实际去开展并构建最初几个项目的特别行动小组——他们不是在阅读手册;

他们是在编写如何制作生成式人工智能应用程序的手册。” 虽然数据和人工智能确实密切相关,但一个公司可能拥有的大量数据很容易让人不堪重负,其中一些数据可能很敏感,需要严格保护,甚至可能存储在无数个地方。拉尔科与众多 B2C 和 B2B 领域的初创公司合作(并且是这些公司的董事会成员),她提出了一种简单但务实的方法,以便在早期阶段释放真正的价值。 “为你想要完成的事情逆向思考——你想要解决什么问题,你需要什么数据?”拉尔科说,“找到那个数据,无论它在哪里,然后将其用于这个目的。” 这与从一开始就试图在整个公司推广生成式人工智能形成对比,把他们所有的数据都扔给大型语言模型(LLM),并希望它最终能吐出正确的东西。

据拉尔科说,那样很可能会造成不准确且代价高昂的混乱。“从小处着手。”她说,“我们看到的是公司从小处开始,有内部应用程序,有非常具体的目标,然后找到与他们想要完成的事情相匹配的数据。” 弗雷泽自 12 年前 Fivetran“数据移动”平台成立以来一直领导着该平台,在此过程中积累了 OpenAI 和 Salesforce 等大牌客户。他建议公司应该狭隘地关注他们当前面临的实际问题。 “只解决你今天有的问题;这是口头禅。”弗雷泽说,“创新的成本总是 99%在那些你构建但没有成功的事情上,而不是在那些成功了但你希望你提前为规模做好计划的事情上。尽管那些是我们事后总是会想到的问题,但它们不是你承担的 99%的成本。” 就像网络的早期以及最近的智能手机革命一样,生成式人工智能的早期应用和用例已经展现出一个强大的、由人工智能赋能的新未来的一瞥。

但到目前为止,它们不一定是改变游戏规则的。 “我把这称为生成式人工智能的《愤怒的小鸟》时代。”卡普尔说,“它还没有完全改变我的生活,还没有人帮我洗衣服。今年,我合作的每一家企业都在投入生产一些东西——规模小,是内部的,但他们投入生产是因为他们实际上正在解决问题,解决如何组建团队去实现这一目标。明年我称之为转型之年,那时人们将开始制作实际上开始改变他们所工作的公司发展轨迹的应用程序。”

 

© 版权声明

相关文章

返回顶部