January 21, 2024

生成式AI:2024年关键挑战与前景规划

在生成式AI站稳脚跟并成为公众热议的话题后,其在企业技术领域的运用不断扩大,领导者们对其的热情也与日俱增。

当前的创新阶段只是起点,科技行业当前的努力将决定AI如何深刻地影响我们的生活和工作。领导者们正在确定生成式AI的短期优先事项,这将在2024年引发一系列趋势和挑战。

领导者需在成本与运营之间找到平衡点

在生成式AI对公司产生实质性影响之前,领导者们需要做出决策:是购买现成的解决方案还是自主构建?使用大型模型还是小型模型?选择开源技术还是专有技术?

一些领导者会坚持使用大型模型,而另一些则选择投资于在内部数据上进行微调的小型模型。一些公司可能会发现,他们确实需要大型语言模型,但仍希望通过使用自有数据对其进行微调,以确保投资效益的最大化。一些公司可能会同时采用这两种策略,而另一些公司则可能持观望态度,并从其他公司的成功经验中汲取灵感。

在供应商方面,一个备受争议的重要问题是定价。AI功能的定价没有统一的标准或基准,一些供应商试图收取较高的每用户每月费用。随着GPU和研发成本的不断上涨,一些供应商将这些成本转嫁给客户,而首席信息官(CIO)仍然面临着削减支出的任务,他们将被迫综合考虑辅助费用与他们习惯的主要产品。

为了解决这一问题,更多的首席信息官可能会选择自主构建模型。由于市场仍处于早期阶段,特定功能或行业的定制模型可能尚未普及,因此安全性和数据保护成为说服公司在短期内构建或微调其模型的关键因素。

公司将面临数据质量、模型可靠性、可访问性和治理瓶颈

许多公司正在尝试应用大型语言模型(LLM),但实际上很少有解决方案已经投入生产。领导者们渴望推动数据的广泛应用,但尚未完全明确实现方法。包括Databricks、Microsoft、Glean、Replit和GitHub等在内的许多软件公司,都在通过集成生成式AI功能来增强其产品。

"生成式AI的核心挑战"主要集中在如何安全、高效、可靠地应用这项技术上。领导者们正在努力解决数据问题,特别是如何访问和管理组织的数据语料库。

例如,在对全球2300多名高管进行的一项Workday调查中,仅有4%的受访者将其数据描述为完全可访问,显示出许多公司希望通过生成式AI实现的目标与实际情况之间存在巨大差距。

由大型语言模型(LLM)生成的内容的准确性和可靠性也是一项值得关注的重要研究和行业挑战。对于需要高度准确度的部门,如法律、财务和合规等,采用生成式AI工具的速度将比其他职能部门更慢,但仍能从中受益。然而,为了真正为这些团队创造价值,模型必须更加可靠,以满足非技术法律专业人员或财务分析师在生成式AI的协助下所需的准确度水平。

尽管提示工程、检索自动生成(RAG)模型和微调等方法可以减少误导,但它们并不能完全解决这些问题。因此,我预计未来将会有更多创新涌现,以解决这一核心问题。

在未来一年里,数据领导者将集中力量克服这些基础性挑战。我们可能会看到更多的公司整合他们的数据工具,并加强努力提升数据质量和控制力。最近由Databricks与麻省理工学院科技评论合作进行的一项研究表明,近三分之四的高级技术高管已经采用了Lakehouse架构,许多其他公司也计划效仿这一做法。

我们应从何处着手?

当前正在进行的实验性工作以及已经取得成功的项目,将决定公司从生成式AI中获取最直接价值的方向,并决定他们将在哪些方面投入最多的资金和时间。然而,在短期内,如果不全面关注数据的完整性、质量和治理,所有这些努力都将无法实现。

到2024年及以后,数百万的知识工作者,无论是技术用户还是业务用户,都将使用各种形式的AI助手。大量的用户使用为科技行业提供了庞大的样本,有助于深入了解AI如何成功辅助不同职能。这将最终有助于制定未来的方法、成功因素和生成式AI的应用场景。

与所有伟大的技术一样,生成式AI在发挥其全部潜力之前,也将经历不断的演变(甚至可能会犯错)。在生成式AI方面,我们还有很长的路要走,包括提高其效率和准确性,以及适应必要的法规和进行创新。有一点是肯定的:即将到来的一年将是决定AI驱动的未来是什么样子,以及它将如何最终改变组织运作方式的关键一年。

0 comments:

VxWorks

Blog Archive