生成式优势: ai 创始人指南之利用数据脱颖而出 目录 概创览始人指南之利用数据脱颖而出3 生成式人工智能 简要介绍4 将数据置于生成式人工智能方案的中心5 利用数据打造特色生成式人工智能应用程序 第1节 ..........................................7 为生成式人工智能奠定数据基础 第2节 ......................................................11 让思维突破技术范畴创造竞争优势 第3节 ...................................................14 总以结全新方式挖潜数据创造更多价值19 词汇表20 2 3 概览 创始人指南之利用数据脱颖而出 生成式人工智能(ai)横空出世,展现出了颠覆我们沟通、创造和运营方式的巨大潜力,令世人瞩目。而生成式人工智能刮起的这股旋风很大程度上得益于chatgpt和youchat等面向消费者的应用程序的推出。这些开创性的聊天机器人展示出与人类相仿的创造力和对话能力,着实令人震撼。 不过,生成式人工智能真正的用武之地,可远不止通识型聊天机器人。各行各业中的初创企业才刚刚开始拨开生成式人工智能的层层面纱,一步一步试探着生成式人工智能协助他们创新的方法。他们渴望尝试种种可能性,并且都有充分的理由来这么做。高盛的研究表明,生成式人工智能有望在10年 内将全球国内生产总值(gdp)提高近7万亿美元,将生产力增速提高1.5个百分点。同时,该技术 对投资者也有巨大的吸引力,根据pitchbook的统计,生成式人工智能初创企业在2023年筹集了 270亿美元的资金。 随着技术逐渐成熟,新一轮的创新型初创企业和科技公司纷纷快速推出各种新一代生成式人工智能功能,以满足客户和企业不断增长的需求。这种持续创新带来了生成式人工智能应用场景的快速增长。 鉴于这些研究成果,初创企业创始人和数据领导者纷纷希望快速推进自己的生成式人工智能应用程序,也就不足为奇了。他们不仅想知道如何走好下一步,还想了解如何在这个新兴领域抢占竞争优势并吸引投资者。充分发挥生成式人工智能潜力的关键在于初创企业自己的数据。 有了生成式人工智能,数据就能成为企业的竞争优势。 简要介绍 概括而言,生成式人工智能可以定义为一种用于生成新内容和新想法的人工智能。例如,生成式人工智能应用程序可以撰写故事、生成代码、设计数字图像。这些应用程序还可以自动执行繁琐的任务,例如从冗长的文档提取出简短的摘要等。 人工智能机器学习 神经网络 生成式模型 虽客然户我已们将无生法成详式尽人列工出智生能成应式用人程工序智用能于的以所下有常用见途领,域但:可以看到的是, •通过聊天机器人、虚拟助理、个性化或内容审核等功能改善客户体验 •通过对话式搜索、内容创建、文本摘要或代码创建来提高员工的工作效率 •加速各类创意内容(如艺术、音乐或动画)的制作 •通过智能文档处理、预测性维护、质量把控和视觉检测,或者通过数据增强,来简化业务运营 与所有人工智能一样,生成式人工智能也是由机器学习(ml)模型提供支持,而且使用的是基于海量数据进行预训练的超大型模型。这些模型通常称为基础模型(fm)。 值得注意的是,基础模型的核心是利用机器学习的新进展。像生成式预训练转换器(gpt)模型这一类的基础模型,通常被称为大型语言模型(llm),专门用于基于语言的任务,例如摘要、文本生成和开放式问答。大型语言模型之所以特别,是因为它们包含大量使它们能够学习高级概念的参数。 将数据置于生成式人工智能方案的中心 我们很早就知道,数据是企业的战略资产。然而,根据accenture的一项研究,即使对数据基础设施进行了投资,也只有三分之一(32%)的公司能够从数据中实现切实且可衡量的价值。 生成式人工智能有助于改善这种状况。生成式人工智能让您能够以全新的方式利用自己的数据,并从中挖掘出更多的价值。通过这种技术,您可以更迅速地基于自己的数据进行创新,在新型应用程序中充分利用这些数据,还能让传统上难以处理的数据(例如非结构化数据)充分发挥价值。 我们已经看到一些客户将数据与生成式人工智能相结合,改善了业务成果和客户体验。例如,intuit构建了intuitassist,这是一款新型的生成式人工智能助手,通过使用小型企业、消费金融和税务等领域的相关上下文数据集,为客户提供个性化的金融洞察。 clearhead是一家初创企业,能够提供创新的员工援助计划(eap),该计划力图让用户能够更轻松地在其健康平台上找到合适的治疗师,从而更好地获取心理健康支持,其中也包括改进数字化治疗师聊天机器人的应对能力。clearhead在amazonbedrock上使用amazontitan来增强聊天机器人提供的个性化体验,能够更好地结合具体情境进行讨论,使治疗师搜索更准确,并降低生成式人工智能的成本,带来更可预测的响应。 我们将从三个重点领域出发,为您剖析如何制定这种现代化数据战略: 1 2 3 利用您的数据打造特色生 成式人工智能应用程序 妥善奠定数据基础,通过 生成式人工智能充分发挥 让思维突破技术范畴, 当前数据的价值 通过生成式人工智能 创造竞争优势 6 这些应用程序令人振奋,而这些只是生成式人工智能给初创企业及其客户所带来价值的冰山一角。生成式人工智能还将以哪些方式改变我们的世界,人们仍在拭目以待。您是不是感觉自己进入到一个未知的领域,对于该如何实现生成式人工智能的巨大潜力感到茫然?实际上,使用生成式人工智能实现商业价值的方式与使用任何其它技术没有太大区别。这取决于您是否制定了足够强大的数据战略,以及您是否在该战略中明确了如何使用数据作为竞争优势。 您可能已经制定了数据战略,也可能刚刚开始制定。无论属于哪种情况,现在都是将生成式人工智能纳入战略的绝佳时机,如此方能让您实现更多商业价值。通过利用自己的数据实现差异化,您将把握前所未有的机会,获得可持续的竞争优势。 在本白皮书中,我们为创始人及其团队提供了洞见和后续行动建议,助力初创企业更充分地利用数据,打造出独有的生成式人工智能应用程序。要在这一领域进行创新和竞争,您需要制定全面的数据战略,还要将技术、业务优先事项、应用场景、员工和治理防护机制等全部考虑在内。总而言之,该战略代表了一种看待数据的现代化方法,可确保您从生成式人工智能应用程序中实现商业价值。 第1节 利用数据打造特色生成式人工智能应用程序 您的应用程序是一般通用型的,还是能够深入了解您的初创企业和客户?这两者之间的差别就在于您是否恰当使用了自己的数据。因此,您必须确定如何妥善利用自己的数据来精准把握自身业务的独特性,并将这些独特之处加以推广。对于大多数初创企业而言,部署生成式人工智能应用程序的起点都是开箱即用的基础模型(fm)。仅有少数初创企业会选择构建自己的基础模型,来支持其生成式人工智能应用程序,但这需要大量计算资源和高度专业的员工。 虽然开箱即用的基础模型功能足够强大,但从设计的角度看,这些模型都是一般通用型的。它们的名字已经说明了这一点:“基础”模型。这意味着这些模型没有根据您的业务需求进行调整,因为这些基础模型无法访问初创企业的新数据,或者无法执行特定领域的任务,因而无法满足用户请求。要利用生成式人工智能应用程序满足您的客户体验要求、内部知识、品牌风格和道德标准,您的数据是关键。 例如,如果您是一家在线旅行社,想要通过生成式人工智能应用程序为客户提供更好的旅行建议,那么您可能需要利用特定于客户的个人数据,例如过去的旅行、网页浏览历史记录和旅行偏好等等数据。您还需要访问有关相似旅行者的惯性和旅行清单的汇总数据,以便提供更好的建议。通过使用自己的数据,您就能为客户带来个性化且独特的体验。 此外,开箱即用的基础模型人人都可得而用之,因此只有使用自己的数据对其进行定制,您的生成式人工智能应用程序才能凸显出自己的不同之处。假设您还使用开箱即用的基础模型为您的在线旅行社起草营销文案,您的竞争对手可能也在使用相同的模型做同样的事情。这些模型在很大程度上使用的是同一个通用知识库生成内容。因此,如果不进行定制,可能会导致您和您的竞争对手创建出来的内容大同小异。 定制化创造出来的竞争优势是可持续的。有几种方法可以定制基础模型,其中包括微调和上下文学习等。 7 客户聚焦 作为全球交通数据和分析提供商,inrix正在构建以amazonbedrock为核心的新尊龙凯时人生就博的解决方案。尊龙凯时人生就博的解决方案用于实时提供最新信息,以便交通和安全工程师能够了解到街道上所出现的情况,事件发生的地点、时间和原因,以及如何应对。 这款新的amazonbedrock尊龙凯时人生就博的解决方案使用检索增强型生成(rag),利用超速和车祸事件等历史数据以及拥堵状态和当前天气状况等新近数据,来增强输送给底层基础模型的提示。 inrix通过使用自己的数据来增强amazonbedrock中的基础模型,可以快速回答客户提出的复杂问题,例如应如何改变道路才能缓解交通拥堵、尽可能减少事故,如何确定新零售商店的理想位置,甚至如何缓解下一场音乐会的交通和停车问题等等。 8 生成式人工智能数据新兴模式 训练自己的模型 利用特定数领据域训的练应出用深程度序了解 分子序列、编程语言示例数:据基训于练特模定型领域的 模型微调 使用特训定练领预域训的练数模据型进一步 知识领域丰富的客服坐席示例:尊龙凯时人生就博的技术支持聊天机器人 上下文学习 使用特定指领导域预的训私练有模上型下文数据 仅局限于某些领域的虚拟坐席示例:客服、账单服务 微调 使用开箱即用的基础模型时,您必须利用自己的数据来定制模型,从而满足您独特的业务需求。对于领域密集型应用程序,例如尊龙凯时人生就博的技术支持坐席或企业特有的内容创作,微调是一个不错的选择。借助amazonbedrock,您可以安全地使用自己的数据定制基础模型,并使用其它内置工具来构建了解您的业务、数据和客户的应用程序。 设想一下,一位服务于领先电子商务初创企业的内容营销经理,需要为即将推出的新手袋系列制作有针对性的全新广告和活动文案。为此,他们向amazonbedrock提供了一些带标签的示例,这些示例存储在amazonsimplestorageservice(amazons3)上的数据湖中,其中包含了他们在过去的活动中表现出色的标语,以及相关的产品描述。amazonbedrock针对客户另外各克隆了一套基础模型,只有该客户才能访问到自己的基础模型副本进行模型训练。训练结束后,amazonbedrock会自动为新款手袋生成有效的社交媒体帖文、展示广告和网页文案。 上下文学习 基础模型是在某个时刻训练的,每次数据集更改时都对其进行微调是不切实际的。一旦完成训练,基础模型就不会再摄取新的知识或数据了。如果需要额外的上下文来解决问题,基础模型也无法找到实时信息,因此也使用不到这样的实时信息。 为了提高响应的相关性且更符合上下文,不妨通过上下文学习为基础模型提供数据,这种技术通过提示工程或检索增强型生成(rag),引导基础模型获取特定领域的上下文数据。许多企业都使用检索增强型生成作为进行上下文学习的主要方法。检索增强型生成有便于您的基础模型使用到初创企业的新数据,从而提供更准确、更相关的响应。检索增强型生成通常使用向量嵌入(即,以数字形式表示的字词、短语或图像)。嵌入会对源文本或图像的语义含义进行编码,这样基础模型就能够更轻松地发现相似向量之间的关系并改善对提示的响应。 虽然您可以单独使用上述每种技术,但结合使用微调和检索增强型生成,将会更有助于您利用数据打造出颇具特色的生成式人工智能应用程序。 搜索相关信息 知识来源 2查询 1 3 提 示 为增而强获上取下的文 相关信息 查询 文字回应 生成的 5 4 提 示 增强版上下文 查 询 大型语言模型端点 第2节 为生成式人工智能奠定数据基础 您的数据是使用生成式人工智能应用程序创造价值的关键。因此,使用高质