当前位置:数码通 > 趋势

什么是预训练的人工智能模型?

来源于 数码通 2023-10-04 14:36

预训练的AI模型是在大型数据集上训练以完成特定任务的深度学习模型。这些型号可以直接使用,也可以根据不同行业的应用需求定制。

如果我们想教幼儿什么是独角兽,我们应该首先向孩子展示这种生物的图像并描述其独特的特征。

那么,如果您想教人工智能 (AI) 机器什么是独角兽,您从哪里开始呢?

预先训练的人工智能模型提供了解决方案。

预训练的人工智能模型是在大数据集上训练以完成特定任务的深度学习模型。它是类脑神经算法的一种表现,可以根据数据发现模式或做出预测。预训练的人工智能模型可以直接使用,也可以根据应用的具体需求进一步微调。

为什么要使用预训练的人工智能模型?

开发人员可以使用预先训练的模型并根据自己的需求进行定制,而无需从头开始构建AI模型。

无论是识别虚构的马、检测自动驾驶汽车中的安全隐患,还是根据医学图像诊断癌症,要构建 AI 应用程序,开发人员首先需要一个能够完成特定任务的 AI模型。该模型需要大量的代表性数据进行学习。

该模型的学习过程需要将传入数据传递给多个层,并强调与每层目标相关的特征。

例如,在创建可以识别独角兽的模型时,首先向其提供独角兽、马、猫、老虎和其他动物的图像作为输入数据。

然后构建具有代表性的数据特征层。从线条和颜色等简单特征开始,逐渐发展到复杂的结构特征。根据计算的概率,这些特征将被分配不同程度的相关性。

例如,一种生物看起来越像马,它是独角兽而不是猫或老虎的可能性就越大。这些概率值存储在 AI 模型的每个神经网络层中。随着层数的增加,模型对表示的理解也会增加。

为了从头开始创建这样的模型,开发人员通常需要访问包含数十亿行数据的庞大数据集,这可能非常昂贵且难以获取。但如果你在数据上妥协,就会导致模型性能不佳。

预先计算的概率表示(也称为权重)可以节省开发人员或企业的时间、金钱和精力。可以使用这些权重来训练已经构建的预训练模型。

高质量的预训练模型与大量准确且具有代表性的权重相结合可以提高人工智能部署的成功率。

可以修改权重,并且可以通过添加更多数据来进一步定制或微调模型。

基于预训练模型构建的开发人员可以更快地创建人工智能应用程序,因为他们不必处理大量传入数据或计算密集数据层的概率。

换句话说,使用预先训练的人工智能模型就像根据自己的需求定制服装,而无需从面料和针线开始。

预训练的 AI 模型通常用于迁移学习,可以基于各种模型架构类型进行构建。一种流行的架构类型是 Transformer 模型,这是一种通过跟踪连续数据中的关系来学习上下文和含义的神经网络。

AI company Clarifai 平台高级副总裁 Alfredo Ramos 表示,预训练模型可以缩短 AI 应用程序一年的开发时间,并节省数十万美元成本。

预训练模型如何驱动人工智能发展?

预训练模型简化并加速了人工智能开发,许多开发人员和公司使用它们来加速各种人工智能用例。

预训练模型主要推动AI在以下领域的发展:

自然语言处理:预训练模型用于自然语言处理应用程序,例如翻译和聊天机器人。大型语言模型一般基于 Transformer 模型架构构建,是预训练模型的扩展。全球最大的 AI 模型之一 NVIDIA NeMo Megatron 是一个预训练的大型语言模型。

语音AI:预训练模型可以帮助语音AI应用程序直接用于不同语言。使用案例包括呼叫中心自动化、人工智能助手和语音识别技术。

计算机视觉:与上面提到的独角兽模型一样,预训练的模型可以帮助AI快速识别生物或物体、地点和人。这样,预训练的模型加速计计算机视觉为体育、智慧城市等领域的应用提供了类人视觉能力。

医疗:在医疗应用中,MegaMolBART(NVIDIA BioNeMo 服务和框架的一部分)等预先训练的 AI 模型能够理解化学语言并学习现实世界分子中原子之间的关系,为科学界提供了加速药物发现和开发的有力途径。工具。

网络安全:预先训练的模型为实施人工智能网络安全解决方案奠定了基础,并帮助人类安全分析师更快地发现威胁。包括人和机器数字指纹和异常、敏感信息以及网络钓鱼检测。

艺术和创作过程:为了推动人工智能艺术的最新浪潮,预先训练的模型可以借助GauGAN和NVIDIACanvas等工具加快创作过程。

预训练AI模型的定制和微调带来了无限的应用可能性,因此可以用于许多其他行业。

哪里可以获得预训练的 AI 模型

谷歌、Meta、微软、NVIDIA 等公司正在发明用于构建人工智能模型的尖端模型架构和框架。

这些模型有时会在模型中心发布或作为开源发布,允许开发人员微调预训练的 AI 模型,提高其准确性并扩展模型库。

NVIDIA NGC 汇集了GPU优化的 AI 软件、模型和 Jupyter Notebook 示例,包括各种预训练模型以及针对NVIDIA 人工智能平台。

NVIDIA AI Enterprise 是一款全面且安全的云原生 AI 和数据分析软件套件,其中包括未加密的预训练模型。这使得希望将 NVIDIA 预训练模型纳入其自定义 AI 应用程序的开发人员和企业能够查看模型权重和偏差、提高可解释性并轻松调试。

GitHub、Hugging Face 等平台上还有数千个开源模型可供使用。

重要的是,在训练预训练模型时,模型数据必须是透明的、可解释的、符合隐私的、基于同意且公正的道德数据。

NVIDIA 预训练 AI 模型

为了帮助更多开发者将他们的 AI 原型投入生产,NVIDIA 提供了几种开箱即用的预训练模型:

NVIDIA SegFormer 是 GitHub 上提供的 Transformer 模型,可实现简单、高效且强大的语义分割。

NVIDIA 专门构建的计算机视觉模型经过数百万张图像的训练,可用于智能城市、停车管理等应用。

NVIDIA NeMo Megatron 是 NVIDIA NeMo 附带的大型可定制语言模型。 NeMo 是一个开源框架,用于构建灵活、高性能的对话式 AI、语音 AI 和生物学应用程序。

NVIDIA StyleGAN 是一种用于生成对抗网络(或 GAN)的基于样式的生成器架构。它可以利用迁移学习无限生成各种不同风格的绘画。

此外,NVIDIA还可以提供:

NVIDIA Riva:一款 GPU 加速的软件开发套件,用于构建和部署语音 AI 应用程序,包括十种语言的预训练模型。

MONAI:由 NVIDIA 和伦敦国王学院联合开发的开源医学研究 AI 框架,包括用于医学成像的预训练模型

审稿编辑:唐子红

-->
登录后参与评论