当前位置:数码通 > 数码

不同版本的大机型有哪些优势?

来源于 数码通 2023-10-04 17:54

从去年ChatGPT的盛大发布,到今年的“百模大战”,大型模特赛道一直热闹非凡。

今年8月31日,首批8家国内大型模型企业通过《生成式人工智能服务管理暂行办法》注册,获准向社会开放服务。这些大模型包括上海人工智能实验室的学者通用模型、商汤科技“讨论”、百度的“文心一言”等。

从源头上来说,ChatGPT 由自然语言理解和自然语言处理两项技术组成。之所以受到关注,是因为它是一个大模型,对应着大数据、强计算、好的算法。有人说原理是这样的,就像踢足球就是带球射门一样,但想要像梅西那么出色,并不容易。

今天,我们就来看看有哪些追上了大车型潮流的“张江版大车型”?他们各自的优势有哪些不同?

大观资料:《曹植》大语言模型

3月,大观数据研发团队基于多年文本智能技术积累和垂直领域场景业务经验,积极探索大语言模型(LLM)实践,开发出国内版GPT模型—— 《曹植》大语言模型。

7月,在2023世界人工智能大会上,大观数据正式发布了名为“曹植”的大型模型。这是国内第一个自主可控、致力于垂直行业的国产GPT大语言模型。能够精准完成多类型、复杂结构的长文本书写,自动起草多类型文档,未来还将实现长文档中的表格、图表、图片等多模态内容生成。

作为垂直、专注、自主、可控的国产版ChatGPT模型,“曹植”是如何诞生的?

大观数据成立于2015年,一直深耕NLP(自然语言处理)领域,在金融、政务、制造等垂直领域积累了大量数据。 2017年,谷歌在发表的论文中提出了NLP关于“理解”和“生成”的两条技术路线。基于当时大观数据的优势资源和未来发展,他们从一开始就选择了“理解”这条技术路线。今年,利用知识图谱、文本识别等技术开发的IDP智能文档审阅系统进入市场。

随着人工智能的不断发展,机器智能处理长文本的需求日益迫切。随后,大观数据投入大语言模型的开发,这就是今天“曹植”大模型诞生的起点。

“长文”是“曹植”大模型的目标任务。与一问一答的简单短文本生成不同,“草志”大模型可以精准完成多类型、复杂结构的长文本书写。

以金融信用报告为例。银行金融信用报告往往从40页开始,60页以上的报告也很常见。依靠员工“努力”效率太低,而大模型会自动起草多种类型的文件。同时具有自动排版、智能纠错、文字润色、自动摘要生成等特色功能;支持中、英、法、德、日、韩等数十种语言书写,辅助手工劳动,大幅提升办公效率;另一方面,在长文档翻译中,可以实现原文标题、段落等内容1:1排版还原,提供实时翻译体验,广泛应用于多语言密集处理场景文件。 “以后员工要做的就是写提示、提纲、核对数字,剩下的就可以交给大模型了。”大观数据创始人兼CEO陈云文表示。

这也是国内大规模语言模型中第一个工业应用级模型。除了目前在金融领域的应用,“曹植”还掌握了撰写白皮书、技术报告和品牌故事的智能协作。能力。

同时,为了以更低的成本、更高的效率推动“曹植”大模型在各个垂直领域的落地应用,大观数据正式推出私有化大模型一体机。私有化的“曹植”大模型一体机内置了大观数据全栈自主研发的“曹植”大模型。支持三方开源模型库,可一键部署企业内部大模型应用,可同时服务多个垂直大模型业务。提供智能文档审阅、智能知识管理、知识搜索与问答、智能文档写作、智能推荐等智能服务,支持并拥有安全便捷的AI训练、推理、长文档写作、机器翻译、语义分析评论、知识问答、text转sql等场景功能应用,“曹志”强大的功能使其一经推出就受到高度好评释放。

云从科技:融合大模型

5月18日,云从科技研发的融融模型正式亮相,展示了其在智能问答、城市管理、智能制造、智慧金融、游戏、文创等领域的超强能力。云从科技董事长兼总经理周曦指出,从容大模式将以问答、陪伴、主持三种渐进形式颠覆传统交互方式。其中,“问答”与现在的GPT类似; “陪伴”是指AI会像朋友一样陪你做很多事情; “主持”是指一件事情主要交给AI去做,类似于网游中的“挂机”。火车'。到了托管阶段,人们就可以“解放”去做更有意义、更有趣的事情。 ”.

从大模型的三个重要维度:算法、算力、数据来看,云从科技的先天优势帮助其建立了技术门槛。

在算法方面,云从科技先后在NLP(自然语言处理)、OCR(光学字符识别)、机器视觉、语音领域不断发展2020年多领域预训练大模型的实践,不仅进一步提升了公司核心算法的性能,也大幅提升了公司的算法生产效率,并在城市治理、金融、智能制造等行业得到体现应用程序。价值。

在算力方面,云从科技拥有强大的算力资源储备,未来预计拓展至数万张卡,并计划与各行业龙头企业合作,打造不同行业大模型推动行业数据。智能化建设。

在数据方面,云从科技拥有行业专业数据的先发优势。大型行业模型需要专业领域的知识。如果不是一直在努力的行业资深人士,基本上很难积累相关数据。云从科技在这方面有着不可多得的优势。多年来在多个领域实践了“预训练大模型+下游任务迁移”的技术范式,产生了多个规模不足百亿参数的模型。经过与各垂直领域企业的长期密切合作,云从通过大规模场景数据训练不断优化算法平台,培养了针对不同行业独特的数据分析和应用能力。

8月21日,云从发布了云从容大模型1.5版本。该版本包含十亿级、百亿级、千亿级型号的规格。实测成绩在全球大型模型综合考试评估(C-Eval)百亿百亿中排名第一,总榜第四。为了解决大模型实现的问题,Conong 1.5版本的重点是130亿参数的行业大模型。该模型是从数千亿个大型模型中提炼出来的。 52类测试指标中,44类超过ChatGPT,29类超过GPT。 -4。这距离融融车型正式发布仅3个月时间,可以说进展很快。

百度:文心一言

8月31日,百度生成式人工智能产品“文心一言”正式对外开放服务,这也意味着该申请已通过《生成式人工智能服务管理暂行办法》备案,成为国内首个合规在线应用。生成型人工智能产品。

据悉,百度还将开放一批全新重构的AI原生应用,让用户充分体验生成式AI的四大核心能力:理解、生成、逻辑、记忆。

温馨一言于今年3月16日上线测试,立即引起广泛关注。截至5月,已有300多家生态合作伙伴参与内部测试,并在400多个企业内部场景取得测试结果。 8月31日开业当天,百度系列AI原生应用也“一闪而过”上线,取得了不错的成绩:

百度文心一言首日共解答用户提问3342万条。 “文心一言App”迅速登顶苹果免费应用排行榜,首日用户突破百万;文心一言开业首日,百度搜索生成智能引擎解决的请求量已超过3亿次。当日访问百度搜索“AI合伙人”的用户数突破400万;百度文库“AI for PPT”等文档制作功能访问量突破200万次。经验。距离5月份的百度万象大会表示“用AI原生思维重构百度移动生态”仅过去百多天。大车型时代的技术进步可以说是日新月异。

事实上,从多年前“All in AI”开始,百度就开始了在AI领域的全栈布局。近十年来,百度累计研发投入超过1400亿元。 2022年,百度核心研发费用为214.16亿元,占百度核心营收的22.4%。研发的密集投入,让百度不断积累和发展,成为全球少数拥有应用、模型、框架、芯片四层全栈布局的AI公司之一,实现了终端端到端优化,并在各个层面取得成功。拥有行业领先的自主研发关键技术。

文心一言的基础车型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也在十余项国内外权威评测中继续稳居第一。百度透露,文信大模型4.0预计年底推出。

编辑:黄飞

-->
登录后参与评论