昇腾AI引领大模型新未来?

DeGao 2025-09-05 00:47:16

机器之心原创

作者:杜伟

在近日华为全联接大会 2022 中,昇腾 AI 为大模型开发、落地探索出一套完整搞定方案 ,并携手产学研各界围绕大模型前沿探索与发展方向实行探讨,

每年 9 月第四個星期日为国际级聋人节,全球约有 2.5 亿听障人群,在无声世界中,他们中大多数人须要依靠手语交流,但是,熟练理解、掌握手语并非一件易事,手语学习也往往面对种种困难,

一方面,仅仅依靠手语交流,时而无法准确理解对方意思,另一方面,手语词汇更新慢,难以学习新知识,另外像口语一样,手语在不同样地域也存在着「方言」,准则不同,导致互识难度较大,如今,AI 尤其是大模型正在改善这一困局,

为让听障人群更容易理解手语以及更轻松学习手语 ,千博信息、中国科学院自动化研究所根据昇腾 AI 开发手语多模态模型并打造手语教考一体机 ,手语教考一体机实行手语动作与示意文字、图像联动,在识别到文字信息后自动演示相应手语动作并生成对应图像,使得手语学习更加直观、丰富,

反而,手语多模态模型并非从零开始训练,它背后是华为联合中科院自动化所推出根据昇腾 AI 打造全球最先個图文音三模态大模型紫东. 太初,只需一個大模型就能支撑图文音全场景 AI 应用,在手语学习这一应用场景中,根据紫东. 太初手语多模态模型更是加入实时手语手势识别等功能,这是大模型落地应用「牛刀小试」,


微博 @AI 千言

但应看到,虽说业界发生很多与行业结合大模型,但当落到具体应用场景时却又大概无从选择,就使选对契合应用场景大模型,时而也会由于适配、部署等原因而运用不便,影响到商业落地,紫东. 太初是搞定这些难题一個典范,凭借图文音基石任务性能提升,它在多模态内容理解、搜索、专家推荐、问答、语音识别、合成等应用中具有巨大市场价值,同时向业界开放多种 API,让协作伙伴根据自身场景孵化更多行业应用,也更有大概实行商业价值,

紫东. 太初只是大模型发展全景一一部分,伴随 AI 大模型持续独创,像千博手语这样落地应用将层出不穷,而为更好地持助大模型发展,华为更是联合产学界协作伙伴构建从规划到开发部署再到产业化落地「全流程使能大模型」体系,大模型规划、开发与产业化这三個方面缺一无法,

先说,大模型发展遵循规划先行原则,中国科学技术信息研究所正在牵头与产业界协作伙伴一道规划大模型地图,有序耀领独创方向;大模型开发是基石,昇腾构建一站式大模型开发使能平台,实行易开发、易适配、易部署;产业化落地是检测大模型本事要紧指标,华为携手协作伙伴围绕各個领域大模型形成产业联合体,打通科研独创、产业落地,真正赋能各行各业,

下面为华为全流程使能大模型体系全景图,


「按图索骥」,中国大模型发展尽在掌握

当前,大模型要紧性日益凸显,国内加快自身大模型发展步伐,头部高校、科研机构与企业联手发挥起主力军作用,纷纷拓展大模型本事,独创发展模式,同时各地建设 AI 计算腹地也为大模型孵化供应充足算力支撑,

到 2021 年,我国大模型数量已经达到 21 個,如根据昇腾 AI 鹏程. 盘古、紫东. 太初等典型千亿参数级大模型,不客气地说,我国大模型发展已经走在世界前列,但综合来看,国内大模型发展集中爆发于最近一两年,仍处于早期阶段,难免存在不够之处,这时对我国大模型发展现状、痛点、前景实行全方位解变得很有必需,

因为这個,中国科学技术信息研究所联合相关研究力量,一道对中国人工智能大模型发展露状展开调研,形成《中国人工智能大模型地图研究报告》,其中以可视化格局,从分布、要素、活跃度、应用等四個维度总结中国大模型阶段性发展特征,并对存在难题实行剖析,

四個维度涵盖大模型方方面面,当前我国大模型发展现状、难题一目然地展露在面前,以分布为例,咱们大模型在地理上分布较广,最先选坐落北京、深圳、武汉、西安等新一代人工智能发展试用区,领域分布也不均衡,以 NLP 、多模态为主,另外还面对着要素缺乏统筹、开发过程缺乏协作、行业落地困难、赋能实体经济不够等亟待搞定难题,

搞定这些难题并非易事,须要多方主体、多领域、多手段多管齐下,因为这個,中国大模型地图针对性地提出搞定方案,涵盖统筹规划大模型发展布局、汇聚大模型发展要素、在算力方面增强发展人工智能计算腹地、算力网络、强化场景独创、增强政府持助、鼓舞产学研各界携手等,

就其意义而言,中国大模型地图不光为想要投身该领域学界、业界玩家供应明确图景,况且为下一步统筹规划大模型发展、积极探索产业赋能供应有效方法工具,不久之后后,完整版《中国人工智能大模型地图研究报告》将于「2022 年中关村论坛」上正式发布,大家可以期待一下!


开发、适配、部署齐头并进,全方位使能大模型开发

虽说大模型变成当前 AI 发展要紧方向,但说到开发,大模型似乎只有头部高校、科研机构、大厂才干玩得起,从数据采集、到模型训练、微调、部署,整個过程要耗费难以想象资金、时间,一般企业、机构无疑是承担无法,这在一定层次上限制大模型丰富性、延展性,

如何搞定这一难题呢?今年 6 月,华为推出根据昇腾 AI 打造大模型开发使能平台,从大模型开发套件、大模型微调套件、大模型部署套件三方面真正实行易开发、易适配、易部署,该平台也变成华为「全流程使能大模型」体系至关要紧一环,


其中在大模型开发阶段供应高性能 Transformer API,这是一种高度封装接口,在算法开发、分布式训练上只需极具少修改,就能像搭积木一样高速构建出复杂而浩大模型,同时在存储等底层硬件上,大模型开发使能平台也做很多改良以提升疗效,另外,昇腾 AI 社区已经训练过众多大模型,同时经由将十多個主流预训练大模型开放到昇腾社区, 开发者能直接调用,高速完成二次开发,

昇腾社区:https://www.hiascend.com/

须要注意是,华为开放主流预训练大模型,不光供应祥明训练代码,比方说分布式训练策略、分布式数据迭代逻辑或者具体模型结构代码,同时还供应具体模型预训练权重文件,极具易于开发,咱们既可以方便地调用预训练大模型直接实行占卜,同时在自己领域数据上做增量训练或者微调也极具简单,

另外大模型使能平台也是易于适配,能适配到各类相关任务与领域,大大降低模型微调中各类搞定过程复杂度,简单来说,昇腾 AI 已经持助众多微调套件,从最基石数据标注到小样本训练,再到一键微调与超参数调优,整個微调流程简单易用地完成,目前紫东. 太初就根据微调套件,供应开放服务平台 ,协助运用者便捷完成场景适配,

紫东.太初大模型开发服务平台链接:https://taichu.cn-central-221.ovaijisuan.com/home

在大模型开发使能平台中,模型也是易于部署,有现成工具实行多卡分布式推理、轻量化推理,其中轻量化推理极具诱惑人,因昇腾 AI 供应自动剪枝、蒸馏、量化等模型压缩工具,不须要咱们手动一步步尝试各类压缩算法来找到一种合理方法,于是节省大量工程方面就业,

打個比方来说, Int8 量化推理,先说就要做量化训练,在计算图中插入各类量化及反量化算子,于是能以最小疗效代价获得最大速度提升;再讲还须要适配 CANN GraphEngine〔对于昇腾计算设备〕;最后才是放到计算设备上实行推断;整個量化过程会遇到很多模型上工程难题,也会遇到很多底层计算上工程难题,所以说,昇腾 AI 自动化模型压缩工具,将大大降低模型部署本钱,

真正做到大模型开发、适配、部署「易」却不容易,昇腾 AI 基石软硬件平台为大模型开发使能平台夯实基石,过去三年,华为在硬件、软件、行业 AI 搞定方案、开发者数量方面都收获颇丰,就在刚刚过去华为全联接大会 2022 上,昇腾 AI 基石软硬件平台又迎来全面升级,


一方面,华为官宣年底将 CANN 异构计算架构升级到 6.0 版本,开放底层开发体系,提升 CANN 易用性,算子自定义开发效能实行倍级提升,在大模型本事持续增强基石上,昇思 MindSpore 2.0 升级为 AI 融合框架,进一步构建对科学智能持助本事,昇腾训练、推理搞定方案也全新升级,易用性、性能得到全面提升,另一方面,昇腾 AI 全力于使能人工智能计算腹地建设、算力网络,并将算力向社会开放,

在可以预见后世,伴随昇腾 AI 基石软硬件平台持续升级,大模型使能开发平台将为更多玩家入局以及丰富整個领域供应无限大概 ,

大模型落地,产业联合体势在必行

大模型应用是实行其价值最后一环,因为这個探索大模型落地新方法、新模式变成绕但是研究课题,但最难也在于此,到底场景千变万化,实际应用也会遇到各类意想不到困难,在这一过程中,学界、业界一道参与尤为根本,当前大模型独创虽层出不穷,但真正走到产业化落地为数不多,

华为经由前期与业界伙伴一道探索,开创一条大模型产业化落地新模式,就围绕某個领域大模型成立产学研用产业联合体,打通科研独创到产业落地整個流程,这样一来,大模型独创既可以更准确地契合行业场景需求,又能够促进产业协作伙伴直接根据大模型独创孵化行业应用,

这种大模型产业化新模式已经取得丰硕成果,2021 年底,华为与协作伙伴根据全球最先個三模态大模型紫东. 太初、全球最先個智能遥感框架武汉. LuoJia,分别成立多模态人工智能产业联合体、智能遥感开源生态联合体,今年 9 月,华为围绕业界最先個工业流体仿真大模型「东方. 御风」以及西工大 AI 湍流大模型成立智能流体力学产业联合体,


目前,多模态人工智能产业联合体已经发展 45 家成员单位,并根据紫东. 太初大模型在智能制造、智慧城市、智慧文旅等数十個行业中孵化近 60 個独创应用,

除前文提到千博手语教考一体机,杭州市文旅局、杭州移动根据紫东. 太初打造杭州智能文旅虚拟人「杭小忆」,其具备图文音 AI 本事,供应中文问答、诗文生成、以文搜图等功能,经由交互式体验让你身临其境地解杭州文化,


虽说已经有一些卓有成效落地应用,但多模态人工智能产业联合体对于后世有更广阔发展规划,先说发布「紫东. 太初」大模型开放服务平台,持助模型小样本训练、一键微调,满足大模型落地产业多样需求;再讲开源当前业界最大中文多模态训练数据集「紫东. 太素」,加快企业场景化独创速度;最后为大模型加入知识约束,将大模型与行业场景深度结合,构建从现实世界学习知识本事,

同样,智能遥感开源生态联合体也已发展 39 家成员单位,孵化 30 多個搞定方案,对于后世发展,智能遥感开源生态联合体也将持续科研独创,在智能解译精度、适用性、鲁棒性等方面持续突破;开源开放 LuoJiaNET/SET 服务平台,助力智能遥感行业应用高速构建;后续也会丰富更多 API 提升客户运用便捷性,

接下来,华为还将继续与协作伙伴一道围绕电磁智能、智慧育种、 AI 生物制药等领域成立产业联合体, 促进这些领域大模型独创、产业化落地,

结语

咱们晓得,从 Bert 、 GPT-3 以来,炼大模型潮流已经无法阻挡,大模型可以增强 AI 通用性,更变成 AI 技术、应用新基座,但顺利发挥大模型在融合科技独创、赋能产业化落地中作用,还须要参与各方采纳行之有效发展战略,

作为领域要紧参与者、推动者,华为全力于联合学界、业界伙伴形成完整大模型发展路径,从基石计算设备,到大模型训练、微调、推理部署全流程,再到创建大模型产业联合体,构建一套融合易用性与强性能大模型完整搞定方案,

后世,持续大模型自身独创、跨越科研与应用之间鸿沟势必然变成华为以及业界其他大模型玩家长久命题。

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯