【导读】华为AI模子量化相关专利公布,可减少AI模子占用内存
中国基金报记者 邱德坤
华为布局AI(东说念主工智能)鸿沟迎来热切发达。
天眼查泄露,近日,(以下统称华为)请求的“东说念主工智能模子的量化次序、处理系统和量化单位”专利公布,不错减少AI模子占用的内存。
本年以来,华为公开的AI鸿沟专利已达26项。2月5日,华为董事长梁华在广东省高质料发展大会上发言称,现时,AI本事正处于加快发展阶段,在千行百业的应用也迎来关节时辰,收拢新机遇的关节是立异。
记者细巧到,华为近期加大与DeepSeek的配合力度,包含华为ModelEngine解救DeepSeek全系列土产货部署,DeepSeek系列新模子适应上线昇腾社区等。
华为热切AI专利公布
专利节录泄露,华为这次请求的专利波及AI鸿沟,尤其波及一种AI模子的量化次序、AI模子的处理系统、量化单位和计较建立。
AI模子是哄骗数据和算法,对某一鸿沟或任务中的问题进行建模和管理。当今,部分AI模子如故应用在机器翻译、问答系统、和文本生成等鸿沟。
2月6日,华为中国发文称,在寰宇AI本事赶快发展的布景下,模子的快速迭代与高效部署成为各大科技企业竞相追赶的焦点。
不外,跟着AI本事发展,相关AI模子的限度越来越大,存在参数目较大、占用内存较多等问题,导致计较复杂度不休提高。
同时他们还点出了哈里斯。他在上半场就是拼尽全力限制,整体的斗志完全被激发出来了。只是除了防守之外,哈里斯在进攻端的发挥还是不够。不仅独,命中率也还糟糕,这是他必须要反思的地方。
为了管理上述问题,华为这次请求的专利提供了一种AI模子的量化次序。
专利节录泄露,量化单位不错基于启动AI模子的计较建立中各个计较单位的处理粒度,将量化矩阵分割成多个适用于各个计较单位处理粒度的分块量化矩阵。
量化单位不错对分块量化矩阵进行量化处理,从而得到量化后的分块量化矩阵,并存储在存储器中以减少AI模子占用的内存。
量化矩阵不错是权重矩阵,也不错是激活矩阵。量化单位在量化经过中,是基于启动AI模子的计较建立中各个计较单位的处理粒度进行量化,不需要基于张量级别进行离群值的统计,齐备AI模子对权重矩阵和激活矩阵王人不错进行及时量化。

华为与DeepSeek配合不休深远
2月6日,华为中国文书,华为DCS AI全栈管理有盘算中的热切居品—ModelEngine,全面解救DeepSeek大模子R1&V3和蒸馏系列模子的土产货部署与优化,加快客户AI应用快速落地。

据悉,ModelEngine手脚大模子磨真金不怕火、推理和应用开荒的AI平台,提供从数据预处理到模子磨真金不怕火、优化及部署的一站式职业。
华为中国先容,用户通过ModelEngine不错体验DeepSeek的高效推理技艺;开荒者通过ModelEngine可齐备对DeepSeek系列模子的“一键部署”,省去硬件选型、兼容性考证和环境建树等门径,大幅缩短企业AI应用门槛。
当今,华为旗下多个业务接踵与DeepSeek开展配合。
2月5日,基于原生鸿蒙操作系统的小艺助手App接入DeepSeek-R1 Beta(公测)版。升级至原生鸿蒙的华为用户,不错通过“小艺助手App-发现-智能体广场”与DeepSeek对话。
2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro适应上线昇腾社区,解救一键获得DeepSeek系列模子,解救昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更浅陋的AI开荒和应用体验。
公开贵寓泄露,DeepSeek最新发布的多模态大模子Janus-Pro,以及之前发布的大型话语模子DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,在AI鸿沟引起激烈反响,多项本事提高了模子性能与后果。
裁剪:晨光
校对:王玥
制作:舰长
审核:木鱼
版权声明
《中国基金报》对本平台所刊载的原创实质享有文章权,未经授权不容转载,不然将追究法律包袱。
授权转载配合相关东说念主:于先生(电话:0755-82468670)
下一篇:没有了