当前位置:首页 > 新闻资讯 > IT业界 > 新闻
华为AI大模型“盘古”究竟有多强
  • 2023/3/29 15:15:48
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:吴新
  • 作者:
【电脑报在线】继百度文心一言横空出世之后,被称为最接近人类中文理解能力的华为盘古大模型走进人们视野。

华为盘古大模型火了

周末,又被AI大模型刷屏了!


人民日报3月25日刊发《人工智能产业化应用加速》文章称,近几年,国内外厂商纷纷加码巨量模型的投入与研发,让人工智能产业落地找到了新的方向。新药研发就受益于此。


华为云盘古药物分子大模型,是由华为云联合中国科学院上海药物研究所共同训练而成的大模型,可以实现针对小分子药物全流程的人工智能辅助药物设计。

据介绍,西安交通大学第一附属医院刘冰教授团队利用盘古大模型成功研发出一种新的“超级抗菌药”,它有望成为全球近40年来首个新靶点、新类别的抗生素。借助大模型,先导药的研发周期从数年缩短至1个月,研发成本降低70%。


盘古大模型最早是由华为云在2021年4月正式发布。华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。

民生证券认为,盘古NLP大模型可以赋能千行百业,应用于各种场景。在智能营销领域,盘古NLP大模型可以通过文本匹配,问答和对话系统、意图识别等关键技术更好地赋能销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平,重塑消费者体验。


在智能舆情方面,盘古NLP大模型可以利用文档信息抽取、情感分类、文档自动摘要等技术在金融,电商,政务领域实现精准舆情分析、企业运营软件分析。


在AI本就火爆的当下,已经落地并实现经济价值的盘古NLP大模型自然很容易成为市场关注的焦点,而在


盘古大模型能为我们做什么


据悉,最新的“盘古”大模型将于4月发布,而在发布之前,已经有机构称赞其为“这将是超过任何其他类似应用的最先进、最强大的自然语言处理应用;开源证券亦将其称为对标 ChatGPT的产品!”


资料显示,初代华为盘古大模型发布于2021年,其是基于昇腾计算产业生态,产业链和昇腾生态产业链重合,主要分为应用软件伙伴、IHV硬件伙伴、整机硬件伙伴、一体机解决方案伙伴、辅助运营伙伴。


通过模型泛化,华为盘古大模型可解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,目前该模型已经在金融、气象、工业等多个领域落地应用。


其中,盘古NLP大模型已在在智能舆情、智能营销等场景落地,正取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统。


在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,多项子任务得分业界领先。其模型参数最高达2000亿,远高于此前的第三代GPT。

在具体应用上,以盘古气象大模型为例, 盘古气象大模型提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。


同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。

同时,华为云官网上还晒出了多个盘古大模型的产业化应用案例,包括与国家电网合作的无人机电力巡检以及与广发证券合作的企业财务智能预警等项目。与广发证券的项目显示:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。


据了解,某些海外明星项目可能因为场景存在一定的专业性,模型未建模相关知识,导致效果欠佳。相比起某海外明星项目的语义理解、对答等功能外,盘古大模型的涵盖范围更广,产业化应用趋势更强。


当前人工智能进入大规模落地应用关键期,华为拥有全栈全场景Al解决方案,从芯到云,从训练到推理,从硬件到软件,从框架到生态,随着专业领域应用的落地和推进,华为盘古绝对能在4月给大家带来惊喜。


国内AI划时代飞跃

大模型增强了AI技术的通用性,未来,大模型有望于场景深度融合,配合专业工 具和平台支持应用落地,开放的生态来激发创新,形成良性循环。头部企业均采取“模型+工具平台+生态” 三层共建模式,有助于业务的良性循环,也更容易借助长 期积累形成竞争壁垒。 


而除华为、百度两家之外,国内其他科技巨头同样在大模型领域有所布局。


阿里-通义大模型:2022年9月,在阿里巴巴达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上,发布 “通义”大模型系 列,并宣布相关核心模型向全球开发者开源开放。 


阿里达摩院基于其 AI 统一底座构建了通用模型与专业模型协同的层次化人工智能体系。统一底座层:M6-OFA模型作为单一模型,在不引入新增结构的情况下,可处理超过30种跨模态任务。 

腾讯-混元大模型:2022年4月,腾讯首次对外披露HunYuan大模型,协同了腾讯预训练研发力量,完整覆盖NLP大模型、 CV大模型、多模态大模型及众多行业/领域任务模型。 


而太极是腾讯自主研发的一站式机器学习生态服务平台,为AI工程师打造从数据预处理、模型训练、模型评估到模型服 务的全流程高效开发工具,为大模型的训练提供了有力保障。


在具体应用场景上,百度具有搜索、小度智能音箱等应用场景;腾讯具有微信、QQ、游戏等应用场景;阿里具有电商、钉钉等应用场景;华为在2B应用方面独具优势。未来各家将结合自身优势,发力大模型研发及应用落地,我国的大模型产业将迎来快速发展阶段。


各大巨头目前在大模型技术上基本同源,且都具有资金、算力、人才、数据等发展条件,未来有望成为我国大模型的第一梯队。

编辑|张毅
审核|吴新
本文出自2023-03-27出版的《电脑报》2023年第12期 A.新闻周刊
(网站编辑:ChengJY)