OBT商业科技观察

ChatGPT PK国产大模型:差距与中国路径

        ChatGPT4这种酷似“人类”的聊天机器人的诞生,让业界惊叹之余,也引发了人们的担忧,以致于以马斯克为代表的上千名美国科技人士联合签名“暂停半年期研发”。ChatGPT4的诞生,犹如潘多拉魔盒,可能会让人类走向不可预知的技术深渊。

      不同于美国ChatGPT4在多模态大型语言(NLP)模型方面的领先水平,中国人工智能(AI)的类ChatGPT平台,如华为盘古大模型4、阿里通义千问、百度文心一言等,目前更倾向于把研发方向聚焦在“解决产业技术壁垒问题”。而且来自知危编辑部的最新测试也显示,在解读中文语义方面,国内AI大模型不比ChatGPT逊色,比如阿里通义千问甚至略胜一筹。

      国产AI大模型与ChatGPT4的差距在哪里?目前发展如何?

解读中文语义的差别有多大

      紧随ChatGPT的发布,今年3月,百度率先发布文心一言大语言模型。现场演示效果不尽人意,却让大家看到了国内外自然语言处理(NLP)大模型方面的差距,以及百度抢占大模型市场的心态。

      4月6日,华为云宣布“即将上线”盘古大模型4系列,包括NLP(自然语言处理)大模型、CV(计算机视觉)大模型、多模态大模型、科学计算大模型等多个大模型。即将发布的盘古“NLP大模型”是被认为最接近人类中文理解能力的AI大模型。

      4月7日,阿里云自研大模型“通义千问”开始邀请用户测试体验。

      4月9日,知危编辑部对比测试了阿里通义千问、百度文心一言、ChatGPT三家大模型在中文语义方面的解读, 结果显示,1、对带有场景和语气的语义理解能力方面三者之间有高有低,不分伯仲,尤其是对刁钻的中文句子的理解方面,ChatGPT不如通义千问和文心一言。2、在逻辑、推断能力上,三家的水平也是旗鼓相当,而通义千问似乎更严谨一点,某些时候能考虑到更多因素。3、文心一言在人文文学领域稍强;通义千问在报告文章方面稍强,尤其擅长科学类知识,基本与 ChatGPT( 3.5 版本 )持平或稍有一些瑕疵;ChatGPT 则是比较均衡。

       据悉,早在2021年,华为云就发布了盘古系列超大规模预训练模型,包括 30亿参数的视觉(CV)预训练模型,以及华为云与循环智能、鹏城实验室联合开发的具有千亿参数、40TB 训练数据的中文(NLP)预训练模型。在2021年的中文语言理解评测基准 CLUE 榜单中,盘古 NLP 大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分 83.046,多项子任务得分业界领先, 接近人类水平(85.61)。

      公开数据显示,华为盘古 NLP 大模型早在2021年就具有千亿参数,阿里通义千问号称是世界首个突破 10 万亿参数的 AI 大模型,阿里还牵头搭建了国内国模最大的 AI 模型服务社区 “ 魔搭 ”;百度文心一言的数据参数级别是1.5万亿级别。ChatGPT-3模型使用了1750亿个参数, ChatGPT-4的参数更多,而且训练数据来源于截至 2021 年 9 月的各种类型的文本,如网页、书籍、论文、新闻等,这些数据涵盖了广泛的主题和领域。

      谈到国产AI大模型与ChatGPT的差别,华东政法大学人工智能与大数据指数研究院院长高奇琦教授在接受《解放日报》采访时表示,通用大模型是一个系统工程,算法、数据和算力这三个因素至关重要。目前,国内外的差距主要集中在数据和算力。

      在数据方面,英文数据质量比较高,也更便于清洗。ChatGPT回答得好的原因主要就是互联网上有大量比较准确的英文知识类信息,有利于模型训练。中文数据也很多,但质量有差距,而且国内数据大量储存于移动端APP中,比较难于抓取,互联网巨头之间的数据又相互封闭,数据孤岛化情况严重。算力是另一个巨大的挑战,ChatGPT需要至少3万张英伟达A100卡的算力,这笔投资巨大。相比国外ChatGPT由微软等大企业、大资本投资,如果国内要追赶,需要国家层面的算力投资和支持。

国产AI大模型更关注产业应用

      ChatGPT-4是一个多模态大型语言(NLP)模型,即支持图像和文本输入,以文本形式输出;在“模拟人类”的文本输出方面达到领先水平;相比之下,国内大模型种类多样,更偏向于探索产业应用,用于解决产业技术壁垒问题。

      举例来说,华为盘古大模型的研发目标是通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。具体来看,NLP大模型对应内容生产和内容理解;CV大模型为分类、分割和检测;多模态大模型具备跨模态检索、跨模态生成、看图说话四种能力;科学计算大模型则分为分子大模型、金融大模型和气象大模型。

      华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成了“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

      盘古气象大模型是首个精度超过传统数值预报方法的AI方法,预测精度在1小时到7天内均高于传统数值方法(欧洲气象中心的operational IFS)。同时,该模型还能够提供秒级的全球气象预报,包括位势、湿度、风速、温度、海平面气压等信息。

      西安交通大学第一附属医院(以下简称西安交大一附院)刘冰教授在新药研发的工作中采用了基于华为云盘古药物分子大模型打造的AI辅助药物设计服务,突破性地研发出一款超级抗菌药Drug X,并打破了医药界“双十定律”——一款创新药从研发到上市,平均成本超过10亿美元、研发周期大于10年。Drug X有望成为全球近40年来首个新靶点、新类别的抗生素,其靶点特质决定了细菌将难以对Drug X产生耐药性,对抗疟(即疟原虫)药物研发等多个领域有着重要的影响。华为云盘古药物分子大模型让先导药的研发周期从数年缩短至一个月,研发成本降低70%。

      早在2022年阿里也将AI应用于电力调度,联合电网研发出的高精度电网负荷预测模型,已经在山东德州落地。该模型的母线负荷预测准确率在AI介入后,能将预测耗时从之前的1个多小时缩短为几分钟,可以有效应对大规模光伏并网带来的冲击,促进了电网安全稳定运行。
      巡检机器人在电网领域的落地应用也比较成熟。巡检机器人通过高精度定位,以及AI语音、图像等识别技术,能够在恶劣环境下完成人工很难完成的作业,通过规模化作业,大幅度提高作业效率,甚至通过深度学习技术,能够针对台风等自然灾害进行电网灾害风险动态评估。

      百度文心一言则更偏向于文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的能力,希望实现行业知识的数字化、模型化,从而推动AI应用的规模化。据百度有关人士介绍,传统行业企业擅长构建产业级模型库,百度缺乏行业经验,但可以将厚重的专业知识训练成AI模型,双方联手可以共创有价值的AI行业大模型,比如企业把无形的行业经验为翻译为数据“原料”,大量的优质原料投入到百度AI训练框架中,大数据经过大算力“暴力烹饪”形成大模型。

      百度表示,只有补齐了产业数据短板,企业级数据资产的变现才有可能像GPT-4一样实现质的飞跃:预置了“高工级”知识图谱的AI模型,按照摩尔定律的训练速度,带来生产流程的提效、工具降本、风险预判、商机洞察等。

      目前百度已经与国网、浦发等行业头部联合打造了能源电力、金融行业模型,产业级模型库已经开跑。模型即服务(MaaS,model as a service)也有望成为未来的新型整合式云计算提供方式。目前已有650家伙伴加入文心一言生态。
      相比之下,中国信通院有关人士也表示,国产AI大模型更能够满足国内行业需求,而 ChatGPT的主流数据集和评估基准多以英文为主,缺少中文,更缺乏对国内产业行业的理解,难以满足关键行业应用需求。