重磅推出""系列产品,高效赋能产业投资及产业发展各种工作场景,欢迎试用体验! |
||||
---|---|---|---|---|
产品 | 核心功能定位 | 登陆使用 | 试用申请 | |
产业投资大脑 | 新兴产业 的高效挖掘工具 | 登陆 > | 申请 > | |
产业招商大脑 | 大数据精准招商专业平台 | 登陆 > | 申请 > | |
产业研究大脑 | 产业研究工作的一站式解决方案 | 登陆 > | 申请 > |
中投网2024-05-06 11:34来源:中投网
联系电话:400 008 0586; 0755-82571568
微信扫码:
1.1.1 2024-2028年中国人工智能大模型产业影响因素分析
一、有利因素
(一)政策利好
2023年7月20日,中国气象局印发《人工智能气象应用工作方案(2023-2030年)》。《工作方案》提出,加快布局国产人工智能气象应用技术体系建设,启动气象预报大模型等新兴技术研发,研发大数据驱动的人工智能气象预报大模型、会话式气象预报和服务智能网络机器人系统,深入开展人工智能算法的机理解释研究。
2023年8月10日,工信部和财政部联合印发《电子信息制造业2023-2024年稳增长行动方案》。《行动方案》鼓励加大数据基础设施和人工智能基础设施建设,满足人工智能、大模型应用需求。
2023年10月20日,工业和信息化部印发《人形机器人创新发展指导意见》。《指导意见》提出,以大模型等人工智能技术突破为引领,在机器人已有成熟技术基础上,重点在人形机器人“大脑”和“小脑”、“肢体”关键技术、技术创新体系等领域取得突破。开发基于人工智能大模型的人形机器人“大脑”,增强环境感知、行为控制、人机交互能力,开发控制人形机器人运动的“小脑”,搭建运动控制算法库,建立网络控制系统架构。
2023年12月15日,国家数据局发布《“数据要素x”三年行动计划(2024-2026年)》。《行动计划》提出,以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。同时,北京、上海、深圳、安徽、四川等省市也陆续出台大模型产业发展措施,加速大模型应用落地。
(二)AI大模型进入“群模时代”商业化曙光初现
(三)人工智能大模型向多模态趋势进发
虽然目前各类人工智能大模型层出不穷,但不断优化升级,推动行业进步仍是各大互联网公司的主攻方向。当前,人工智能大模型由单模态向多模态升级已成为行业热点,多家公司多模态AI走红。2023年11月,OpenAI发布了GPT-4 Turbo并且开放了GPTs,再次颠覆行业,揭开AIGC应用生态序幕,建立统一的、跨场景、多任务的多模态基础模型会成为人工智能发展的主流趋势之一。多模态是实现通用人工智能的必经之路。模态数据输入可帮助模型能力和用户体验提高,允许多模态数据输出也更符合真实世界需要。在数据、算法及算力上的要求都要高于单模态,这一波自然语言大模型发展为其他模态提供了技术参考,人工智能大模型产业有望加速发展。
(四)人工智能大模型赋能与应用不断提升
人工智能大模型绝不应该只停留在炼金术阶段,要不断推动大模型的发展变成科学的大模型,只有跟行业深度融合才有可能真正的实现可持续发展。
首先是从通用大模型向垂直大模型的转型,人工智能大模型未来发展将趋于通用化与专用化并行。2023年6月,腾讯云首次正式公布行业大模型研发进展,并发布了面向B端客户的腾讯云MaaS服务解决方案。2023年7月,华为发布“不作诗只做事”的盘古大模型3.0,深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。此外,面向旅游的“携程问道”、面向医疗的百度“灵医”大模型、面向教育的网易“子曰”大模型等也陆续发布。其中,金融行业的应用场景丰富,是最早进行数字化转型的机构,成为AI大模型落地应用的最佳场景之一。金融行业积淀了包括金融交易数据、客户信息在内的海量数据,良好的数据基础为AI大模型的落地应用提供条件。目前,生成和决策两类金融大模型,已在银行、证券等金融机构中实现落地。
二、不利因素
(一)数据质量和标注问题
人工智能大模型的训练需要大量的标注数据,然而标注数据的质量和数量都存在一定的问题。有些数据可能存在偏差和误导,有些数据则可能因为保密和隐私等问题无法获得。同时,由于标注数据需要大量的人工参与,也使得标注成本较高且难以实现自动化。
(二)大模型可解释性和可靠性问题
人工智能大模型往往非常复杂,难以解释其决策和行为的原因,这使得人们难以信任和使用大模型。同时,由于人工智能大模型的复杂性和巨量的参数数量,其可靠性和稳定性也存在一定的问题,需要进行更加严格的测试和验证。
(三)成本和计算需求方面有局限性
过去五年来,AI领域通常以参数的数量来衡量一个模型的能力。参数越多,通常意味着模型能处理更复杂的任务,展示出更强的能力。例如,最大模型的参数数量每年增加了十倍或更多,每次增加都带来了意想不到的能力扩展,如编程和翻译能力。所以大型神经网络模型通常被认为性能更优。
人工智能大模型使用的参数数量极多(有的超过1000亿个),每个参数都需要计算资源来处理。尽管大模型(如GPT系列)在技术上领先,但这些模型往往规模庞大且对计算资源的需求极高。每当大模型在能力上有显著提升时,大模型的训练和运行成本也急剧上升。即便智能大模型是开源的,许多研究者和小型企业也难以承担其所需的昂贵计算成本。不仅如此,许多AI研究者在这些模型的基础上进行迭代开发,以创造适用于新工具和产品的自己的模型,但大模型的复杂性也让其变得更加困难。
(四)国内外人工智能大模型的能力差距仍然存在
当前,我国与OpenAI的差距正在拉大,不是在缩小。在SuperCLUE测评中,GPT4-Turbo以总分89.79分遥遥领先,高于国内所有的大模型及国外的代表性大模型。国内得分最高的大模型是文心一言4.0,但距离GPT4-Turbo仍有15.77的分差。
现在国内主流的大模型的能力水平基本上在GPT3.5上下。
人工智能大模型的核心壁垒包括算力、数据、算法。只有极少的企业能够从头到尾地完成产业级研发。如今,模型参数指数级增长,训练所需算力巨大,千亿级别的通用大模型,训练一次就需要付出几千万的成本。当前国内已发布的大模型中,参数规模达到千亿及以上的厂商仅为10个左右。此外在美国最新一轮的封锁制裁下,国产化替代方案的需求更加迫切。但在很长一段时间内,芯片与算力仍会是国产人工智能大模型与ChatGPT之间一道巨大的鸿沟。
2022年,我国人工智能产业规模达到5,080亿元;2023年,我国人工智能产业规模约达到5,452亿元。
我们预计,2024年我国人工智能产业规模将达到5,874亿元,未来五年(2024-2028)年均复合增长率约为6.30%,2028年将达到7,500亿元。
数据来源:中投产业研究院
产业投资与产业发展服务一体化解决方案专家。扫一扫立即关注。
多维度的产业研究和分析,把握未来发展机会。扫码关注,获取前沿行业报告。