ChatGPT的发布掀起了新一代人工智能发展浪潮,将人类科技文明推向了通用人工智能时代,AIGC基础层的通用大模型成为国内外厂商纷纷布局的领域。
浪潮涌现以来,各类机构陆续推出大模型测评体系,但多基于问题集的训练方式开展测评,很少从用户实际使用体验感知方面进行评价。本次,甲子光年智库面向大模型实际使用者开展产品使用后的体验感知测评,以期从用户视角提供评价维度参考。
甲子光年智库基于原创的科技发展三大定律推导出两大核心路径作为甲子星空坐标系的两大关键维度:以智能化水平反映先进性,以赋能空间反映普适性、应用广度。两大关键维度展开九大细分评测维度,以此设置测评指标与用户评价调研问卷,以评价AIGC通用大模型产品的水平高低。
本次调研测评对象是AIGC通用大模型类产品。后续甲子光年智库将持续发布相关结果,并将持续开展AIGC中间层、应用层等测评并推出甲子星空坐标系。
本次测评对象为AIGC基础层通用大模型产品
甲子光年智库认为当下的AI技术栈不能满足ChatGPT推动的新一代人工智能浪潮,未来的AI技术栈将呈现新的技术架构体系。
甲子光年智库将新一代人工智能的技术架构划分为五层:算力层、平台层、基础层、中间层和应用层。其中,基础层、中间层和应用层可归纳为算法层。基础层主要是通用大模型,以大数据、大算力、高投入和高能耗为特点,中间层主要是专用/行业大模型,应用层则主要是个性化场景微模型和应用产品。本次AIGC大模型测评对象为基础层,即AIGC通用大模型产品。
测评指标体系:智能化水平×赋能空间
甲子光年于2023年4月25日提出人类科技发展存在三大定律:
- 定律1:科技的发展轨迹存在“不可逆性”
- 定律2:能源与信息是人类科技进步的两把标尺
- 定律3:技术进步的本质是推动信息与能源的转化,以生产工具改变物理世界,继而满足人的需求
定律1与定律2反映推动社会发展的先进生产力,体现先进性,如技术的智能水平、高度、强度、速度;定律3反映的是满足全社会需求的能力,体现普适性,如技术应用的广度、落地效率。
基于三定律所揭示的先进性、普适性两条路径,甲子光年智库推导确定AIGC通用大模型产品的测评指标体系,用智能化水平反映其先进性,用赋能空间反映其普适性。
甲子光年智库认为,在智能化水平方面,AIGC通用大模型产品需要体现内容的多元与创造能力,前后生成内容要一致且连贯,生成内容要使用户有一定的可控能力,且具有较高实用性,并可以像人一样进行沟通。因此,智能化水平从多样性、一致性、可控性、实用性、拟人性五大维度进行测评;在赋能空间方面,AIGC通用大模型产品需要体现用户使用后的满意情况,生成内容需要有一定准确性且可有效提升工作效率,并具有一定的应用广度。因此,赋能空间主要从满意度、信度、效度、应用广度四大维度进行测评。
AIGC通用大模型产品用户画像:一二线城市、中小微企业、教育科研领域居多
本次调研对象是使用过AIGC通用大模型产品至少1次及以上的用户(包含个人用户和开发者用户) ,调研对象针对自身使用相关产品的情况进行评价打分。
- 从用户所属企业类型来看,中小微型企业占比较高,比例达68.5%,其次是大型企业,占比14.8%。
- 从用户所在地域分布来看,二线城市占比最高,达39.5%,其次是一线城市,占比25.2%,一二线城市是用户聚集地。
- 从用户所属行业前十名来看,教育、科研/院校、金融、互联网、专业服务、媒体、医疗、软件、文娱、政府等是AIGC通用大模型产品使用较多的行业,尤其教育和科研/院校领域占比较高。
AIGC通用大模型产品用户职业:内容生产者占比近九成,开发者占半壁江山
从职业分布来看,AIGC通用大模型产品用户以开发者和内容生产者为主。
开发者指具有一定代码编写能力的软件开发技术人员,包括但不限于IT部门人员、软件开发人员等。
内容生产者指从事内容生产相关工作的职业者,其与开发者存在一定重合性。
其中,从是否是开发者角度看,开发者占比43%,普通个人占比57%。从是否是内容生产者角度看,高达89%的用户都是内容生产者。从两大职业交叉分布看,第一客群是作为普通个人的内容生产者,占比50.5%;第二客群是作为开发者和内容生产者双重角色的用户,占比38.6%。
用户使用热度Top10大模型产品:60%侧重面向开发者,40%侧重面向普通个人
从用户使用热度来看,Top10大模型产品是ChatGPT、GPT-4、谷歌Bard、腾讯云、华为盘古、文心一言、360智脑、通义千问、商汤日日新和讯飞星火。
从Top10大模型产品的用户职业分布来看,有60%是侧重面向开发者的,40%是侧重面向普通个人的,说明当下市场主流大模型产品仍以面向开发者用户为主。
从Top10大模型产品的用户细分客群来看, ChatGPT、谷歌Bard、腾讯云、文心一言、通义千问和讯飞星火等大模型产品用户以第一客群为主, GPT-4、华为盘古、 360智脑和商汤日日新大模型产品用户则是以第二客群为主。
用户可接受最优价格是300元/季度,厂商最适合定价区间是300-3000元/季度
甲子光年智库调研数据显示,300元/季度是AIGC通用大模型产品用户可接受价格的最优定价,300-3000元/季度是AIGC通用大模型产品用户可接受合理价格区间。
当价格超过3000元/季度时,用户的付费购买意愿会快速下降。因此,甲子光年智库建议AIGC通用大模型厂商在产品定价时优选【300元/季度,3000元/季度】区间。
工作效率水平:整体提升47.9%,医疗、金融等行业和翻译、科研场景提升效率高
AIGC通用大模型产品对用户工作效率的提升水平达到47.9%。
从行业表现来看,金融、医疗和科研行业的工作效率提升水平较高,分别为59.3%、57.3%和52.1%,另外在文娱、专业服务、政府、教育、互联网等行业提升效率水平也表现较好。
从应用场景表现来看,翻译、科研学术场景的工作效率提升水平比较高,分别达到62.5%和50.7%。办公、文案创作、文本改写/扩写、文本摘要归纳和海报设计等方面对工作效率的提升也非常可观。另外,搜索引擎场景的提升效率水平达到42.1%,也是值得关注的重点场景之一。
市场地位:文心一言、腾讯、华为和商汤属星团象限
基于X轴赋能水平和Y轴智能化水平,可以将AIGC通用大模型产品划分为四个象限,形成甲子星空坐标系。
光年象限的产品在赋能水平和智能化水平方面表现均较为突出,既具有技术先进性/创新性,对生产效率提升显著,又具有较高的应用普及性和可落地能力,可以满足各行业和场景应用需求,有助于推动社会发展,属于整个行业的领导者,如GPT-4。
星辰象限的企业则具有较高技术水平和创新能力,对生产效率提升显著,但还尚未形成广泛的应用落地与使用场景,但其发展潜力大,处于挑战者地位,未来大规模应用后有进入光年象限的可能,具有挑战行业领导者地位的潜力,目前top10热度产品未出现在此象限。
星云象限的通用大模型产品则是多为新成立或新发布产品阶段,其在生产效率提升能力和大规模商业化应用能力方面具有较高的可成长型,属于新势力,未来潜力空间较大。
星团象限的通用大模型则具有较广的应用面,已经建立稳定的商业模式和应用场景,并在某些行业或专业场景具有竞争力,处于行业先行者和隐形冠军地位,如文心一言、腾讯、华为和商汤等均属星团象限。
市场潜力:商汤、腾讯云和华为盘古的商业化落地潜力较大
基于X轴用户推荐意愿和Y轴用户满意度,可以将AIGC通用大模型产品划分为四个象限,形成评估产品市场潜力的甲子星空坐标系。
光年象限的产品用户满意度高且愿意推荐给同行使用,具有较好的产品接受度和推荐传播能力,是行业中市场增长引擎最强的产品群体,属于侧重商业落地应用的类型。
星辰象限的通用大模型产品则是用户使用后满意度较高,但推荐给同行使用的意愿不足,处于可推荐可不推荐状态,这说明其产品体验和表现已经满足用户预期,但可能存在产品功能过于单一或仍有进步优化空间,导致推荐动力不足,在产品迭代后有潜力激发市场化应用,成为光年象限产品,属于侧重产品体验的类型。
星云象限通用大模型产品的商业化模式不够清晰,现有象限中大模型产品用户以普通个人和内容生产者居多,建议该象限的大模型产品以普通个人为目标客群,未来需注重普通个人应用场景的商业化落地,以满足用户需求。
星团象限的通用大模型产品处于推荐意愿高但未达满意状态,该象限产品多面向开发者,其对产品具有较高的技术要求,因此虽然该象限产品具有较高的用户推荐意愿但用户仍认为存在产品的瑕疵,需要尽快确定产品问题点并进行改进升级,从而维持用户粘性、产品忠诚度与持久热度。
核心场景:翻译、学术、设计属光年象限,商业潜力大
基于X轴用户使用热度和Y轴提升工作效率水平,可以将AIGC通用大模型应用场景划分为四个象限,形成评估应用场景的甲子星空坐标系。
光年象限的应用场景在用户使用热度和成熟度方面均较为突出,属于应用场景中的领导者,如翻译、科研学术、海报设计等场景,均属于光年象限的应用场景。
星辰象限的应用场景,对工作生产效率有显著提升,但还尚未形成广泛的用户使用偏好,其发展潜力大,处于挑战者地位,未来大规模应用后有进入光年象限的可能。
星云象限的应用场景,多为新兴且处于探索阶段的场景,具有较高的可成长性,属于新势力。
星团象限的应用场景,用户具有较高的热度和使用偏好,但其实际提升工作效率的水平仍有待改善,这部分场景往往具有一定应用基础,已建立一定的商业模式,处于先行者地位,尤其办公和文案创作场景商业潜力较大。
甲子星空坐标系的由来简述
甲子光年智库在2023年4月25日提出,人类科技发展存在三大定律:
- 定律1:科技的发展轨迹存在“不可逆性”
- 定律2:能源与信息是人类科技进步的两把标尺
- 定律3:技术进步的本质是推动信息与能源的转化,以生产工具改变物理世界,继而满足人的需求
定律1与定律2反映推动社会发展的先进生产力,体现先进性,如技术的智能水平、高度、强度、速度。
定律3反映满足全社会需求的能力,体现普适性,如技术应用的广度、落地效率。
基于三定律所揭示的两条路径,可以推导出科技发展的先进性与普适性是推动社会发展的核心路径,甲子光年智库基于这两条核心路径,推导、设定评估指标体系。
甲子星空坐标系的维度选取
基于科技发展三大定律所揭示的两大核心维度先进性与普适性为核心路径进行推导确定维度选取。
普适性方面:以应用效率提升为主,反映的是广度,主要维度:用户需求满足能力、社会责任能力(双碳、绿色环保、共同富裕等)、经济推动能力等。可以满足企业数字建设需求,具有较高落地应用能力,有助于赋能社会责任,有助于推动经济发展。
先进性方面:以反映高度和强度两个关键推动社会发展的方向为主进行推导,高度以提高生成效率为主,强度以提高能源效率为主
- 高度:以生产效率提升为主,反映的是高度,主要维度:数字化、智能化。注重科技水平的先进性和创新性,能够有效提升生产效率,可基于先进技术开发显著提升生产效率的新型生产工具。
- 强度:以能源效率提升为主,反映的是强度,主要维度:能效比、可再生能力。具备较高的能效比和可持续发展能力,可以满足低功耗即可实现先进技术的能力,确保可以较高强度的使用,并能大规模支持日常生产生活。
甲子星空坐标系象限划分与意义
第一象限为光年象限:在赋能水平和智能化水平方面表现较为突出,其技术实力较强,市场接受度高,大规模应用落地,已经获得市场的认可,属于领导者定位;
第二象限为星辰象限:具有较高技术水平和创新能力,对生产效率提升显著,但还尚未形成广泛的应用落地,属于挑战者的定位;
第三象限为星云象限:多为新成立且具有较高原创性和潜力空间的企业,属于新势力定位;
第四象限为星团象限:具有较广的应用面,已经建立稳定的商业模式,并某些行业或场景具有竞争力,属于先行者和隐形冠军定位。
甲子星空坐标系象限特性解读
基于X轴赋能水平和Y轴先进性水平,可以将厂商划分为四个象限:光年象限、星团象限、星辰象限和星云象限。
光年象限的企业在赋能水平和智能化水平方面表现较为突出,其技术实力较强,市场接受度高,大规模应用落地,已经获得市场的认可。
星辰象限的企业则具有较高技术水平和创新能力,对生产效率提升显著,但还尚未形成广泛的应用落地。
星云象限的企业则是多位新成立且具有较高原创性和潜力空间的企业,属于新势力。
星团象限的企业则具有较广的应用面,已经建立稳定的商业模式,并某些行业或场景具有竞争力,属于隐形冠军。
点击链接进入甲子光年官网下载高清版完整报告PDF:https://www.jazzyear.com/stud...
文件名 | 大小 | 下载次数 | 操作 |
---|---|---|---|
甲子星空坐标系:AIGC通用大模型产品测评篇-甲子光年.pdf | 7.15MB | 1 | 下载 |