初创2个月,排名第八!深圳首个自研大模型上榜
扫描二维码
随时随地手机看文章
7月26日,一条大模型上榜的消息首先刷爆了AI从业者的朋友圈。
上面AI从业者说的就是,在榜单上发现了一家且唯一一家大湾区团队,而且一上榜即杀入前八。同属大湾区的其它团队,诸如华为的盘古、腾讯混元模型等均未进入到榜单,可以说这次是大湾区首家大模型团队进入了该权威榜单,并且从评分上超过了ChatGPT和Claude-V1.3等实力选手。
GS-LLM-Alpha的开发者为共生矩阵科技(深圳)有限公司。从工商注册信息来看,该公司是2023年5月10日注册的新公司,且无公开融资信息。主创技术团队是前深圳IDEA大模型技术成员,具备全要素大模型自主研发能力。相较于大厂和融资数亿的明星大模型团队,该团队的突然出现成为AI大模型赛道的一个强劲黑马,为本以为格局既定的大模型市场带来更多变数。
到此,值得让人思考的是,为什么这样的团队可以突出重围?实现这样前沿的技术需要什么?
新一代人工智能核心三要素是人、数据与算力。核心中的核心是人:有实际训练与模型研发经验的人。国内进入大模型赛道的玩家主要是两拨人:互联网大厂和具备大模型开发经验的创业团队。前者优势是资本,后者像共生矩阵科技这样的,优势是足够强势的技术人员。
大模型繁荣之下,其实是各种野蛮生长,具备自研能力团队少之又少。就在年初ChatGPT出圈之前,国内仅仅几个团队具备这样的条件专注大模型研发:清华智源/智谱团队、复旦大学Moss团队、深圳IDEA大模型团队,掌握大模型研发技术的核心成员少于100人。在GPT大火之后,互联网大厂快速跟进,但最难解决的是人才。大厂习惯的怼人和怼资源的模式,在研发大模型上体现了超出预期的成本,同时又面临着开源模型和更强的模型出现,那么竞争的意义何在?
以共生矩阵这样初创团队为例,在资源有限的情况下,通过短短数周的准备和训练,就能实现高性能大模型,刷新小规模模型在C-Eval的评分。这足以说明新一代人工智能的竞争将是技术代差的竞争。
同时也简单介绍一下市面上最权威的大模型测评:C-Eval,覆盖内容广泛,包括STEM、社会科学、人文能力、和其它一些学科,成为大模型全球公认的客观评分标准。
这些指标主要用在以下场景:
1. 评估大型语言模型(LLMs)的知识和推理能力:通过这些指标,可以全面评估LLMs在各个学科领域和不同难度级别的问题上的表现。
2. 分析大模型的优缺点:通过这些指标,可以帮助研究人员了解基础模型在哪些领域和问题上表现良好,以及在哪些方面还有待提高。
新一代人工智能将覆盖日常生活与生产全过程,形成一个生态系统。每个智能模型都像森林中的一棵树,互相影响,构成了一个多层次的和谐共生系统。希望共生矩阵科技这样的行业推动者,让人工智能融入日常生活与生产,带来解放、提升幸福。