ChatGPT大火下，国内AI“三算”与海外存差距

2023-04-04 12:35:01

作为目前全球最火的自然语言大模型产品，ChatGPT至今不对中国用户开放，背后的算法、芯片、数据更是全部被控制在美国公司手中。国产ChatGPT进入需求井喷期，一大批中国公司赶来，有互联网大厂，有资本大佬，也有创业公司，谁都不想错过这一次的AI革命。

3月19日，创新工场董事长兼CEO李开复在朋友圈宣布，成立Project AI 2.0公司，“不仅仅要做中文版 ChatGPT，”他这个公司定位为AI 2.0全新平台和AI-first生产力应用的“世界级公司”，野心颇大。

一个月前，美团联创王慧文在朋友圈发“英雄帖”，出资5000万美元，要创立新公司打造中国版OpenAI。此外，阿里巴巴“框架大神”贾扬清、搜狗前任CEO王小川、京东曾经的AI掌门人周伯文都表明了同样的意愿。

互联网大佬蜂拥入局，中国企业重燃热情，包括创业企业和上市公司。

企查查数据显示，近三个月共有108601家新注册业企业在经营范畴中标注了人工智能，同比增长超24%。《元宇宙日爆》统计，截至今年3月，已有20家上市公司布局了AIGC相关应用，涉及世纪虚拟人、AI写作、AI视频、AI绘画、AI营销等。

国内上市公司AIGC相关布局,AIGC创业公司千帆竞发，涉及领域包括上游的底层框架与工具、中游的行业服务、下游的包括文字、图像、视频、音频、游戏等应用场景，创业方向也从C端的娱乐游戏拓宽至工业、金融、医疗、教育等2B领域。不同应用场景已出现了一批代表性的玩家。

国内创业公司AIGC相关布局,而在底层大模型上，中国互联网科技巨头的动作则最受瞩目，包括百度、华为、腾讯在内大厂均有自然语言大模型布局。

3月16日，百度履行承诺，发布基于文心大模型的生成式AI产品文心一言，27日又面对企业发布了智能云AI底座文心千帆。

3月27日，华为云官网显示，旗下的盘古系列AI大模型即将上线，涉及NLP（自然语言）大模型、CV(计算机视觉)大模型和科学计算大模型（气象大模型）。

3月30日，腾讯集团高级执行副总裁汤道生披露，腾讯正在研发AIGC以及大模型相关技术，并向澎湃新闻表示，正在研发类ChatGPT的对话机器人，对于腾讯的聊天机器人是集成到QQ、微信，还是通过腾讯云向B端用户服务，汤道生说：“都会有。”

国内AI“三算”与海外存差距

人工智能在当下的中国展现出全面开花的热闹。而资金雄厚、人才济济的大厂被视作最能与OpenAI比肩的选手。但最早发布产品的百度，其文心一言在文本、代码生成上尚不及ChatGPT的体验，图片生成的效果则被Midjourney拉开了距离。

赛道火热，产品不佳。中国的人工智能发展进入至暗时刻。缺的不仅是有实力的大模型，还有与之直接相关的人才和AI“三算”，即算力、算法、算据。

先是业内曝出，百度文心大模型团队内的研发人员近期受到了其他公司的疯狂追捧，有3年左右相关经验的员工，可以直接给到原先年薪的两倍。而有涉及海内外人才市场的猎头称，诸多互联网大厂的第一诉求就是想找OpenAI项目里的华人。猎聘大数据研究院的统计数据也显示，近一年，AIGC相关新发岗位同比增长了42.5%。

抢人大战不仅在国内上演。

由于一大批硅谷AI大牛排着队挤进OpenAI，谷歌一度遭遇AI人才流出。据外媒体统计，近几个月OpenAI已经雇用了超过12名谷歌的AI人才。

但从公开消息看，到目前为止，还没有哪位OpenAI背景的华人专家流入中国大厂。

AI人才紧俏，以芯片为核心硬件基础的算力一直被视为“卡脖子”的状态，而国产大模型的算据也与GPT-4存在肉眼可见的差距，预训练等大模型算法的距离直接以“肉眼可见”的产品拉胯摆在了用户面前。

在算据上，国产大模型也与GPT-4存在差距。

在自然语言大模型中，参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多，意味着模型能够处理更多的数据，学习更多的知识。国外有研究人员将GPT参数规模与大脑神经元做类比，GPT-3的规模与刺猬大脑类似，GPT-4拥有100万亿个参数，基本达到人类大脑的规模。

再看国产大模型，即使是排名靠前的M6大模型，其参数规模也仍与GPT-4相差一个数量级，更多的大模型仍在“原始阶段”。

GPT-4百万亿的参数需要强大的算力来完成训练。算力，同样是AI的核心竞争要素，核心的核心是芯片。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

在AI芯片竞争方面，英伟达处于垄断地位，该公司推出的A100与H100是目前性能最强的数据中心专用GPU，市面上几乎没有可替代的方案。ChatGPT的训练用的正是英伟达顶配版A100。

然而，在中美竞争下，A100与H100已被限制出口中国，中国厂商只能用阉割版A800芯片，数据传输速度被降低了30%，影响着AI集群的训练速度和效果。而国产优质芯片，虽能够为预训练大模型提供算力支撑，但仍存在明显差距。

以OpenAI为例，该公司使用了数万块英伟达A100进行海量数据训练和推理。如果以1万枚英伟达A800 GPU为标准，仅GPU采购成本就超10亿美元。

如此现状下，国内的大模型研发机构面临两种选择，“烧钱”购买更多的芯片，等待国产芯片的算力突破。但现在的竞争态势下，等已经等不起了。

高昂的前期投入成本绝非普通创业公司可以负担，还要具备绝对顶尖的研发技术。很显然，AI大模型仍是巨头的游戏。但掌握先发优势的OpenAI以“日更”速度向前跃进，互联网巨头与资本面临着一场“烧钱”硬仗。

关键词：