3354黄铁军北京致远人工智能研究院院长

中新网 2021-10-10 17:15 阅读量：15537

本报记者华玲

首先要注意训练数据的质量目前一些模型的偏差实际上是训练数据本身造成的二是要加强对算法本身和模型内部运行机制的研究此外，在模型的训练过程中，要加入多模态数据，通过多模态信息固有的多相关性，降低大模型偏执的概率

3354黄铁军北京致远人工智能研究院院长。

最近，包括美国斯坦福大学的李菲菲在内的100多位学者联合发表了文章《基础模型的机遇与挑战》，讨论了在人工智能基础模型已经成为趋势的环境下，人工智能发展面临的机遇和挑战指出基础模型的应用使得自监督学习预训练模型的微适应方案逐渐成为主流，带来了智能体认知能力的提升同时，由于基础模型的任何改进都会迅速覆盖整个AI社区，其隐患在于基础模型的缺陷会被所有下游模型所继承斯坦福大学学者提到的基础模型在国际上也被称为预训练模型，国内研究者也称之为大模型那么，人工智能的大模型是什么，与小模型相比有什么优势为什么大模型成为一种趋势，它在行业中有哪些应用未来我们将面临哪些机遇和挑战

大模型最近成为AI学术界刷屏率很高的词汇为什么需要更多计算能力和更大数据集的大模型是未来AI的最佳合作伙伴这要从AI开发者屡遭挫折和坎坷说起

深度学习技术兴起近10年来，AI模型基本上是一个训练特定应用场景的小模型小模型是用特定领域的标记数据进行训练的，不具有普适性，因此往往不适合切换到另一个应用场景，需要重新训练此外，小模型的训练模式基本上是手工车间式，参数调整优化的手工任务太多，需要大量AI工程专业人员来完成同时，传统的模型训练需要大规模的标注数据如果某些应用场景中的数据量很小，训练出来的模型精度会不尽如人意

小模型的这些问题导致AI研发的整体成本更高，效率更低由于AI人才短缺，成本高昂，对于中小行业的用户来说，小模型的这些问题阻碍了行业用户对人工智能技术的采用，成为AI普惠的障碍北京致远人工智能研究院院长黄铁军在接受科技日报采访时指出

虽然之前世界上有千村万户大规模冶炼模式的热闹景象，但这种自己炼钢的作坊模式显然不符合现代工业发展规律。

黄铁军进一步解释，大模型能解决这些问题，泛化能力强，所以能举一反三同一个模型可以用少量的数据完成多场景的任务，有微调也可以不用微调，中小企业可以直接调用，不需要招聘很多AI算法专业人员就可以进行应用开发，显著降低了中小企业的研发门槛，促进了AI技术的落地

得益于这些优势，人工智能的发展逐渐从提炼模型走向提炼模型以美国OpenAI，谷歌，微软，脸书等机构为代表，大规模智能模型布局成为全球领先趋势，形成了GPT—3，Switch Transformer等千亿或万亿参数的大模型

人工智能模型是‘大数据与强大算法’相结合的产物，是融合大数据内在本质的‘隐性知识库’，是实现artif应用的载体

类似于人的教育培训，大模式完成的培训就像基础的，一般的本科培训一样，学过的大模式有处理一般事情的能力要想完成更专业更高级的任务，大模型需要在毕业阶段进行专业训练

黄铁军进一步指出，AI大模型通常是在大规模无标签数据上进行训练，学习数据中包含的特征，结构和知识。

在这种趋势下，北京致远人工智能研究院于2021年3月发布了启蒙1.0，这是国内首个人工智能大模型，取得了多项国际领先的AI技术突破，2021年6月发布的五道2.0，参数规模1.75万亿，是OpenAI的GPT—3模型的10倍，成为全球最大的模型。

北京致远人工智能研究院学术副院长，清华大学教授唐杰表示，大模型可以包含更多的数据，表达更多的信息，模型向超大规模发展是必然趋势。

超大规模预训练模型的出现，很可能改变信息产业格局，即在基于数据的互联网时代和基于计算能力的云计算时代之后，可能进入基于大模型的AI时代唐杰认为

同质化和涌现特性带来机遇与挑战

最近，斯坦福大学数十位研究者联名发表《基础模型的机遇和风险》综述文章，认为大模型的特点之一是同质化，好处在于大模型的任何一点改进就可以迅速覆盖整个AI社区但同时，它也带来一些隐患，大模型的缺陷会被所有下游模型所继承特点之二是海量数据训练出的基础模型具有涌现特性，也就是产生未曾预先设想的新能力，这种特性有望让AI具备处理语言，视觉，机器人，推理，人际互动等各类相关任务的能力因此这类模型将赋能各行各业，加快行业的智能化转型，在法律，医疗，教育等领域都会带来具有社会价值的影响

但同时，如何应对大模型下游的传播问题，进一步提高信息的精准性与适用性，以人工智能大模型技术激活各行各业。

0 条评论

发表