百度科技与社会研究中心主任余欢：大语言模型重在智商和情商

2023-08-17 19:53:45 来源：北京商报作者：杨月涵 581

8月16日，以“大模型见真章”为主题，北京商报深蓝智库举行AI专题分享会，复盘大模型过去200多天的经历，并从中探寻大模型商业化落地的可行之径。会上，百度科技与社会研究中心主任余欢提到，这一波大模型的兴起不是AI概念第一次被热炒，经过70多年发展，人工智能经历了几次起伏，但不同的是，这一波大模型不再是泡沫型发展，而是已经成为当下人工智能的主流方向，“当所有人都相信这种发展时，就未必是泡沫了”。

余欢表示，相比起之前的人工智能，这一波大模型的特点是泛化性更强、标准化程度更高、工业化发展趋势更明显。大模型解决的是中长尾的问题，即很多定制化场景无法解决的问题，能够在小样本、小数据的基础上，以相对低成本的情况满足场景化需求。

此外，余欢提到，相比起之前的模型，大语言模型的特点主要分为两部分：情商和智商。当下人们更多解决的是智商问题，即能理解、有逻辑、会推理、能创作，但未来就会向“有感情”去努力，也就是说情商会成为大模型未来一段时间内进一步提升的能力。

据了解，早在2019年3月，文心大模型1.0版本便已发布，此后逐步迭代。今年3月，百度文心一言发布，底层由文心大模型3.0版本支持，更多以辨别式为主、生成式为辅。今年6月，文心大模型从3.0版本升级到3.5版本，比例出现了明显的扭转，大概7分生成式、3分辩别式。通过飞桨与文心协同优化，文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

余欢强调，文心一言有几个核心能力，除了大模型比较通用的基础能力，如有监督精调、人类反馈的强化学习以及提示外，还包括知识增强、检索增强以及对话增强。

以知识增强为例，百度拥有全球最大的中文知识图谱体系，在使用时可以分为知识内化和知识外用两部分，前者意味着在训练模型时可以将这些“关系”投入进行前置性训练，后者表示在推理过程中，如果一些问题在知识图谱里面构建过准确率可能会更高。

今年6月，ChatGPT首次出现流量负增长，一时延伸出业内的各种讨论。对此，余欢表示，ChatGPT流量下滑的逻辑类似于“打江山容易守江山难”，随着时间的推移，剔除一定猎奇心态后，自然会面临有多少用户黏性的问题。但对中国大模型企业而言，流量不仅没有见顶，甚至可以说是还没开始。

“当下C端还未完全放开，从百度的角度来说，我们正处于一种摩拳擦掌等待放开的心态，期待更多流量的提升。”余欢称。

至于商业化，余欢认为，要从付费和真正覆盖成本实现盈利两个方面看。虽然当下尚未出现大规模的批量化落地，但几家大模型厂商已经实现了零星的商业化落地，预计年底可能会出现一些典型的商业化落地案例。此外，预计起步阶段，B端的商业化速度可能会超过C端，C端则可能在爆发速度上更胜一筹。

返回上一页：会展+产业链 > 科技传媒 >

用户投稿

2023广州国际物联网展览会

2022-06-07

2023世界机器人大会北京开幕

2022-06-07

百度科技与社会研究中心主任余欢：大语言模型重在智商和情商

上一篇

2023广州国际物联网展览会

下一篇

2023世界机器人大会北京开幕