人工智能不仅成为引领新一轮科技革命和产业革命的重要驱动力,而且深刻影响到包括社会科学在内的知识生产和传播。围绕人工智能时代社会科学研究的新发展、新趋势与新挑战,《中国社会科学报》约请了米加宁、高奇琦和邱林三位学者展开研讨,希望通过对话促进共识、呈现分歧,为变革时代的社会科学研究激荡思想的火花。 狂热的支持者 “我们过去的社会科学研究都是基于个体力量进行的。在大模型面前,个体只是作为一个催化剂而存在。”——米加宁 积极的谨慎论者 “如果完全让技术主导,最后不可避免会导致人的主体性的丧失。”——高奇琦 谨慎的乐观主义者 “大模型是一个颠覆性的工具。它能使社会科学研究在广度与深度上产生质的飞跃。”——邱林 ChatGPT的本质是大模型 《中国社会科学报》:我们说ChatGPT的出现在人工智能的发展史上具有里程碑的意义。如果用一个词来描述ChatGPT的本质,或者说革命性突破,是什么?我们可以看到有用生成式人工智能、通用人工智能、大语言模型等不同的表述,背后的区别是什么? 邱林:我是主张用大模型来理解ChatGPT。为什么不用“生成式”呢?因为生成式这种语言模型,其实从AI一开始就有了。像最早的Eliza,它就是对话型的,但它是基于非常简单的规则来对话的。比如,你跟它说“我今天心情不好”,它就会挖出“心情不好”这个关键词,生成“你为什么心情不好?”虽然这种对话是非常刻板的、机械化的,但它在本质上也是生成式的,是根据你的输入,生成了对你的反应。人工智能刚开发出对话机器人时是一个非常令人惊讶的工具,因为它原本是要用作心理治疗的,在心理治疗中通过与对话机器人聊天,让人可以更多地抒发。所以说,生成式对于人工智能来说是有一定的历史的,并不是新的。 之所以称它为大模型,是因为ChatGPT现在的数据量是有史以来最庞大的,加上它惊人的算力,导致了这种爆发性的智能行为。它与之前的生成式人工智能最大的区别在于,它的训练集是超大的,而且它背后的算法也与之前有所不同,是基于神经网络的机器学习,这是更加智能化的自我学习。 米加宁:生成式人工智能是很早就有的,但ChatGPT的生成式是非常独特的。为什么以前不用生成式人工智能?那是因为以前生成的内容质量很差,虽然生成了内容,但不够智能。直到今天,生成式人工智能才真正达到可以使用的程度。 GPT的全称是Generative Pre-Trained Transformer,翻译过来就是生成式预训练转换器。加上Chat,我觉得Open AI是出于商业考虑。但放到中文里,就容易把它理解为聊天机器人,甚至使用效果还不如一般的聊天机器人。实际上,GPT是三个要素的集合:一是大模型,二是大算力,三是大语料,三者缺一不可。在这个整体中,大算力是核心,因为有多大算力,才能处理多大的语料;有多大的算力,才能建立多大的模型。中美科技战里,美国为什么从芯片上打压我们?因为芯片是算力的基础,控制了芯片,算力就上不来。 高奇琦:我同意从大模型来定义ChatGPT。从概念史来看,生成式人工智能这个概念是略早于大模型的。三四年前,我们讨论比较多的概念是AIGC,即AI Generated Content,人工智能自动创作生成的内容。这个概念有两个相关的概念,一个是PGC,Professional Generated Content,是专业生成内容;一个是UGC,User Generated Content,是用户生成内容,即人生成内容。AIGC概念比大模型要早,ChatGPT出现后,为了更好地进行定义,人们越来越倾向于用大模型。其实,更准确的说法是大语言模型。这个语言是从人工智能关于语言的4个基本分类——机器视觉、语音生成、自然语言和机器人中的自然语言分类成长起来的。 稍微补充一点,这个大模型不光是数据量大,参数大是一个更本质的特征。因为这个算法最重要的特点是模仿了神经网络。GPT-3的参数量是1750亿,GPT-4官方没有公布,但可以知道的是,它是一个混合专家模型(MOE,Mixture of Expert),是不同小模型组合在—起的一个模型。所以,早期人工智能是基于规则展开,也就是符号主义;而发展到神经网络其实是关联主义,现在的大模型更多体现的是关联主义。 不只是新工具,更是新范式 《中国社会科学报》:近年来,随着新技术的发展,学术界尤其是公共管理学界有关于研究范式转变的一种呼声,比如主张构建数据驱动的新研究范式。大模型的出现,对于社会科学研究开放了哪些新的可能性? 米加宁:在大模型出现之前,社会科学的研究范式主要有定性研究、定量研究、仿真研究和大数据研究。大数据的提出是在2010年,提出之后对社会科学产生了很大的影响。在此之前,以往的社会科学研究都是基于个体对于问题的研究。孔德一直主张社会科学向自然科学看齐,他非常推崇经典物理学对自然界的研究,希望社会科学也能像物理学那样能找出一些规律来。孔德以后,社会科学开始大量开展模仿自然科学的定量研究。但是,这些研究并没有什么进展。因为,社会科学的研究对象超级复杂,用定量方法进行研究,相当于用简单的数量方法来应对复杂的问题,就好像用因式分解的方法去解决球面积分的问题。实际上,定量研究在极小的领域里才有可能,比如说公司治理中,因为公司边界清晰、数据规范,可以做一些回归分析。