分享

本体性意义与学科反思:大数据时代社会学研究的回应

 昵称14979747 2019-10-30

二、大数据、方法学转向与理论终结说

  大数据的正式概念始于2011年麦肯锡的报告《大数据:革新、竞争和生产力的下一个“前沿”》:“大数据——能够获取、交流、整合、储存乃至分析的海量数据——如今已成为全球经济里每一部门和功能的组成部分。就像其他的生产要素,比如硬资产和人力资本。数据越来越成为现代经济活动、革新和增长中不可或缺的要素。”[9]报告中强调运用大数据的科学技术将被广泛地应用到统计学、计算科学、应用数学乃至经济学中,同时,这也意味着从大数据中获取信息的组织等需要面临的是一个更为灵活性的、多重规则的方法手段。正是由于大数据量的庞大,因而如何驾驭这个庞然大物(Riding the Juggernaut)[10]来为人们服务越发受到重视。由于大数据应用领域的扩大,因而当今它甚至可以囊括“环境卫星、基因数据、GPS和地图数据、数字图像,以及诸如社交媒体数据之类的人们有意识产生的数据,等等”。[11]所以,《大数据时代:生活、工作与思维的大变革》一书的两位作者舍恩伯格(Viktor Mayer-)和库克耶(Kenneth Cukier)亦将大数据视为“社会以新的方法手段处理信息的一种能力,以生产出具有巨大价值的商品和服务或者产生有用的洞见”。[12]20

  相较于传统数据采集及统计分析,大数据最为突出的特点是舍恩伯格和库克耶所强调的三大特性:模糊性、相关性和大样本性。首先,是模糊性代替精确性。对于传统数据采集而建立的数据库而言,收集的数据信息是相对有限的。在有限样本量的情况下,对于数据采集以及建构模型精确性具有很高的要求。但是,在大数据的前提下,“允许不精确的出现已经成为一个新的亮点,而非缺点”。[12]63这种所谓的“非缺点”表现为两个方面:一方面,对于小型数据过多的各种统计方法的计算倒不如从大数据出发的简单运算来得实际,从而在效率层面上完全可以省下更多时间来收集更大的数据,使得手头的数据库存累积起来以便获取更多有用的价值信息;另一方面,大数据之所以被提出乃至风靡全球,是因为它能够满足人类的追求,即掌握现在和预知未来,尤其是后者。预测代表着一种概率逻辑,而非事实的确定性,所以数据的海量采集为预测大方向的追求而不得不或者主动地丧失其精确性,并“拥抱混乱”。其次,是相关性代替因果性。舍恩伯格和库克耶认为,因果关系存在的前提在于人们的主观直觉,“在小数据时代,很难证明由直觉而来的因果联系是错误的。……大数据之间的相关关系,将经常会用来证明直觉的因果关系是错误的”,[12]103而相关关系则代表着客观的事实,且后者作用更为明显。例如,将预测作为最终目的的评估机构和企业,只需要知道用户的目前状况和需求,就能够为其提供相应的产品和服务;他们无须也不想去了解用户之所以会有某类需求的原因。最后,是大样本性代替小样本性。当数据的收集量越来越庞大乃至可以称为海量时,以至于可以直接采用这一超大型样本量而无须顾及小样本所带来的一系列代表性问题。如果说传统统计方法下的抽样研究是为了描述或解决即时的、有限的、特定的社会现象或问题,那么,在大数据时代运用更为先进的信息技术对任何与研究旨趣相关的海量数据分析则可能着眼于更长远的、更为庞杂的事件和趋势。

  大数据对于社会科学的影响如此巨大,以至于其研究方式的转变使得社会学成为大数据时代下方法学被撼动得最厉害的学科之一。典型的例子是“新计算社会学”的诞生及其研究应用。20世纪90年代,拉策尔、加里·金等学者在《科学》上提出了“计算社会科学”的概念,[13]721即通过计算机软件作为媒介对社交关系进行测量的一种应用方法。这一新型学科的研究主要涉及社会网络理论与研究方法的发展、基于行动者模拟方法(agent-based modeling)以及互联网研究等。从研究范围来看,这一新兴领域是一种社会世界诸多方面的跨学科研究,通过计算的媒介可以从个体的行动者一直到群体。[14]2它主要利用计算机中的“自动化信息提取”(Automated Information Extraction)技术进行信息搜集。例如,我们可以将谷歌图书语料库的书本大数据、新浪微博、百度搜索等巨大库存作为数据来源,以所需相关变量(关键词)作为指标,从不同维度进行统计分析。[15][16][17]因为这是一门相对较新的领域,所以,计算社会科学需要同其他的跨学科研究领域之间建立起一个新的范式和系统,而这又需要诸如计算机科学等的知识背景。因此,从长远来看,这个学科的发展就是社会科学家和计算机科学家团队合作的成果。[13]722而随着计算社会科学领域科研队伍的不断壮大,社会学领域的计量方法也在不断发展。2014年,美国社会学界在斯坦福大学“计算社会科学中心”召开学术研讨会,并提出了“新计算社会学”(New Computational Sociology)概念。之所以“新”,主要在于“新计算社会学在理念、方法、思路、工具应用等方面比此前的社会学研究中的‘计算’都更为先进和复杂”。[18]

  这一方法学转向的极端形式就是热衷计量分析、过度注重计算结果的人(quantophrenia)越发增多,并在学科领域有一定的话语权,由此使得理论逐步被边缘化。例如,《连线》杂志主编克里斯·安德森(Chris Anderson)极度推崇社会的计算以及数据库的分析与运用,甚至直接提出“理论的终结”这一观点。他主张数据的运用可以完全代替理论来研究人本身,认为当今“是一个充满大量数据的世界,在这个世界中应用数据可取代任何其他可能采用的工具。从语言学到社会学,将没有任何一个有关人类行为的理论。而如果丢掉类型学、本体论和心理学,谁知道人们做什么以及为何这么做。但重点是他们就是这样做了,并且我们可以空前精确地追踪和测量他们的行为”,所以借助计算机的统计手段,“海量数据的可获得性为我们提供了理解世界的全新路径。相关性取代因果性,以至于科学可以摒弃相干模型(coherent models)、大一统理论甚至任何机械化的解释而独自前行”。[19]彭特兰并没有直接提出这一说法,但他却尝试着用这样的方式来重新解释社会。他将社会中实体间的影响、社会压力等因素的评估全部简化为数字符号,并采用建立等式乃至数学模型来概括整个社会的运行。尽管安德森和彭特兰的观点均属一家之言,但这些论断和主张无疑反映出一种具有大概率或然性的、试图撬动诸多社会学科、人文学科方法根基的趋势。

  不可否认,大数据在样本量上的极大增加,在很多方面为从事量化研究的学者提供了方便。由于大数据为大规模测量人的行为、社会互动交往乃至网络关系提供了可行性,[20]使得这些领域的研究的诸多瓶颈大大减少。研究条件便利化的趋势给一些量化研究者以更大的自信,以至于有人宣称“最终世界上一切不确定的因素皆可量化”。[21]对此,相应的质疑也接踵而至。

  大体而言,论争的主要内容是基于研究手段层面所产生的分歧。第一,赞同大数据社会学研究的学者认为,大数据可以为收集和分析的小数据创造参照和判断的标准依据;而且,由于大数据的量足够大,使得与大数据相匹配的传统数据无须接受显著性检验就具有代表性。但反对者则将此看作是一种学科入侵,以至于将大数据运用在人类社会的研究中称为一种所谓的“原罪”,[22]因为“大数据对于传统数据收集和分析而言是一种替代,而非补充”。[23]因此,进行社会学研究,必须摒除诸如此类的、主动拥抱混乱的“大数据傲慢”(Big Data Hubris)态度。第二,在有些情况下,部分学者为了能得到与本研究主题相关的大数据,在没有必要的前提假设时就开始选择因变量,而研究假设恰恰是研究进行的起始点。假设在研究的主题和过程中起到根基的重要作用。在一项研究中如果没有理论或经验性的假设,即便持有现成的数据库,对于该研究而言也是没有任何价值的。但也有学者认为,先有研究假设后有传统数据乃至大数据的检验,属于理论驱动;而直接使用大数据得出结论同样达到研究目的,这是一种数据驱动,由于大数据的量使得这一研究逻辑更为可行且有效。[24]因此,在研究中,两种驱动可以视研究本身的情况而定,有时甚至可以起到相互辅助的作用。第三,大数据研究宣称是一种相较于传统量化研究而言更具客观性的方法和手段,因为该数据库在很大程度上规避了传统数据收集形式中所产生的人为因素。当然,这种客观性的概念在涂尔干看来是社会学研究中的一个核心问题,即社会学研究的就是一个客观的社会事实,它有一个独立于个体表征之外的自身的存在。[25]然而问题在于,这种客观性的宣称因为人的必然在场而受到主观因素的影响,并且建立在主观观察和选择的基础之上。第四,收集数据的手段涉及学术研究本身的伦理性和不平等问题,因此受到学者的质疑。在社会网络的研究领域中,学者一直觊觎着未被利用的、具有巨大研究价值的潜在数据。而诸如SNS、Facebook等网站所蕴含的数据信息就非常适合于做关于网络的社会科学研究。问题在于这些潜在的数据消解了公众网络空间中的隐私。他们在从事网络虚拟活动的过程中,其活动痕迹已经被收集成可储存的数据信息,他们本身对此毫无意识。所以在研究中,人们的自我意识需要重新进行考量。除以上这些对外公开的数据之外,还有更多的大型数据库是有限开放甚至不开放的。如果从事商业,只有部分大型社会媒体公司才能够真正获取这些储存人们交易信息的数据库;从研究层面来看,也只有同Facebook或者Google有内部联系的人类学家、社会学家才能拿到所需的原始数据,其他无联系的研究者也就无从入手。假如他们要得到这些原始数据,往往需要花费大量时间和金钱才能将其购入。所以,从这一趋势来看,社会科学的方法手段在时间和金钱方面变得十分昂贵,同时每天的价格仍在攀升,[26]以至于大数据的研究领域在学界中产生区隔,结果就是产生数码化的分割(Digital Divides)抑或是大数据时代下的贫富之差。

  对于社会学而言,大数据研究方式赞成者以及反对者的不同立场所要揭示的是大数据对社会学研究的冲击程度。更进一步说,学界的纷争也是在力图追问:方法学的转向是真正的学科革命还是只是作为一个噱头而存在的表象。[27]其实,由于这个问题乃至论战涉及的是学科方法学领域内的诸多根本性主题,因此它在很大程度上可以称为第三次方法学之争。①但是,就目前论争的主要内容和主题来看,仅仅停留在手段和分析方法这个层面上来探讨大数据的适用性问题只是一种隔靴搔痒式的触碰,未能找到所谓的阿喀琉斯之踵。潘绥铭虽然已经注意到了这点并撰文指出,②但他在详细阐述时却还是采取具体的研究方法、手段及其生活案例,仍属“蜻蜓点水”,以至于仍然会出现方法上的分歧和可商榷之处。在笔者看来,尽管计算社会学乃至新计算社会学的提出,使得社会学研究的量化趋势显著并在一定程度上正逐步向计算机学科靠拢,但终究不能达到称霸学科的目标。归根结底,社会学学科最终的落脚点还是周遭的社会生活。人类的社会生活区别于自然社会之荦荦大端者,正是社会生活充满了意义或价值。同时,这种意义同人本身的能动性、外在的历史因素都有密切联系。这种人本身同诸多因素的复杂意义关联决定了在此社会领域的范围下并非一切都能被计算。

首页 上一页 1 2 3 4 5 下一页 尾页 跳转到:  三、社会生活的本体性意义与经验实践

  充满意义的社会生活先于经验科学时代而存在,同时它呈现给我们的是一种具有历史特殊性的生命实践。这意味着它已经预设了外在情境和内在于历史个体的生命的双重前提条件。社会生活作为一种非数字、非自然的存在,必然涉及实际的活动,因而也必然受制于外在化的情境。情境作为一种“社会时空的特定状态”,[28]生产或者建构着此刻实践的结果乃至更大范围的历史环境;同时就本体性特征这一点来说,所谓情境的再现虽然在特定情况下可能具有相类似的意义,但并非是完全相同状态的机械复制,相反,在不同时空维度下所产生的特定情境超越了某种形式化的规律,充满着或然性或者不确定性。韦伯行动理论中的“意义层面上的充分性”和“因果层面上的充分性”[29]88就是在这种限制条件下个体对意义把握的一种解释。从这个层面上来说,处于情境当中的实际社会生活是“关系性(即空间性)和可能性(时间性)的总体”,[30]从而彻底否定了所谓的预测。

  由于情境在时空因素上的复杂性,使得社会生活本身无法忽视无数单独个体包括能动性和策略在内的主观实践以及个体与其内在生命所产生的关联,所以,以此种历史个体的内在意义为特征的研究都要以理解这些实践与关联为前提,否则研究的结果只会是“解释之不可能”。而科学的手段只是对于极其有限的表象和外在化形式进行工具性描述,因此,从本体性中的文化意义上来说,单纯的“科学的说明不能替代基于理解的解释”。[6]94就历史个体生命而言,其意义的内在性特征所指涉的是生命中各个组成部分同生活这一整体的复杂关系,这一关系连接了个体的生命和结构的历史,这种生命结构同外在环境的持续互动构成了具有意义的生命。此外,这种互动产生的意义只有通过对不同个体的精神和心灵的感悟、对个体生命的体验才能够达成。狄尔泰强调,这种通过体验来认识具有复杂关系的生命结构的整个过程,意味着个体的内在心理因素、个体所拥有的历史背景和外在的环境、与其他个体之间的关系都是其获得发展个性禀赋的条件,个性的结构性联系是统一而不是机械单一的原因所促成的结果。而且,这种联系还是一种连续体,是一种柏格森式的、关乎自然秩序的关联,[31]300-301如此构成的意义“回溯到内在的时间意识以及绵延”。[32]当然,生命意义的理解路径需要通过现实世界的表现形式来得以呈现,但这种形式并非真正建立在科学化的手段基础之上。相反,是一种所谓的“历史意识”在起作用,该意识促进历史个体自身的能动性(对行动施加主观意义)与互动性(主观意义关乎其他主体)。这也是社会行动存在的条件。但这种主观意义既有受具体时空限制的实际层面,也或多或少地带有研究者的理想层面。后者试图通过建构研究对象的数字物理模型来理解其中的具体内容,并且通过这种理想典型,使得研究者能够明了其中的纯粹理性的行动过程。正是由于学科中存在因求得方法学之便利而构建一条建立在理性假设期待上的行为线路,所以,就人类生活中理性所占主导地位的问题而言,韦伯强调,“该主导性是否存在以及多大程度上存在,从来没有说清楚过”。[29]80因此我们可以得知,即便科学主义者深信实证方法的意义呈现,但这种客观意义必须同社会生活的主观意义区分开来。对这种主观意义的把握就意味着能够对行动者(社会生活中的对象)行动过程加以理解;同时,基于此理解,意义的赋予也必然会指涉根据行动者面对行动及其环境做出的解释。[3]34从这个层面上来说,意义又同样可以是通过人们的“自我表现”所显现出来的东西,同时也是人们的“理解”所理解的东西,[33]充满意义的社会生活也就包含着这种东西的集合。当然,除个体同生命关联之外,个体间的关联所构成的特殊共同体也反映了意义的多元复杂性,因为在社会生活尤其是日常生活中,不同个体通过共同影响和工作与他们(其他个体)联结在一起,理解他们并且他们也理解我们,舒茨在修正韦伯理论的基础上,为意义的赋予与把握提供了一种互为主体性的视角。总之,意义的本体论色彩使我们更加确信周遭社会生活中不可计算的诸多因素,并反对利用科学手段所建构的世界(或者当今的数码世界)来取代真实的社会世界。舒茨认为,常识构造由真实世界中的“此在”(Here)(在特定情境下的状态)所形成,“它决定了视角预设的相互性”。[31]38,从这个意义上来说,常识行动模式已经同科学模式区别开来。简言之,意义修正的目的在于强调了这样一个观点:个体间的能动的、互为主体视角所形成的思维模式乃是社会学学科研究的特殊属性。

  前文关于本体性意义的论证无非意在强调,基于社会生活的社会学学科“必须拥有自身独特的研究方法,这是基于对意义的理解的方法”。[6]94我们认为,这种方法实践的可能有效性途径之一是超脱于纯经验现实的想象力。具备此种个体、生命、社会、情境相互交织的想象的能力,意味着能够从重点关注人们即刻行为的科学研究方法中超脱出来,并站在高远处思索。这是米尔斯所呼吁的心智品质,它能够帮助个体使用信息并促进理性的发展,从而能看到一种清晰的全貌。正如米尔斯所强调的,“社会学的想象力让拥有此品质的人既能理解一个关乎诸多个体内在生命以及外在生涯意义的、更为广阔的历史情景,又能使他注意到,在繁杂混乱的日常经历当中,个体是如何错误地意识到他们的社会位置的”。[34]5从概念上来看,米尔斯的这一主张可以说是帕斯卡尔心智诠释的延伸。就社会学想象力的内涵而言,除了追问宏观层面的社会结构要素以及秩序的关联性意义之外,米尔斯还强调学术关怀中两个重要的维度:其一涉及人生意义的层面,即关注此时期此社会中盛行人格(抑或占主导地位的人的类型)的重要性,“他们以何种方式被选择和形塑、解放和压抑,并变得敏感和迟钝;我们所观察到的行为和品格反映出何种人性;我们所审视的每个社会特征的‘人性’,其意义是什么”。[34]7其二则关乎历史的维度。是古是今,都处于人类历史长河中。通过对历史长时段的关注,我们可以考察其中某一时期社会运行以及变迁的动力和特点;同时,我们尝试比较不同时期的社会,以此作为当今社会的参照体。所以,“社会学的想象力使我们能够把握住历史、个人生活以及二者在社会之中的关系。这是社会学想象力的任务和承诺”,[34]6也“正是通过社会学的想象力,人们希冀把握世界的进程,并且理解他们周边所发生的事,这些事都是反映社会中个人生活和历史交织的细小部分”。[34]7一旦能够体会到上述两个层面的重要性并付诸实践,那么无论处于哪个社会,人们都能感受自身并反观背后的大时代,体验社会科学的文化意义,即“社会科学所能起到的教养、启蒙和解放作用”。[35]而自二战之后,社会学学科的中心位置已在美国扎根。当地学科霸权的全球化扩散加上本土实用主义方法的横行,使得所谓的“抽象经验主义”愈发盛行;相反,关乎重视意义的想象力的方法学则已经呈现式微趋势。这样就产生了一个问题,当今进行社会研究的科研者们是否还需要具备并深刻理解学科产生至今的经典学术知识?这里涉及两个重要的概念,即科学和学术。在米尔斯看来,抽象经验主义的实践就是科学逐步代替学术的过程,“作为他们对社会本质和功能运作普遍关注的组成部分,杰出的学者们以博学的态势,并且是在宏大历史、理论以及哲学角度来研究公众舆论的,而非所谓的‘就事论事’,同时撰写专著。但是在今天,技术团队对特定的主题进行课题研究并汇报研究发现。二十年前,公众舆论研究是学术的组成部分。当今它却隶属于科学”,[34]54譬如涉及诸多问题域的研究无疑借鉴了自然科学的测量和建模方法,形成八股文式的范式。因为一般而言,自然科学基本上是把可看、可听或者可测的看作是真实的。[36]只要获得上述的结果,加上跨学科搬运的能力,就能达到特定的研究目的。由此,学术的立法者转变成了科学的阐释者。这对于整个学界发展乃至人类知识推进而言是有不小风险的:一方面,教育、学术再生产的过程中,学习者以此作为一个理所当然的模式;或者,尽管有人对此有疑问,也因外界其他强制因素而妥协,这是一种教条主义倾向。另一方面,正如米尔斯所说,各种细枝末节的研究、科学探索都是整个学术研究分工的一部分。自然科学、社会科学亦如是。但如果都在研究细节和当下,做自然科学以及美国量化研究模式的搬运工和阐释者,而逐渐脱离社会科学研究中独特的人文因素,那么必然呈现出学科异化的形式,即人们虽然作为一个个活生生的个体,却抛弃从事学术研究中所涵盖的人文启蒙、反思乃至突破意义。因此,在当今时期,这一60年前所提出的方法学实践主张随全球学术变迁非但没有失去其必要性,反而变得更为重要而且紧迫。

  我们无意于对意义本身作更为深层次的阐述,以上的探讨仅仅试图为社会生活意义的本体性特征提供一个非实证的论证分析,目的无非在于将现实的社会生活的固有属性同科学研究过程中尝试制造的理想模型进行区分。它通过对该复杂化意义的内涵与特征进行简要梳理,从外在和内在两方面形成一种对社会生活科学研究方法批判的视角,从而为本文所主张的研究方法学具体实践提供一种可能性的本体论根基与分析框架。  

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多