首页 > 范文大全 > 正文

大数据驱动的社会工作:前景与挑战

开篇:润墨网以专业的文秘视角,为您筛选了一篇大数据驱动的社会工作:前景与挑战范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:“大数据”使得社会科学研究出现新的范式,多方面的驱动力促使社会工作学科必须积极探索该领域,即如何充分利用大数据更高效地输送专业社会服务,更精准地倡导合理的社会政策。大数据驱动社会工作就其前景而言,主要体现在:在社会工作应用中,大数据能够实时获取、更新真实的人类行为数据,从而避免了数据收集过程中对被试主观报告的依赖;为风险人群的评估和危机干预提供了高效、准确的技术手段;对服务人群、基本社会服务设施的时空分布能有更精确和直观的把握;也可以为公共政策制定提供证据,值得我们积极探索与创新。当然,大数据的使用也存在着技术、法律、伦理等诸多方面的挑战

关键词:大数据;社会工作;社会政策;计算社会科学

中图分类号: C916 文献标识码:A 文章编号:0257-5833(2017)07-0074-08

根据中国互联网络信息中心 (CNNIC) 在京的第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,中国互联网普及率达53.2%,网民规模达7.31亿,手机网民达6.95亿,与欧洲人口总量相当。互联网塑造了全新的社会生活形B,对整个社会的影响已进入新的阶段。互联网时代的QQ群、博客、微博等在线社交网络社区的不断涌现,尤其是微信等社交APP的广泛使用,正在不断产生着大量具有社会属性的数据。数据是重要资产,在科学研究中具有独立且重要的地位。近年来,井喷式出现的大数据 (big data),像刺破重重迷雾的探照灯光,在极大地提高了我们认识世界广度和精度的同时,正在深刻地改变我们的生活、工作与思维模式,冲击社会科学的基本理念、研究逻辑、研究方法与技术1,也为社会工作的研究和实践带来新的机遇和挑战。

我们正进入一个“新”的社会,互联网与流动性的叠加正在重组我们的生活方式,因为有了互联网和流动性,人们开始脱嵌于以往的共同体,而投身于陌生人社会的熙熙攘攘和虚拟的流动空间。大数据正是展现如此流动性的重要载体。社会工作需要探索如何充分利用大数据更高效地输送专业的社会服务,更精准地倡导合理的社会政策从而实现专业目标,并探索建构基于大数据的理论体系、研究方法与实践模式,也就是大数据驱动的社会工作。唯此,社会工作才能更好地适应于这样一个完全不同的社会形态。因此社会工作需要直面互联网思维,不能自外于这样的趋势,固守自己的小天地,而是要寻求新的突破。美国社会工作与社会福利研究院2015年的一份战略性研究报告Harnessing Big Data for Social Good: A Grand Challenge for Social Work就明确了一个核心议题:如何使用大数据技术服务于公益1。这一议题对于中国也是切合的,互联网的广泛使用正在催生一个新的时代和一个新的社会,社会工作需要认真思考如何面对和适应这样一个新的时代。因此本文拟对大数据与社会工作的融合应用进行探讨,并展望未来可以发展的方向。

一、大数据:社会工作研究与实务的新机遇

大数据是人类活动的副产品,如执行政府职能、提供服务、管理项目、进行商业贸易、通过社交媒体交流、使用电子设备、写作 (发表意见、评论和文章等) 等,以数字存储形式广泛存在,其数据内容体现出体量大、增速快、类型多、真实性强、应用价值高等特征,且更加注重对研究对象地理位置信息的提取2。大数据的“大”也不单指其数据量,还包含数据元素和来源的速度、多样性以及将原始数据转化为有用信息所需的复杂分析过程3。近年来,网络通信技术的发展推动了大数据集的产生、收集和处理效率,基于Web2.0的众包数据技术的出现提供了广泛的数据生产平台,如智能手机APP、博客、维基数据、社交网络平台、P2P软件等4。公众或平台用户首先作为数据的使用者,通过开源的数据获取平台自行获取初始数据,并将处理和使用的数据上传,与其他用户共享,还可成为数据的生产者。数字革命正在产生大量的社会、心理和组织数据,包括计算机化的社会服务、教育和健康记录、开放数据门户、社交媒体、网页搜索记录以及移动GPS设备和传感器等来源的数据,而越来越多的人工智能、机器学习、数据挖掘、情感分析等方法的出现推动了大数据技术创新,使得实时管理和分析这些数字资产变得更为及时和高效5。

大数据对人类活动的实时记录特点可较大程度地排除获取数据时的人为干扰,它也将抽样数据中被排斥的极端值重新纳入统计分析。在分析因果关系时,大数据有助于克服由于抽样偏颇所引起的样本选择性偏误,匹配数据可以克服或缓解变量遗漏问题,对确定因果效应、检验因果关系比抽样数据更为有利、稳健和可靠6。在挖掘大数据过程中,深度学习技术在高维数据、扩展性模型和分布式计算中发挥了语义索引、数据标记、快速信息检索等方面的强大功能7。针对大量出现的如Twitter上的留言、博客、图像、视频数据等抽象数据,深度学习技术可将这些非结构化的或弱结构化的、高层次的数据转化成一个结构化的格式进行分析、提取和量化,极大地丰富了大数据的来源,也为与社会工作的结合提供了可能性。因此,大数据带来社会科学范式转换,交叉融合社会行为和数据计算处理系统来研究社会运行的规律与发展趋势,引领“计算社会科学”这一研究领域的快速崛起8。计算社会科学从行为分析出发,可以对复杂的人类行为模式和社会运行机制进行深入且精细的跨学科定量研究,社会工作可以受益于这一发展趋势。

实际上,承载着我们生活印记的大数据正在以一种新的方式展现我们身处的社会,这开启了一种新的社会想象,这对社会工作而言是全新的议题。根据哲学家泰勒的观点,社会想象就是身处于社会的人们对于这个社会如何运作的认知和期待,主要包括:人们相互之间有什么样的期待,遇到某种事情会有什么反应,采取什么样的应对方式,我们的人际交往会呈现怎样的面貌。1大数据时代的社会想象是以非结构化的数据为聚焦,围绕的是一个定量的且以可能性与模糊性为特征的世界,从而呈现出双重趋势:一方面是“社会的数字化”,人们有意无意留下的数据足迹越来越丰富,社会越来越多地以数字的形式呈现;另一方面是“数字的社会化”,数据成为社会结构的组成要素,从而不断塑造着新的社会2。这两种趋势都要求社会工作在研究方法、服务提供和绩效评估等方面作出适时的改变。在这样的背景下,多重因素驱动社会工作与大数据的结合。

首先是基于证据为本的社会工作实践的发展。证据为本的社会工作实践立足于科学研究提供的证据,专业的干预是基于研究结果并将这一结果应用于服务案主。这不仅在很大程度上激励了社会工作的科学研究,特别是干预研究,更进一步促使社会工作的科学化和学科化①。John Brekke指出,社会工作的科学研究和证据为本的实践依据取得了足够的进展,到了推动建立社会工作科学的时机3,社会工作应以整合的方式应用学科知识去解决不同的问题。然而目前的社会服务系统缺乏有效评估项目所需的数据管理和分析框架,因而缺乏操作性和标准化,使得跨部门之间的数据整合以考察项目长期成本和收益存在较大的障碍。大数据的出现能有效地改善这一现状。传统的社会工作依靠实验、问卷调查、访谈等数据收集方式研究社会工作面对的不同群体,评估不同的社会工作干预模式,考察不同的社会政策的绩效,基于理论驱动和演绎逻辑而较少使用数据驱动的策略。在传统范式下,研究起源于问题发现,基于问题导向收集相关数据。但由于时间和经费的限制,数据收集往往局限于较小范围内的抽样调研,数据虽然针对研究问题但规模有限,这使得社会工作政策和实务的循证性不足。而在大数据的研究范式下,数据获取更为便利,研究主要是数据驱动结合理论驱动,不需要模型和假设,可利用自动设定的批处理程序直接分析海量数据,发现或检验数据间的相关性或规律4,进而为社会工作实践提供实质性证据。

其二,宏观社会工作知识体系的建构需要数据的支持。在不断面临全球化冲击所带来的话语体系和知识结构变迁的过程中,社会工作更是要强调本土专业实践中的文化敏感性。对照中国社会工作发展的现实,社会工作现有的知识体系过于注重微观导向。尽管社会工作强调人在情境之中以及社会视角,但随着美国等国家临床社会工作的迅猛发展,社会工作的知识体系不可避免地偏向精神病学、心理学和公共卫生学,这使得宏观社会工作知识体系进展缓慢。大数据为社会工作建构宏观社会工作知识体系铺陈了可能的空间。在大数据研究范式下,数据获取的便利性使得收集多种不同类型的大样本数据成为可能,为认识宏观社会、检验社会现象的“异质性假设”和“结果稳定假设”提供了数据基础。行政大数据和公共服务大数据的深度挖掘和分析有利于宏观社会工作知识体系的构建,可利用数据分析成果进行服务规划、政策倡导,扩大社会影响力与政策影响力,从而实现社会工作的宏观目标。

其三,社会工作需要寻求跨学科的合作和对话。社会工作要回应不同人群的需要、面对不同的社会文化脉络,更要直面社会的急剧变动,所需要的知识是多元的。我们如果过度强调社会工作的专业化,可能将其引入封闭的知识困境。因此,寻求与不同学科的合作与对话是社会工作构建自己的知识体系的必由之路。计算社会科学的兴起可以为社会工作提供新的研究路径,从而为跨学科的合作提供方法支持。我们由此可以在前所未有的深度和广度上收集和利用数据,为社会工作研究和实践服务。

最后,为社会政策的形成提供数据基础。福利多元主义的社会政策分析范式主张社会福利来源的多元化,福利的规则、筹资和提供应由不同的部门共同负责、共同完成1。政府应该发挥资金投资主体的角色,积极培育和支持社会组织的发展,实施积极的财税政策以鼓励企业和民间资金进入社会福利服务领域2。而非营利组织和有影响力的基金会资助者希望能依靠数据和预测分析以取代常规智慧支持其业务决策和长期战略,也越来越需要提供具体的指标来评估项目的内容,并确保质量标准和成果达标3,大数据是一条很好的实现途径。越来越多的公众参与其中的大数据增加了一条可充分参与决策的途径。“开放大数据”提倡某些类型的数据应该易于传播,使其可以重复使用、分析并转化为新的和有用的产品4。社区之间也需要获得跨系统数据,以期更好地服务于目标人群,诸如弱势青少年、无家可归者、贫困儿童等等5。

由此可见,大数据技术可以强化社会工作的专业回应。一般而言,由于缺乏在信息数据产生时进行及时分析的能力,社会服务机构对新兴社会问题的反应总是滞后而不是先发制人的。大数据技术的发展可以有助于克服这些障碍,及时发现社会问题并予以更为快速的回应。这是因为,相较传统数据,大数据拥有的实时信息更为精细、全面和准确6,可实现对人类社会活动的快速实时反映。然而,其指导社会工作的潜力尚未得到充分挖掘7。正如电商可以从消费者的行为和品位中收集大数据,并将产品个性化定制,社会工作部门也可采取类似的做法以提高项目的针对性,单独或集体性地提高服务对象的生活质量。进而,社会工作基于对来源不同的个人及社交环境的详细数据的预测分析,考虑不同行为因素的顺序特点、非线性及其相互关系,以及可能在社会组织的各个层次上发展的复杂系统动力学,可指导修正行为因素的政策或实务干预手段8。大数据可以促进跨学科、跨领域的合作研究,突破以往的研究模式,从而回应社会建设、社会政策和社会服务的重大问题。比如,可以实现更大范围的社会工作干预研究,超越随机对照试验的样本局限。目前,我们已经具备了生产大数据的软件技术、硬件平台和有效的数据来源,需要进一步思考大数据在社会工作之中的实际应用,为增进社会福祉作出应有的贡献。

二、大数据的社会工作应用

大数据提供了丰富、详细、实时的信息,有助于社会科学家更加全面、大尺度、精细化地开展各类社会科学问题的研究。目前国外已有一些基于大数据的社会工作实务和社会福利政策尝试,在基于社会服务机构的行政记录大数据的研究、实务以及政策制定方面已积累了一定的实践经验,并建立了数据库管理、记录联动方式、数据清理与统一、大数据集的统计分析等方面的知识和技能体系。经过深度信息提取的社会大数据可用以有效解决社会工作之中贫困、危机干预、医疗康复、儿童保护等较困难的实践议题。如可将每月公共援助和社服务记录相结合,探讨国家政策具体要素的效用,如福利时限和制裁措施是否影响到项目参与者1。而基于其他组织部门 (如就业、儿童福利) 的行政记录数据,可探讨一个机构执行的政策如何影响其他机构2。也有研究基于美国多个州的儿童福利管理记录,提出了比较其服务模式、结果指标和政策建议的方法3。将儿童福利记录与出生及死亡证书相关联,以检查一些流行病学相关问题,如寄养儿童中的青少年生育率以及虐待后的伤害死亡等4。另外,综合行政记录还可以用于识别遭受虐待的高风险儿童,以便更有策略地进行预防服务5。类似地,大型行政记录信息的提取和分析也在无家可归者服务领域得到应用。有研究者分析了几个大城市的无家可归系统记录,并将其与其他机构的记录相关联,以发展广泛应用的服务领域范式6。相较于传统的高成本长期随访研究,通过各种可用数据库对实验/对照组的被试结果进行追踪,大数据技术也能为随机对照干预实验提供更快、更低成本的结论/建议。如通过对来源于几个社会服务机构的个人相关记录的分析,发现针对残疾医疗补助者的新病例管理模式效果显著,具体体现在急诊病例数、无家可归者数量以及接受药物滥用治疗等方面7。

目前,大数据应用于社会工作还只是处于尝试阶段。实际上,大数据在社会工作领域有着更为广阔的应用前景。伴随网络使用普及率的快速攀升,网络大数据的采集促使研究样本能无限接近于总体分布情况,这既扩大了研究采样的规模,又提升了研究采样的代表性。这样,社会工作就有了更大的可能去实现宏观使命。

第一,网络大数据支持实时地获取、更新真实的人类行为数据,从而避免了数据收集过程中对被试主观报告的依赖,可有效解释或揭示群体心理特征的连续变化趋势8,从而把握社会的脉动。随着互联网发展,网络平台已成为当今人们意见表达和利益述求最重要的渠道之一,网络舆论也已成为公众舆论的主要形式,为及时有效感知社会心理态势以及网络舆情分析,确定公共需求以便及时确定政策制定和服务方向提供新的契机,这一定程度上解决了传统大范围问卷测评周期长、成本高、无法及时更新、生态效应低、纵向追踪实施困难等障碍9。如孙玖陌等通过微博大数据对政府满意度进行评估10,类似地,大数据分析可对社会工作专业的民意和服务领域进行评估。在“四川雅安地震”等突发事件发生时,积极参与救援者表现了较高的舆情传播能力和公众反应度1。因此,大数据的应用还可以帮助社会工作实现“时势权力”2。

第二,大数据为风险人群的评估和危机干预提供了一种高效、准确的技术手段。通过微博等社交媒体大数据,可有效感知用户情绪变化,心理健康,并进行自杀预防3 。依据百度等使用者大数据,可以识别疾病的分布和高危区,并进行针对性防治。朱廷劭通过多种新闻媒体等渠道得到某地发生的数据,并采用时序分析技术预测社会心理发展趋势,进而预判网络发生的风险指数。针对数量少的情况,可综合采用多种机器学习方法,利用微博数据预测风险,实现对群体社会态度临界状态的预警,发现并识别社会不稳定因素,为及时化解可能的提供数据支持,助力社会管理创新4。国外有研究者使用Twitter和Facebook产生的大数据追踪“阿拉伯之春”的抗议信息和公众舆论,以衡量抗议动员的速度和程度5。社交媒体活动也有助于快速评估自然灾害造成的损害,如Twitter的人均活动与飓风造成的人均经济损失密切相关,通过Twitter大数据,可以直观地观察到所感知的威胁和物理灾害效应6。开放数据应用OpenStreetMap等在多次救灾过程中也得到了重要应用。而微博、微信等应用同样适合快节奏下的紧急情境,相关部门应提高情境意识,利用互联网和大数据技术促进应急信息的传播,并据此实行预警系统并协助救援工作。

第三,基于大数据对服务人群、基本社会服务设施的时空分布能有更精确和直观的把握。利用来自百度地图的人潮数据,可预测密集人潮的形成情况,并针对可能威胁公共安全的异常大规模人潮向有关部门发出提醒,从而实现精细化的社会治理。我们可以通过微博、微信、QQ等移动客户端数据结合其地理位置信息实现服务人群定位。比如,由腾讯社交网络事业群数据中心与“清华大学-腾讯”联合实验室合作研发的“宜出行”基于“IP街道级位置定位技术”,可将人群分布精确至街道级,这对社会服务的空间布局具有启示意义。有研究者通过结合机器学习算法以及谷歌街景车搜集来的机动车辆数据,从而估算出本地区人口的特征和组成,甚至这一地区居民的政治倾向7。采用类似的方法,我们也可基于“宜出行”、微博、消费等大数据估算服务人群的分布,评估社会工作服务机构的数量和质量合理性,制定政策并开展针对性的专业服务。因此基于大数据平台出发,可以提出更为合理和高效的服务传递策略,从而在很大程度上提升社会工作服务的可及性和优化社会服务的空间布局。

第四,大数据的深度融合可为公共政策的制定提供证据。对公共服务设施分布以及相对服务人群的可达性进行分析,将有助于及时发现交通需求和设施需求等,提升公共服务资源公平性。如随着医疗大数据 (包括医药消费的数据、临床诊断数据、病人行为数据和药品处方数据等) 不断开放获取,这些以往难以获取或者被忽视的数据也将在促进居民健康公平中发挥重要作用8。以贫困问题研究为例。贫困是21世纪人类社会发展面临的长期困境之一,也是社会工作的重要服务领域。对于发展中国家而言,估计区域贫困水平是精准制定消除贫困战略的关键问题。已有研究证实遥感卫星所测夜间综合数据可作为中国县级贫困评估的有用工具1。类似的几项研究也证实夜间灯光大数据预测贫困的有效性2。而另一种新型机器学习方法,可从高分辨率白天卫星图像中提取社会经济大数据以预测不同地区的贫困程度3。此外,还有研究利用手机大数据预测贫困4。可见,大数据已成为精准定位贫困人群和地区的重要手段,社会工作者可以利用这一技术协助开展精准扶贫工作。

三、大数据的社会工作应用面临的挑战

大数据为社会工作研究带来新机遇的同时,我们不能忽视在应用过程中可能出现的挑战,诸如数据安全和使用伦理、数据处理技术、研究方法等等。

第一个挑战是如何保障以安全和合乎伦理的方式应用数据。数据安全和使用伦理是一个中心问题,特别在涉及人类服务、教育和健康记录方面的时候。随着信息通讯技术、相关电子设备及应用程序 (APP) 在人们日常生活中的普及,有关个人的信息也在不断地产生并成为网络中的“痕迹”。在帮助研究者去有效识别和描绘特定个体和群体的同时,使用者的隐私却完全暴露。在实践中,如何保护用户隐私,如何建立一套数据使用伦理的标准体系是关键问题。而在涉及数据的所有权和控制权,尤其是当不同来源的数据被整合应用超越原始意图范围并产生更高价值信息时,需要数据持有部门放弃个人控制权以实现更大的社会效益。社会工作应当将数字技术和大数据分析手段纳入服务规划和政策制定,消除跨部门间的数据孤岛,促成多学科合作,建立严格框架以平衡隐私保护和公共利益。我们还需要考虑因大数据的广泛应用而出现的“数据鸿沟”,社会工作要弥合而非扩大这样的鸿沟。

第二个挑战是如何提供技术有效处理数据。针对大量且繁杂、碎片化存在的信息数据,如何对其进行快速清洗和处理 (如关键词分析与提取),提取有效及有针对性的信息,并保证在过滤过程中没有信息丢失, 是一个核心课题。大数据通常包含来自特定源的所有数据,其中绝大部分是无意义的,也常常包含一些不完整的信息和错误的数据,必须在数据分析阶段得到有效的处理 。大数据是复杂且高度可变的,如果不经过细致的审查和策划,容易出现误解和错误。除了常用的结构化数据之外,大数据还大量以非结构化文本、图像和录音等形式广泛存在,因此对数据进行分类管理、处理、存储和分析的常规方法往往不足以拇笫据中获取全部价值。

第三挑战是如何解决数据可能存在的偏差。大数据是有偏的数据,如何“去伪存真”,避免大数据产生的有意或无意的统计偏差,最大限度地保留有效信息,这都需要更深的探索。在成熟应用前,过度依赖大数据还会导致重要信息被忽视,如老年人和收入或受教育水平低的个体在社交媒体数据中所占比例不足 ,而年轻人和较为富裕的个体在公共服务消费数据中比例过高。因此结合其他辅助信息并基于影响数据生成过程的因素对大数据进行解释显得尤为重要。大数据也存在单一性,有时仅包含有限变量,如家庭和企业的用水、用电记录,手机消费记录等,需要对其进行匹配,如通过手机消费记录、网上购物记录和快递公司的送货记录,可以分析手机用户的网络消费情况,进一步也可以与其人际交往情况匹配,但其匹配又存在产权和伦理问题。

第四个挑战涉及研究方法的论争。我们强调大数据时,不应忽视对个人体验的感知、阐释。建构社会工作的知识体系应遵从科学的连续体,一端是抽象的、概括性的,形而上学的,另一端则是具体的,经验性的,具有事实性。在大数据背景下,大数据到底应该在研究过程和知识产生过程中扮演什么角色呢?正如前文所述,我们不仅应该坚持对数据准确性追求并积极提取有效的信息,也应明白数据仅仅是服务于理论的工具,是为了证明理论的前提和假设。也应考虑数据背后的情景、情绪和现实关系,对分析结果应注重于线下数据以及相关理论分析的对接。大数据在一定程度上确实提供了使学科研究更加客观的途径,但在数据筛选、提取过程中也存在一定的主观意识和偏差,我们应警惕大数据加大定量研究和质性研究之间的对立性。社会工作面对复杂的个体与社会,难以脱离特殊的社会环境。大数据倡导的也是对原始数据的处理和再阐述,也重在对事实的真实阐述和反映,从这一点来说,质性和定量研究应该被予以同等的重视而不需要被严格区分。在大数据为社会工作研究带来很多机遇并以数据为研究导向的同时,我们不应该放弃传统小数据的研究范式。大数据也存在样本偏差与代表性问题,而数据处理的方法和手段能有效减少样本偏差。我们应坚持对研究问题的规范设定、抽样样本的控制,数据采集与分析过程的严格标准等。在实际操作过程中应结合大数据对整体趋势的把握以及小数据对具体细节的捕捉。

结 语

大数据为社会工作研究和实务提供全新的机遇和挑战,利用大数据为实现社会工作的专业目标提供全新的可能性,这是一个具有较好前景的探索领域。当然,面对大数据带来的冲击,我们一方面需要高度重视大数据在社会工作研究和实务中的价值,去积极探索、实践、创新;另一方面,也需要对大数据的应用进行冷静思考,考虑其潜在的危机和风险,反思如何在这一背景下促进社会工作自身的发展并扩大整个学科的影响力。尽管已有社会服务机构已开始纳入大数据分析用以指导政策和实践,但基于大数据的项目和实践的有效性和长期成本效益需要进一步的评估。社会工作专业人员对大数据管理的基础知识认识较少,难以较好地与其他学科的专家进行有效协作以加速数据驱动的社会创新,这需要社会工作教育界和实务界推动大数据人才的培养。

Social Work Driven by Big-Data: Prospects and Challenges

Chen Wanzhen He Xuesong

Abstract: As the emergence of a new paradigm in social science research driven by big data, a new field of social work develops accordingly. For instance, how to harness big data for social work to delivery social services more effectively and advocate social policy more accurately. The combination of big data and social work could provide new solutions to social problems. Firstly, big data has made it possible to access and analyze the data of human behavior , which helps to avoid relying on participants’ subjective report. Secondly, evaluating high-risk groups in a more efficient and accurate manner and intervening crisis more timely could be possible. Thirdly, big data could facilitate identifying the spatio-temporal pattern of target populations and basic social service facilities. Lastly, it provides reliable evidences for policy making. However, an effective framework remains lacking in addressing the legal, ethical, and privacy concerns in this new field.

Keywords: Big Data; Social Work; Social Policy; Computational Social Science