大数据应用是近来国内科技圈热议的话题,也开始走进拥抱科技的社会创新领域,公益数据库在这股大数据热潮下应运而生。目前主推公益数据库的是由南都公益基金会、NGO2.0和中山大学中国公益慈善研究院共同发起“中国民间公益组织基础数据库”项目,另一个则是映诺社区发展机构的数据库孵化项目。这两个项目都在近期展开宣传,颇受瞩目。
然而大数据并不是一天建成的,公益数据库的建设也依然会存在盲点和痛点,从社会创新设计的角度出发,我们需要深入探讨大数据策略在公益领域的可行性和执行方法,反思公益大数据的盲点,尽量避免科技给公益事业带来障碍,另一方面也需要采用设计思维、注重用户体验,抹平公益大数据的痛点,让科技可以更好的为公益服务。
盲点:大数据是神器
大数据最早是在2011年由麦肯锡公司提出,主要是指信息社会中由用户制造的海量信息。国内外科技圈主要集中在讨论大数据的科技含量、经济价值,鲜有从创新扩散、数字劳工、信息权利等层面对大数据进行深入反思。
美国杜克大学的行为经济学家Dan Ariely这样形容大数据:“大数据就像是青春期的性生活,每个人都在谈论,没人知道真的该怎么做,每个人都觉得别人都在做这件事,所以每个人都声称他们自己也在做这件事。”他用调侃的口吻,讲大数据目前的尴尬局面揭示得一览无遗。
大数据成了一种坊间的传奇,似乎每个人都在说大数据“可以做什么”,但是“大数据”到底要怎么做才能实现那些美好的愿景,很少有人讨论。大数据被人们视为一种神器,很多人以为,只要拥有了大数据,或者简单地说,有了大型的数据库,所有问题都能迎刃而解。
映诺社区发展机构在数据库项目的宣传稿中写道,“有了这个‘数据仓库’,我们就可以根据需要随时查询我们遇到的问题”,但是问题是,这些“我们遇到的问题”在未输入这个数据仓库之前,就存在了,每个机构自然对自己存在的短板和遇到的困难了如指掌,为什么还要专门派人花了时间、录入数据库,然后再登录数据库,在里面搜索自己遇到过的问题?再说,就算一时半会无法想起“我们遇到的问题”是什么,需要通过数据库检索获知一二,可就算是检索出“我们遇到的困难”,有什么用呢?可以通过检索获得这些问题的解决办法么?如果不能提供解决之道,我们为何要用这个数据库来检索我们自己录入的问题?
最关键的问题是,通过大数据解决社会问题,并不是指仅靠大数据库检索就能把问题解决了。微软研究院新英格兰研究所的数字人类学家Danah Boyd和KateCrawford在2012年将“大数据”定义为一种文化的、科技的和学术的现象,包括科技,分析和方法论在内的三大板块。大数据除了是一种文化现象,更多的还是一整套科技与社会发展的方法论,数据库只是Boyd和Crawford所指的科技板块的内容。在国内的公益大数据类的项目中,科技板块,比如说大数据库、云存储等技术含量的部分得到强调,但大数据中更为关键的“分析”和“方法论”的部分,我们却很难从这些项目的宣传中看到相关内容,这也从一个侧面看出国内公益大数据项目对大数据的技术板块的过度推崇,对分析、方法论的管理和运营板块的忽视。
这种生搬硬套的采用技术创新产品的方法,忽略了科技采用的“本土知识”,也就是说,并没有考虑公益机构以往的技术使用以及问题解决的方式方法,或者说,至少在宣传文案里,并没有很好的传递出“新的公益科技产品所提供的服务,能够切实的满足公益机构的业务需求”的意思。
或许这样一种“大数据好”的吆喝,可以引来好奇和看热闹式的围观,但并不能长久留住用户,如果不能在分析和方法论层面尽快有服务性产品,或者给用户良好的使用体验,用户就会很快流失,连基本的数据收集都很难做到,更别说大数据了。
“中国民间公益组织基础数据库”的主页君曾在微博上无奈地说,“经过十月尾几轮小高潮,数据库增长速度又疲软下来了”,由此可以看出,我所指出的这种盲信技术、忽略用户体验的推广、运营模式所隐藏的风险并非危言耸听,而是的确存在的,也已经给项目推广带来了一定的阻力。
雅安地震发生后,益云救灾地图团队曾获得来自腾讯微博约20万的庞大数据。20万条微博,这个数据量够大了吧。当我们得知可以拿到这样一个数量级的数据时,我们欣喜若狂,本以为可以从中找到更多有效的需求信息,为救灾提供更多的信息援助。但是当我们打开这个数据库,我们全都傻了眼。微博用户制造的数据,往往是个人化的、根据现场的情景发出的,多是情感型、符号型的信息,例如心情描写和表情图案等等,能够直接用于信息救灾的确切灾情时间、地点、人物、需求反而描述很少。信息救灾团队需要大量的人力和时间成本,从堆积如山的信息池里淘洗、分拣、提炼有效数据,为信息救灾的需求洞察、决策提供最精炼、准确的数据。要将这20万条五花八门的个人化数据分拣、提炼、入库、执行,在短短数天的地震救灾时限内,“臣妾做不到啊,亲。”
大数据的收集和管理并不像传说中那样高端、大气、上档次,而是最苦、最累、最脏的活,大数据也并没有想象中那样出神入化。大量庞杂信息的无效堆积,就如源源不断的运往灾区的未做任何消毒处理的捐赠来的旧衣服一样,最后恐怕只会因为可利用性极低而被迫弃置,耗费了大量的运营成本不说,还影响了公益项目的正常进行。
所以说,公益大数据,光大是不行的。光是通过云存储、网页登记等方式快速收集来的大量庞杂的数据,忽视数据的整理、分析以及大数据的方法论,也会影响公益决策的有效制定和高效执行。运用技术手段实现海量数据的收集只是公益大数据的第一步,大数据的管理、洞察才是最关键,也是最难做好的部分。
Boyd和Crawford认为,一方面大数据作为工具可以为癌症研究、全球暖化等问题提供可能的解决途径;另一方面,大数据也成为了意识形态上的“老大哥”的一种隐喻,信息提供者的隐私被拥有数据的“老大哥”侵入和监控。
斯诺登事件、德国总理手机被监听事件也进一步引起国际政界和学界对于大数据背后的数字监控问题关注。公益大数据还依然存在这样的问题,数据收集来了之后给谁看,是否能保证数据提交者的信息安全?是否能保护数据提交者的信息权利?那些被深圳慈展会拒之门外的草根NGO,如果加入这个数据库,是否遭到更加严格的监管呢?这些顾虑是横亘于公益产品和用户之间的鸿沟,阻碍了公益科技产品的创新扩散,简单来讲,就是导致没有多少人愿意使用这些新的公益工具。
从产品运营的角度来看,这些问题都需要给出合理的回答,才能打消用户的疑虑,获得用户认可之后,才能最终赢得用户垂青。设身处地从用户的角度出发,考虑到草根NGO所面临的文化、政治等各方面的处境之后,再设计、提供相应的科技工具,这不仅仅是公益科技产品的设计好坏、技术水平高低的问题,也不仅仅是公益传播和产品运营的问题,而是对草根NGO的信息权益的基本尊重和满足,说到底是对人的尊重。
或许草根NGO真的需要“支持型组织的关注,开辟更多获取资源的途径”,真的希望“进入公益研究和倡导者的视野”,但这不是产品真正的用户需求,这只是愿景。从产品设计的角度来看,真正的产品需求是,一种能够实现这些公益愿景的科技工具,在使用工具时能够满足诸如易于接入、填写方便、信息传达准确、提供解决之道的数据库。公益数据库的宣传和推广需要根据这真正的产品需求来做文章,才能有的放矢,真正吸引到用户。
一旦忽视这些用户需求,用户就会提出这样的问题:为什么一定是公益数据库这样工具?公益数据库项目除了提供一份不知道具体有什么用途的分析报告之外,还能为用户提供什么服务?这些需求与服务之间的鸿沟,“中国民间公益组织基础数据库”的主页君并没有给出合理的解释,反而一直在说“数据库的资料具体会提供给哪些组织,目前阶段我们依然在研究当中,尚未确定”。这说到底是这些数据将来会怎么使用的问题,一个公益数据库项目连具体如何使用都“尚未确定”,那怎么让录入信息的用户相信,他们的数据会被安全使用?
此外,研究者和倡导者向政府建言献策的目的是为草根NGO服务,从这个项目的信息采集页面的内容来看,仅仅是收集输入机构有多少员工、上一年度总支出这类基本情况上的信息,草根NGO用户并不知道研究者和倡导者收集这些数据可以用来干嘛,也根本不知道研究者和倡导者要研究和倡导的议题是什么,更不清楚获得这些数据的研究和倡导者能够为草根NGO提供什么样的服务。
另外,这个信息采集页面看上去更像一个网络调查问卷,NGO用户填写完这些问题之后提交入库。虽然网络调研方法越来越流行,也能帮助研究者减少工作强度、提高调研效率,但是不是说研究者就可以依靠网络问卷翘着二郎腿、一劳永逸的获取数据。网络调研的研究者依然需要尊重受访者,至少是要在网络问卷上说清楚研究的大概背景,并向受访人保证维护他们的隐私安全。这些最基本的网络调研要求,在“中国民间公益组织基础数据库”的数据录入系统里,完全看不到。草根NGO用户不仅不清楚数据是否会得到隐私保护,也不知道数据会怎么使用,这也让用户不禁怀疑,这样的数据录入,真的安全么,真的可以像宣传稿上说的那样,可以获得更多的资源么?
用户在使用上的不安全感,造成了对这类项目的不信任,项目很难在更大范围内赢取用户,公益科技创新慢慢也就变成了一件“好看不经用”的摆设。
数字劳工与草根NGO的信息权益
至于说到草根NGO录入数据,可以帮助公益研究者和倡导者“向政府建言献策”这一点,则更有颠倒主次之嫌。首先,草根NGO本来就是公益倡导者,他们的公益行动本就是在倡导一种公益理念,并不存在一类公益行动者之外的倡导者。不可能说让受助者先完成数据录入任务,再通过抽奖的方式获得援助或奖励,这样做的话,说轻一点是搜集资料为服务草根NGO做准备,说得重一点,有违公益伦理之嫌。
这就好比说,为了帮助救灾人员尽快做好灾情评估、尽快为受灾群众提供救助,现在有一个最新的灾情收集、评估系统,所以让受灾的老乡们自己通过网络录入自己的受灾情况,主动来录入灾情的,先每人发一袋白面,然后根据灾情信息录入的好坏,再弄个抽奖,中奖的受灾老乡,再每人派发一袋大米以示奖励。这哪里是什么公益行动,这明明是土豪地主坐享其成的收租子嘛。
这让我联想到传播学上所说的“数字劳工”(digitallabor)概念。数字劳工,指的是那些通过主动生产的免费信息而使得信息运营商获利的普通用户。他们虽然免费使用推特、微博这些社会化媒体,但是在数字化媒体中制作的数据则令推特、微博的运营商在资本市场获得巨大的利益,而这些利益并不会被分配到这些普通用户身上,社会化媒体运营商通过提供少量的免费服务来剥削普通用户为他们创造的巨大利润,所以称这些用户为“数字劳工”。
虽然我相信,“中国民间公益组织基础数据库”这类公益数据库项目,并不存在通过数据录入牟利的目的,出发点也是希望借助技术的力量为公益谋福祉。但是很可惜的是,从他们的推广文案到主页君对批评质疑的回应,多少给人一种让草根NGO免费完成任务、充当了一回“数字劳工”的错觉,也让我们不得不要求这类公益大数据项目在方法论上多下一点功夫,在维护NGO从业者的信息权益方面多花点心思。
说到底,玩转公益大数据的关键,不仅仅是技术的问题,关键还是在于需要有一套行之有效的大数据方法论。这套方法论一方面来自于以人为本的公益理念,一方面植根于科技为社会创新服务的用户体验。两者缺一不可,也并不矛盾,实际上是一体两面的共生关系。以人为本的公益理念可以通过提升公益科技产品的用户体验得以执行,良好用户体验的获得也需要在公益科技产品的设计、推广和运营的各个阶段、各个层面贯彻以人为本的公益理念。将两者融会贯通,这才是真正意义上的公益科技创新,公益大数据的潜力才能得到最大程度的开发,也才能真正为草根NGO插上飞跃发展的科技之翼。