推荐阅读:摘要:文章在观察与对比国内外数据新闻生产现状的基础上,将数据新闻生产的难点概括为六个方面:确定选题难、数据来源少、数据采信难、数据解读难、视觉呈现难、价值开发难,并总结出了国内外目前在数据新闻生产领域的五种卓有成效的创新:挖掘分析、新闻应
摘要:文章在观察与对比国内外数据新闻生产现状的基础上,将数据新闻生产的难点概括为六个方面:确定选题难、数据来源少、数据采信难、数据解读难、视觉呈现难、价值开发难,并总结出了国内外目前在数据新闻生产领域的五种卓有成效的创新:挖掘分析、新闻应用、整合用户数据、专业服务、跨界生产。
关键词:数据新闻;新闻教育;创新研究;数据素养
《卫报》于2009年开始数据新闻报道的实践,此后,纽约时报等国外传媒机构纷纷组建专门的数据新闻报道团队,开创了数据新闻报道这一新的报道形式,国内则主要是四大门户网站的新闻频道在2012年开辟了相关栏目。2012年,GEN(Global Editors Network)发起了首届数据新闻奖,对于数据新闻这种形式的推广和质量的提高起到了非常重要的作用。
本文在考察国内外数据新闻生产流程和现状的基础上,思考此类新闻在制作过程中的难点和热点,结合技术发展、用户需求与体验、业界的探索、传播学规律等,探究目前国内外数据新闻的创新路径。
一、数据新闻的主要形式与生产流程
(1)数据新闻的核心与形式
数据新闻,又称数据驱动新闻,其前身是精确新闻,对其最早的表述之一是由Every Block的创始人阿德里安?哈罗瓦提于2006年提出。他认为记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”。刘义昆认为,数据新闻就是利用数据挖掘、数据分析、数据统计等技术手段从海量数据中发现新闻线索,通过可视化技术呈现新闻故事的新闻报道方式。[1]Bradshaw认为数据新闻的产生基于对原始数据的分析并将其放入具体的情境,再通过可视化形成新闻叙事之后在各种平台发布而实现社交化。《数据新闻手册》则认为数据新闻就是用数据处理的新闻,它与其他的新闻形式不同之处在于创造了这样一种可能性――把传统的新闻敏感性和讲故事的能力与大规模的数字信息结合起来。
基于既有表述,笔者认为,数据新闻的几个核心要素主要包括:数据、新闻价值和具体的情境、一定的数据挖掘和分析方法、可视化的形式。
数据新闻并非一般意义上以数据为唯一信息表现形态的新闻形式。借助于相应的编程工具和绘图软件,数据新闻的呈现形式主要包括:信息图、交互式图表、数据地图、时间轴、动态气泡图、词云等。
与一般意义上的新闻侧重于“新近发生的事实”相比,数据新闻是从海量的数据中发现新闻线索和故事,再对来自不同机构的数据进行筛选、比较、关联和挖掘等加工与凸显的过程中,寻找对公众有意义和有价值的新闻。
(2)数据新闻的优势
1、过滤与凸显。互联网时代,各国的各级政府部门、商业公司、社会组织等生产的众多数据会在互联网上公开发布,但是普通网民要么极少主动地接触这些数据,要么很难在数据间建立关联,借助于专业的数据新闻编辑和记者,这些散乱的、庞大的数据的价值可能被重估。专业的数据新闻生产者,可以依靠新闻价值和新闻敏感,围绕特定的选题搜集、抓取业已存在的各行各业各地的数据,通过过滤等方式,发现其间存在的对于公众有价值的信息,将之进行可视化,呈现给公众,进而凸显社会运行过程中的变化及其对公众的价值,更好地履行传播功能。
2、挖掘与解读。数据新闻生产的关键在于搜集相互关联的数据,捕捉数据背后的变化与亮点,并对此进行尝试性解读。数据新闻的策划大致可以分为三个层次:一是以时间和空间为维度,直接罗列数据展示变化;二是在直接比较的基础上加入变量,建立数据变化与重要因素之间的相关性;三是将数据放置于一定的背景中,结合其他的辅助性手段或者信息,进行复杂性解读。当然,第三种层次的数据新闻,又不同于以往的深度报道,它是以数据展示为主,访谈等为辅。见人之所未见,是数据新闻的魅力所在。
3、设计与展示。如果说挖掘与解读是数据新闻的内在,那么数据新闻的制作与呈现则关乎其吸引力与传播效果。生理学证明,人的大脑皮层中,40%是视觉反应区,人类的神经系统天生就对图像化的信息更为敏感。借助于数据可视化,通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象能力,吸引、帮助用户洞察数据之间隐藏的关系和规律。[2]相比于以往以文字为主的网络新闻,数据新闻能够脱颖而出,一是数据所反映的变化角度的“不为常人所关注”,二是数据自身的全面性或者专业性,三是视觉层面的审美,容易获得关注、共鸣和思考。
(3)数据新闻生产的流程
数据新闻的生产流程大致可以归纳为:策划选题―采集数据―设计内容―编写代码(程序)。与传统新闻生产的采、编、美、印的独立式生产流程不同,数据新闻的生产流程,几个环节更多地是一种合作与互动的关系。采编人员负责策划选题和搜集资料,设计人员根据既有素材和表现意图等设计图形,同时与程序员沟通,考虑方案或创意的实现难度,并进行必要的修改。方案设计过程中,有可能需要补充数据和素材。方案确定后,设计、开发和文案的工作则可以同步进行。
二、数据新闻生产的难点
(1)确定选题难
数据新闻生产的核心在于选题和数据的开放程度,这些是数据新闻生产的基础。相比于国外的 “维基解密”或 “棱镜门”这样的曝光事件带来的庞大数据,和具有一定社会影响力的数据新闻,国内的数据新闻,则多处于描述某一单一现象的阶段。
数据和内容上的单薄,往往用炫目的可视化效果来进行补偿,个别网站的数据新闻在追求花哨的基础上,影响了直观、醒目的特质,如何在数据的可视化展示层面进行雕琢,还有待于进一步改进。
数据新闻能否产生社会影响力,往往取决于选题能否兼顾公众利益、发掘常人所忽视的事件的本质。我们可以通过2013年获奖的8个数据新闻作品来看:“美国各州同性恋权益交互地图”、“数字解读阿根廷内阁2004―2013支出状况”、“英国社会层级数字计算器”、“威尔士儿童关怀状况”等,国内数据新闻作品的选题和角度则相对单一,时空跨度较小,表现形态多为静态,且缺少对于重大社会问题的关注。
(2)数据来源少
数据之于数据新闻的作用如同采访对象之于新闻报道,再好的选题都是以数据作为支撑的,数据的来源就变得异常重要。沈浩教授认为国外媒体之所以能做出很多有社会意义的数据新闻,一定程度上跟国外数据开放的政策和完善的数据开放管理机制有关;国内虽然已经开始重视数据开放,但开放的数据有限,即使开放的数据,也缺乏统一的管理和发布平台。彭兰教授认为对新闻生产中的信息图表制作而言,数据来源一般包括:新闻中的数据资源,网络用户数据及网络公共资源,政府机构、企业等开发的公开数据。[3]但是,因为各种原因,目前的数据新闻来源多为政府机构,这种状况的出现或许有数据质量的考虑,但是在一定程度上却会对数据新闻的选题形成一定的制约。另外,媒体自有数据库的建设和发掘、社交媒体的信息也可以成为数据新闻的富矿,业界需要在这两方面做好积累和挖掘工作。
(3)数据采信难
可信、权威的数据是制作数据新闻的基础,数据的质量关系到数据新闻的可信度,面对公开的、目的各异的、林林总总的数据,甚至是互相“打架”的数据,制作者如何采信则成为一个重要的问题。一般而言,衡量数据质量的指标包括数据的相关度、可信度、准确度、一致性、完整度、及时性和可用性等。[4]如果系统考虑的话,笔者认为在此环节,可以从以下几个方面来进行衡量:(1)数据提供的主体,可以细化为主体的身份、发布数据的目的等;(2)数据获得的规范性和专业性,包括调查具体的执行人,调查总体、样本量、抽样方式、误差大小、调查方法和数据分析等;(3)细节的核实,主要是在对具体概念的界定上要仔细,要不然名称相同的调研,因为概念界定的不同,数据会有一定的差异。
(4)数据解读难
数据新闻的生产者,工作的价值就是以专业的眼光代替普通受众去发现生活中的变化,但是对于这种变化的讲述方式是数字而非文字,若仅仅是简单的呈现,则低估了数据新闻应有的价值。数字,结合一定的背景信息或者辅助性信息,或者被放置于更为复杂的环境之中,会起到意想不到的作用,甚至于改变政府决策。
国内的数据新闻频道,多侧重于在图解的过程中使用数据,直接通过解读数据来分析事件的作品则相对有限。孤零零的数据,价值较低,但是通过不同数据串起来的信息及其间或显或隐的关系,提高数据的解释力,才是数据新闻生产者工作的重点。
(5)效果呈现难
在解读的基础上,制作者需要将自己的发现以简洁直观、独特醒目的视觉效果传播开来。这一过程更多的体现的是技术与艺术的结合。数据新闻的呈现大致可以分为两大类:静态呈现和动态交互式呈现,国内目前的数据新闻以前者为主,国外的《纽约时报》和《卫报》则有不少成功的交互式数据新闻。
数字可以结合新闻的进程、地图、时间和空间等多维度进行呈现,这种呈现还可以结合多媒体的表现方式,并借助于专业的绘图软件,使得情状、进程等一目了然。
通过观察国内各大媒体的数据新闻,笔者发现,除了财新网“数字说”频道有几期采用了动态交互式之外,其余的同类频道基本都是静态的“图解”形式,这种形式制作相对容易,但在视觉表现上比较单一。
作为一个出现时间并不长的新闻表现形式,数据新闻的制作,在当下,需要以团队的形式来完成,新闻、技术和艺术等相结合的跨专业人才较少,因此,在制作方面,对于团队的有效合作与沟通也提出了新的挑战。环节上的难点容易解决,但是不同专业之间的有效沟通、技术团队的精干则更为重要。
(6)价值开发难
数据新闻的生产成本(人力成本与时间成本)较高,但是其传播的价值若仅仅局限于点击量,则未免有点可惜。况且不是所有的数据新闻作品都必然获得高点击率,持续性地生产较高成本的数据新闻的动力来自何方?即使不考虑如何实现经济效益,也应该在生产过程中思考数据新闻的传播效果与价值开发。
Propublica制作的(数据)新闻应用《机会鸿沟》,其元数据来自超过全国四分之三的公立学校,由6个人耗时3个月完成,通过收集、整理庞大而细致的数据,向读者讲述了来自不同州的公立大学在人员配置、课程设置等方面的差别。笔者认为,对于已经收集和分析的数据价值,不应仅限于制作一个新闻应用,还应该开发并延伸其专业价值。
数据新闻,从形式和制作上都有别于传统的新闻表现形式,但囿于人才、技术、观念等因素的影响,能否在未来成为一种普遍性的新闻表现形式,还需打一个问号。但不容置疑的是,它的出现,适应了社会化媒体时代民众接收信息的特点与节奏,凸显了专业媒体在新闻采访之外的专业技能――整理、挖掘、呈现,虽然存在上述诸多困难,业界仍然在执着地探索与创新。
三、数据新闻生产的创新
全球编辑网络(GEN)数据新闻奖的评选类别可以从一个侧面反映数据新闻在业界和实践层面的现状和趋势。该奖项评选的主题分为四大类:数据驱动的调查性新闻、数据驱动的移动应用软件(APP)、数据化叙事报道、数据新闻站点或机构。[5]笔者在查阅了历次获奖作品的资料后,将数据新闻生产在实践层面的探索和创新归纳为以下五个方面:
(1)复杂的挖掘分析
“数据新闻”已从简单描摹事件的表层现象转为深入挖掘其内在本质。[6]在此期间,以解读新闻价值、满足实用性、接近性等需求为出发点,对复杂数据的挖掘和分析就显得异常关键。
得益于政府层面对于数据开放的重视和社会化媒体的发展,媒体可以获得庞大的开放性数据,如何建立数据之间的相关性,挖掘数据潜在的深层次价值,并以问题为导向,将之与社会公众利益相结合,则有利于提高数据新闻的质量并扩大影响力。在日本福岛核泄漏事件之后,《德国时代周报》网站“时代在线”就策划制作了一则数据新闻:德国有多少人住在核电站附近,又有多少人住在核电站方圆30千米以内,之后用一张互动地图展示了如果相似情况发生在德国,有多少人会被疏散。[7]该作品既给网站带来了超乎想象的访问量,又在社交媒体中实现了病毒式传播。2014年GEN的最佳单选题报道奖获奖作品《移民档案》(主要从不同的开放数据源整合数据,讲述飞往欧洲的移民在半路死亡的悲剧故事,以及这些事件对于欧盟各国移民政策的影响),最初是由来自数据新闻实验室的16个学生,核查了250个事故,并且记录每一个致命事故的日期、纬度、经度、死亡或者失踪的人数以及原因。后由来自6个国家10个记者共同合作完成,用6个拘留中心,2769个事件,13713个移民讲述所有的故事。[8]
如果说大众传媒具有环境监测功能,那么,借助于高质量的数据新闻产品,在时间、空间等多维度的比较与展示中,这种监测可以更全面、精准、细致,更有说服力。
(2)独立的新闻应用
数据新闻的表现形式中有一类叫做数据新闻应用,虽然目前国内的数据新闻形式中很少见,但是国外的媒体已经做出了不少的尝试,并且取得了较好的效果。
目前比较主流的如《卫报》等媒体的数据新闻多是以数据地图、交互图表形式来呈现。而BBC、Propublica等则尝试了数据新闻应用,尤其是Propublica,专门成立了一个由10位有编程基础的成员组成的新闻应用程序团队,新闻应用在其数据新闻(Tools & Data频道)中的比例近乎40%,具体如“Guns”、“The Opportunity Gap”等新闻应用。
数据新闻应用这一表现形式,主要是用软件代替了文字和图片,通过小而简的游戏或者应用,激发用户在线参与,进而获得大量的、有意义的数据集,帮助用户加深对某些问题的认识。如果说交互图表类的数据新闻制作,主要是借助于绘图软件,那么新闻应用则需要借助编程工具。例如,BBC网站的《英国社会层级数字计算器》[2013年“数据新闻奖”数据应用类(大型媒体组)的获奖作品]就是一个成功的互动式新闻应用。该制作团队与社会学家合作,建立了英国社会阶层划分的新标准,在此基础上,开发了“英国社会层级数字计算器”,通过简化的但又具有科学性的5道在线的单选测试题,英国普通公民可以快速获知自己的社会阶层归属,而且还可以表示出答题者在经济资本、个人社会和文化资本的值的高低。财新网在去年6月推出的“摇车号HTML5游戏”,也是一次成功的尝试。该团队将新闻中一句并不引人注意的“去年6月北京摇车号的命中率是1/137”,利用HTML5开发成了一个摇车号的小游戏,一周的访问量就达到150万。
(3)庞大的用户数据
数据新闻的数据源,一是来自于政府或企业主动公开的信息,二是依靠媒体自身积累或通过直接调查获得的数据,但是目前国外的不少数据新闻制作方采用了抓取社交平台上用户生产的数据,今后,移动终端的地理信息、各种传感器捕捉的数据也将成为数据新闻的主要素材。
在具体实践中,制作方可以鼓励全球用户参与到数据新闻的生产过程中。可以采用调查的形式,直接了解民众的态度或者倾向;也可以众包的形式,吸纳志愿者参与数据和信息的采集。其实,用户同意分享地理位置信息,也是一种参与,这样通过运营商记录的数据,就可以获得不少有价值的信息。例如《卫报》在制作相关专题时,就比较注重对用户调查数据的使用和价值再开发。针对当时新出炉的大选结果,网站向全球用户征询意见,之后根据收到的用户反馈数据,制作了《奥巴马再次当选美国总统:全球民众的态度》动态数据地图[9],具有一定的实效性和贴近性。
(4)专业的数据服务
如何提升数据新闻的再开发价值,成为面向未来所要思考的一个重要问题。Propublica做出了一定的探索。该网站于2014年2月26日上线了数据商店频道(Data Store),面向不同的用户,根据数据价值的不同,制定了详细的价格进行再销售。此举不仅可以弥补其高额的生产成本,扩大制作团队的影响力,并在数据提供这一新的领域探索收费的可行性。
(五)跨界的新闻生产
数据新闻生产领域一个新的变化是跨界――跨越新闻传播、计算机、艺术领域,跨越新媒体、研究机构、技术公司,跨越不同国家的团队成员。正是这种集合了不同领域的智慧成果的整合式生产,数据新闻的制作门槛和专业水准都比较高。这种跨界合作,如果以合作伙伴的不同,大致可以分为三类:
一是与相关的研究机构合作。后者扮演的是智力指导或者数据提供者的角色。如政见网的“读图识政治”栏目,会根据选题的不同,与研究院或者媒体等联合出品,使用合作伙伴的数据和成果制作独一无二的数据新闻。
二是与相关的媒体机构合作。政见网的“读图识政治”栏目推出的“中国人的态度”就是其制作团队与《南方周末》合作而成。
三是与可以提供庞大数据的技术公司合作。央视在2014年推出的“数据说春运”就是与百度搜索合作制作的大数据新闻报道,央视负责专题选定和新闻制作,百度公司则负责数据采集和挖掘,之后的“数据说两会”、“数据说就业”等也采用了这种跨界合作的形式,既丰富了传统新闻制作的表现形式,也实现了二者的双赢。
参考文献:
[1]刘义昆.大数据时代的数据新闻生产:现状、影响与反思[J].现代传播,2014,(11).
[2]涂子沛.大数据[M].桂林:广西师范大学出版社2013:101-102.
[3]彭兰.“信息是美的”:大数据时代信息图表的价值及运用[J].新闻记者,2013,(6).
[4]卢一波,邓伟,彭兰.信息图表生产中的数据“众包”[M].新闻界,2013,(14).
[5]史安斌,廖鲽尔.“数据新闻学”的发展路径与前景[J].新闻与写作,2014,(2).
[6]徐锐,万宏蕾.数据新闻:大数据时代新闻生产的核心竞争力[J].编辑之友,2013,(12).
[7]洪烨林.全球编辑网络数据新闻奖项揭晓[EB/OL].
[8]文卫华,李冰.从美国总统大选看大数据时代的数据新闻报道[J].中国记者,2013,(6).