维基百科看中国
Tuesday, May 4th, 2010这里有两幅图,一幅是中文维基百科上有地理定位的文章分布,一幅是所有语言版本的维基百科上有地理定位的文章分布。一幅反映了中文维基人的分布与兴趣(中文条目的基数),一幅揭示了全球维基人的区域性关注(条目语言版本数)。
via floating sheep
这里有两幅图,一幅是中文维基百科上有地理定位的文章分布,一幅是所有语言版本的维基百科上有地理定位的文章分布。一幅反映了中文维基人的分布与兴趣(中文条目的基数),一幅揭示了全球维基人的区域性关注(条目语言版本数)。
via floating sheep
这个问题我也考虑了很久,最近正好看到某日本硬件博客报道,就拎出来谈谈——为啥咱们的显示器介绍配图越来越多使用ACG壁纸?
虽说这年头撰写显示器介绍页面的也是小编,基本肯定是他们顺手把自己喜欢的图往上贴(可能并不知道图片的出处)。但ACG图,从吸引客户眼光到实际版权观感上似乎都不是最佳的选择。为啥要贴它们?可能的解释如下——
编辑组不管这些图片的设计,随意小编发挥。
使用ACG图片对增加点击率有可计量的正面作用。
编辑组内有一些极客被ACG征服了,整天想把OS萌化。
怎么想怎么觉得第三条最可能(也看过小编用凉宫的周边评测硬件,不过那是太平洋,可以说部门穿越)。有鉴于中关村在线的神奇不是没有前科,旅客们有啥更好的说法吗?
原文——
1. The Google/China hacking case: How many news outlets do the original reporting on a big story?
2. The Google/China hacking case: How did the story flow through Chinese-language media?
两篇文章均来自哈佛大学尼曼基金会的新闻业研究室(博客)。
翻译与整理:David Frank
译者前言——
最近有关Google退出中国的新闻此起彼伏,几乎每家大型新闻机构都在押宝竞猜谷歌出走的“最后限期”。然而眼看着一个又一个小道消息破产,一条又一条媒体预测落空,我们不得不问,是什么因素让这些媒体频频失准?本文尝试从中英两文的媒体报道中找到线索。我们先来看看英文世界是如何应对“谷歌被攻击”的消息的……
进入正文——
我们经常谈当今的“新闻生态”,一个由传统纸媒,新兴网媒,非营利与个人组成的制造与过滤新闻的网络,但这个系统是如何分摊报道任务的呢?为了给这个问题建立一个数据点,我选择了谷歌被攻击的故事,并阅读了Google News上所有的新闻版本,找出参与报道的组织。
在过去一周里(指2月17日至2月24日之间),网络上共有121份独立的报道涉及两间在华学校,其中13份(占11%)的报道包含了原创报道,只有7家(6%)的新闻单位完全自主的采集了完整故事。
如往常一样,事情并不如数字般浅显。我选择谷歌vs中国的故事是因为它复杂,国际化,敏感和重大。这是一种需要投入很大精力去研究调查的题材,或许还需知情内线与外语报告的帮助。我们可以称之为对报道基础设施的压力测试,一个现实中的最坏条件。
纽约时报是最早释出新闻的单位,说一个匿名的攻击调查组成员称对美国数家企业的攻击已被回溯至中国的一间著名大学与一家职业学校。文章包括了该学校发言人的评论,并注明有上海的员工协助报道。霎时间,该新闻传遍四方,几乎每家美国报社与网媒都报道了它。
周一上午,在我准备调查这件事的时候,Google News上已经出现了800多份不同的报道。但这其中有多少给读者带来了新的信息?Google News默认不显示重复或联合同步的新闻,这把报道的总数压缩至100多条。我认真阅读了每一条新闻,数个小时后,我统计出一个记录新闻引用源的报表,它同时还包括发布时间,发布媒介(纸张,网络,电台等),发布者与参与者的所在国家。文章下表是该报表的概览。
我发现了以下特点:
1. 在121份独立的报道中,13份(11%)涉及了一定数量的原创报道。任何涉及全新引用的文章均被算为原创,余下的原创内容就显得难以判断了。偏技术型的报道不少引用了来自无名博客的信息,某程度上他们并不是在原创,但我禁不住默认他们至少没在浪费时间。与此同时,众多新闻编辑室都在努力的拨打两家学校的电话,听一模一样的否认回答,似乎没给故事加上多少价值。
2. 只有7家媒体(6%)的新闻主要由独立原创报道组成。它们包括纽约时报,华盛顿邮报,华尔街日报,卫报,Tech News World,彭博新闻社,新华社与环球时报。
3. 13份有独立报道的媒体中,有8家是纸质媒体,4家为网媒,余下1家以网络为主要运营方式。因此这篇报道真的来自报业。
4. 14份报道(12%)来自中国媒体,使用中国日期,或提及了中国的协助者。作为一则有关中国的新闻,这实在少得可怜。或许这和近期的驻外记者裁员有关。
5. 9篇报道(7%)完全没提及新闻来源,还有5篇仅提及部分的新闻来源,在这个超链接如此容易的时代,这种事情让我惊颤。
6. Google News给原创报道的排行相当高。Google称他们排名的方式基于新闻源的声望,引用的数量与头条的点击率。至于实际算法他们不愿公开。下表的排序以Google的排序为准(译者:这里有一个误区,Google News的排序一直会变动,因此排名只有在搜索当时有效。)
7. Google的新闻聚类算法混入了3篇无关报道,错过了1篇原创报道。那3篇文章的确和谷歌与中国有关,但并非有关近期调查。Google错过了英国金融时报的精彩报道十分可惜,这或许与近期的“收费新闻”漏洞有关。也许我作为一个计算机科学家有些偏见,因为我理解收集新闻的难度——但我仍觉得Google News做得非常棒,作为一个无需监管的算法,抓取着百万条新闻。
8. 另外那100个记者在干啥?一当我想到重写这100条互不相同却毫无新信息的新闻所需要的人力,我就感到浑身不自在。我们本可以把这些新闻力量投入在更有意义的报道上。为什么我们在干这件事?有什么法律,技术,经济与文化屏障让我们不能直截了当的连接至最好的新闻版本?
9. 讽刺的是,没有一家英文新闻机构使用了中文媒体的最早报道,也就是齐鲁晚报的那则新闻。这里甚至有来自香港博客宋以朗的英文翻译(译者:宋以朗的博客ESWN相信大家不会陌生)。报道中的中国记者采访了其中一个学校,将故事推进至黑客不大可能来自该校的职业培训。宋以朗告诉我蓝翔技校在中国以低劣的深夜广告和低质的职业辅导成名——相比(纽约)时报所称的军队黑客训练营,更像是厨子与技工的地下培训工厂。
追踪一篇新闻当然不能证明那篇新闻以外的东西。使用Google News作为过滤器也间接忽略了“新闻生态系统”的重要组成——那些博客与小报。宋告诉我Google News不接受他的网站录入,因为他们不介绍单个作者撰写的小博客。这看起来有些武断,但我也想不到Google有什么可辩护的决策,在这个“新闻来源”如此触手可及的时代。
下面就是我收集数据做成的概括表格。元数据报表里则包含了更多的发布信息,以及他们是否连接至来源等等细节。
(译者:我就不翻译名字了,太多国内不出名的媒体。)
| Article | Sources | Dateline |
| Calgary Herald | Xinhua, NYT (via AFP) | |
| ABC | AP, Xinhua | Shanghai |
| Xinhua | original | Shanghai |
| MarketWatch | NYT, Xinhua | San Francisco |
| Reuters | Xinhua, NYT | Shanghai |
| OneIndia | China Daily, NYT (via ANI) | Bejing |
| Economic Times | ? | Washington |
| PC Magazine Blogs | NYT | |
| Washington Post | original, NYT | Bejing |
| Times Online | NYT | Washington |
| Information Week | NYT, original | |
| FOX News | NYT (via AP) | |
| The Canadian Press | NYT (via AP) | |
| Taipei Times | (via NYT) | San Francisco |
| The Register | NYT, Guardian UK, blog | |
| The Inquirer | AP | |
| MarketWatch | NYT | San Francisco |
| ComputerWorld | NYT, blog | |
| Telegraph UK | NYT | |
| PC World | NYT, Xinhua | |
| Telegraph UK | NYT | Los Angeles |
| Wall Street Journal | original, Xinhua, NYT | |
| The Guardian | NYT, original | |
| Business Week | (Bloomberg) | Washington |
| AFP | NYT | New York |
| Reuters | NYT | New York |
| New York Times | original | San Francisco, Shanghai |
| Daily Contributor | PC World | |
| CCTV | China Daily, NYT, original | |
| Australia Network News | Xinhua, NYT | |
| After Dawn | ?, NYT | |
| Top News | NYT | |
| Daily Latest News | ? | |
| Press Trust of India | China Daily, NYT | Bejing |
| UPI | NYT | New York |
| Security Pro News | ? | |
| Gizmodo | NYT | |
| Tom’s Guide | NYT | |
| Digital Media Wire | NYT | Mountain View |
| Tech News World | original, NYT | |
| Global Times | original, “agencies” | |
| io9 | NYT, Guardian | |
| ZD Net | NYT | |
| Benzinga | NYT | |
| Fox Business | NYT | |
| CrunchGear | NYT | |
| AOL News | NYT, Guardian, WSJ | |
| Tech Blorge | NYT | |
| KLIV | NYT | Silicon Valley |
| eWeek | NYT | |
| TMCnet | NYT | |
| News.am | NYT | |
| Chattabox | NYT | |
| Datamation | NYT | |
| The New New Internet | NYT | |
| IT Pro Portal | Business Week, Telegraph, PC World | |
| The Hill | NYT | |
| Grab Geek Points | NYT | |
| DBTechno | NYT | Boston |
| IT Chuiko | NYT | |
| All Things Digital | NYT | |
| Before It’s News | NYT | |
| V3 | ? | |
| San Jose Business Journal | NYT | |
| Help Net Security | NYT | |
| Channel Web | NYT | |
| Marketing Pilgrim | NYT | |
| The Money Times | NYT | |
| TG Daily | NYT, Guardian | |
| ABH News | NYT, ? | |
| Top News | NYT, ? | |
| PCR | NYT | |
| Top News | NYT | |
| Daily Finance | NYT, Hacker Journals | |
| Shuttervoice | ? | |
| Thinq | NYT | |
| Top News | NYT | |
| New York Magazine | NYT | |
| Venture Beat | NYT | |
| Fast Company | NYT | |
| Gather News | NYT | |
| Newser | NYT | |
| NASDAQ | NYT (via Dow Jones Newswire) | |
| Reuters | Xinhua | Shanghai |
| PC World | NYT, Xinhua | |
| Herald Sun | NYT, Xnhua (via AFP) | Bejing |
| The Hindu | ? | |
| The Times of India | ? | |
| Daily Mail | NYT | |
| PC World | NYT, blogs | |
| ComputerWorld | NYT (via IDG) | |
| News.com.au | NYT | |
| The Globe and Mail | NYT, original (via Reuters) | |
| 9News | NYT | |
| Redmond Pie | NYT,? | |
| Red Orbit | NYT | |
| New Public | NYT | |
| Sydney Morning Herald | NYT (via AP) | |
| Gulf Times | NYT | |
| MyNews | Xinhua, NYT (via Indo Asian News) | |
| Zeenews (India) | NYT, Xinhua (via PTI) | |
| The Tech Herald | NYT, Guardian | Bejing |
| Web Pro News | Financial Tines, NYT | |
| Business Insider | NYT | |
| The Financial Express | original, NYT (via Bloomberg) | |
| Tech Eye | NYT, ? | |
| CIO | NYT, WSJ (via IDG) | |
| Tech Blorge | NYT, Xinhua | |
| CNET | NYT, Xinhua | |
| ZD Net | NYT, Washington Post | |
| China Daily | NYT, original | |
| Bejing News | ? | |
| What’s on Xiamen | NYT, Xinhua | |
| NPR | NYT | |
| San Francisco Chronicle | NYT, Xinhua (via AP) | Shanghai |
| The Cap Times | NYT, AP, Computer World | |
| Little About | NYT, Xinhua (via Indo Asian News) | Jinan |
| Little About | NYT, original (via Asian News Intl) | Bejing |
| San Francisco Chronicle | NYT (via AP) | San Francisco |
| Portfolio.com | NYT | |
| World Market Media | ? |
(译者:看完了英文媒体,不妨来看看中文媒体的统计。文章起头的内容复述上文内容,因此有删减。)
来自香港的报道。数周前,Jonathan Stray通过追踪一条国际新闻题材分析了当今的新闻生态系统,但他只研究了英文媒体的报道,而我想在他的基础上扩展这个分析到中文媒体。我为此阅读了Google News上所有来自大陆,香港与台湾的报道,从数量上分析中文媒体的报道。
我的分析结果如下。尽管中文媒体的报道数量(151篇)与英文媒体(121篇)近似,大陆网页的内容却几乎“每字每句”都来自6个新闻源,其中有4份涉及了原创报道。
当大陆新闻媒体报道重要和敏感的事件时,他们的报道反映了官方媒体的政策。在对所谓“黑客学校”的报道上,我们不难嗅出大陆缺乏自由的媒体系统是如何工作的。独立新闻网站不允许采集资料,而他们之中的大部分亦没有这种动作。在涉及政治的话题上,重复官方新闻比重写报道也要安全得多——(有关谷歌的)这则新闻毫无疑问是政治敏感的,尽管谷歌并没有点明。
在我收集新闻的时候,Google News上共有151份报道,我阅读了每一篇文章,整理出类似的报表,以下是我的主要发现。
1. 只有6份不同的报道(译者:英文媒体是121份不同的报道,但信息内容接近)。4个来自报纸,1个来自独立网站,以及1个网媒。这些媒体包括,青年参考,华夏时报,中国新闻网,大众网,齐鲁晚报与信息时报。这六篇文章被大量商业网站和本地报纸转载。中国新闻网的报道被转载最多,共68次;转载次数最少的报道也有7次。
2. 6份报道的其中4份包括了大量的原创报道。他们是华夏时报,中国新闻网,大众网与齐鲁晚报。余下两份是通过重新排版与添加引用撰写出来的。
3. 在151份报道中,76份(50%)的报道是传统媒体的在线版本。其中的56份为报业,余下的则属于电视、电台媒体的网络分部。由于私人公司与个人不允许在政府管控外出版新闻或运营媒体,上述数字这意味着一半的谷歌被攻击报道都形同官媒报道。新华社,主要由政府运营的中文新闻机构,并没有参与任何中文报道,而是提供了英文报道。
4. 任何不与新闻机构合作的网站使用了上述6份报道的其中一份。与英文媒体不同,报道者并不重写文章,也不会额外采访。你可以说它是赤裸的抄袭,或是极高的效率。不得不说,这是大陆政策的结果。按照香港大学中国媒体研究计划成员钱钢与班志远的说法,“这是在发放,审批与撤回媒体许可证上执行最严格的监控,使政府对媒体有足够强的控制,包括那些愿意挑战系统的记者。”授权的新闻来自被认证的传统媒体。对于其他网站而言,重新发布官方信息降低了他们的政治风险。类似华媒网般把“海外网站评论和谐化放在自己页面”的做法并不罕见,也是中文媒体报道重要新闻事件时的常用手段。
5. 中国互联网媒体甚少连接至新闻源。118份报道(81%)没有连接至新闻出处,更有15家媒体完全没谈及新闻来源。
6. 来自香港媒体的四片报道均为大陆报道或纽约时报原文的重写,台湾方面的报道也类似。出于某些不明的原因,大陆以外相对开放的中文读者地区并没有撰写原创报道。
7. Google News至少错过了一篇原创报道,来自环球时报的报道未被收录。另外一些没那么知名的本地媒体与博客没有收录,例如湖南省的潇湘晨报。(译者:由于Google News的抓取通常要与新闻媒体联系版权事宜,没有合作的媒体是不会被抓取的。)
总结:报业仍是这则新闻最主要的来源,而重复他们的网站处于经济和政治考量不得不这样做。大陆网站甚少做独立报道,对于报社的网络版来说是没有必要,对于独立商业网站来说是没有采访权。
下表列出所有独立的文章出处。更多信息在完整的报表中。
| Outlet | Sources | Dateline | Times Reposted |
| Elite Reference | NYT, AFP, Xinhua | 13 | |
| China Times | Original, NYT | Beijing | 29 |
| China News Service | Original, NYT | Jinan | 68 |
| Dazhong Web | Original | Jinan | 7 |
| Qilu Evening News | Original | 10 | |
| Information Times | Shanghai Evening Post, Shanghai Morning Post, Qilu Evening News | 11 |
正文结束。
后话——
为什么各大媒体对谷歌出走报道失去准度?其实和谷歌与中国之间的暧昧关系很有原因。谷歌毫无疑问已经到了不想继续修改过滤字串的极限,但叫一群中国员工放弃所有努力成果又有些于心不忍。
反观中国政府,即便口上说谷歌你走吧我才不要你,其实上却需要衡量各种事后冲击。有鉴于国内互联网企业对谷歌有不少依赖症,若完全屏蔽必然引起反弹。与其把谷歌变成中文维基百科一样的存在,还不如想办法留住它,至少还能收点税钱。
由于双方都知道对方的意图,桌上的谈判必定是你来我往,估计场面堪比国产爱情连续剧。这种拉锯战,谁也不知道终点在哪里,于是什么线人什么小道消息,都彻底失效了。
没有内线,你还能从哪里找到商业信息?只有参与谈判的政府和企业代表才知道。所以现在任何非官方的新闻发布,不管是多牛的新闻机构,都是一个字,猜。要是谁有能力或资金做深入报道,你会看到更爆炸性的文章,而不是最近的扭扭捏捏。
我想说的就这么多。
完。
PS:推荐订阅这个尼曼新闻研究室,他们年初这一篇揭露NGO文章背后意图的文章也写得很漂亮。不过由于是新闻界的骨干,所以也和中国政府闹过矛盾。
尽管两者的“专业知识”不尽相同,但对事物的好奇心却是同等的。可以说,极客是还没有爱上ACG的阿宅,阿宅是还没有跌入矩阵的极客。本来嘛,极客好好躲在欧美,阿宅好好蹲在日韩,互不相干;但互联网的发展加快了两道的互荣与互融,于是就有了以下两则趣闻。
ThinkGeek一直都卖很欧美向的产品,即便有日文,也经常是容易理解的恶搞,但最近他们开始卖“对正常人不感兴趣”的衣服了……
MAKE Magazine一直是超级DIY爱好者,他们报道的新闻与撰写的专栏围绕着生活中的简单物品展开,但最近他们开始谈“内裤飞行活动”了……据称活动很成功。
相信在ACG业扩展海外市场的过程中,越来越多欧美国家会遇到亚洲各国的现象——极客不知不觉成了阿宅,阿宅不知不觉成了极客。假如我是日韩政府,我不会错过这个机会。至少,它们比色情业好推销多了。