传媒每日每时提供事实、评论、形形色色的实用信息。如果将这些触目可得的东西称之为「显信息」,那么,传媒上还有「潜信息」。例如,要问「三十年来中国政治体制改革进展如何?」下图会将不易看清的潜隐事实「显影」示人。
这张图,显示「政治体制改革」一词在中共中央机关报《人民日报》上的历年被使用篇数。图上的涨跌曲线也和我们的切身经验相吻合:政改在上世纪八十年代出现高潮,一九八九年后戛然而止。最近十多年,起起伏伏,虽有微澜,但政改的热度和二十年前完全不可比拟。
用信息检索分析传媒话语
香港大学新闻及传媒研究中心的中国传媒研究计画(CMP)近年来一直在探讨一种研究方法。我们称其为「基于互联网平台,运用信息检索技术的传媒话语分析」。
人类的诸多秘密潜藏在话语之中。「社会政治权势和意识可以通过话语来维持、认可和再生」(冯.戴伊克:《话语.心理.社会》。思潮的涨落,集体无意识的爆发或者迷失,在话语中皆有踪迹可察。一个个潜藏巨大能量的口号,是怎么降临的?在语言的「华尔街」,不同语词走出了什么样的升降曲线?传媒如何参与制造了话语的波澜起伏│又被这种起伏所裹挟漂流?
新闻媒介上的话语,保存最为完整、最易于检索计量。传媒话语分析从符号学发展而来。西方学者开创了这一理论,但他们开始从事新闻话语研究的时候,还没有互联网和搜索引擎,甚至,还没有个人电脑。
大约在一九九二年,我听说有人在用电脑分析整本《红楼梦》的语言特色,颇觉惊异。后来知道,那时中国已经开始研究「机器翻译」课题,一项名叫「信息检索」的技术应运而生。在香港,著名学者金观涛和刘青峰夫妇,建立了清末民初文献资料库,首创使用电脑检索系统的「计量历史学」方法。
这一时期美国出现了搜索引擎。一九九零年出现了搜索引擎的鼻祖Archie,此后, WebCrawler、Lycos、Infoseek、Alta Vista、Inktomi、Northernlight......,一个又一个互联网搜索引擎诞生,直到Google、Baidu风靡世界和中国。
没有电脑,不可能有电子信息检索。没有网络,不可能有海量信息检索与计量。而互联网的飞速发展,预示了网络信息检索与处理的诱人前景。人们不仅可以在瞬间搜索到所需要的信息,而且可以限定时间、空间(报纸、网站等信息提供者),设定各种逻辑关系,有针对性地搜索和精确计量;不仅可以搜索、计量文字信息,而且可以搜索、计量图片、声音和视频信息;不仅可以搜索、计量传统意义的「大内容」(Macro-contents),而且可以搜索、计量随着Web 2.0而兴盛的「微内容」(Micro-contents)。
我们现在可以方便地对一份报纸的全部历史资料进行检索,也可以方便地对几百种报纸同时进行检索。我们的钥匙就是关键词。每次检索,电脑会给我们一个结果:某一关键词的被使用篇数。这个结果如同人的体温、江河水位、股票价格,是宝贵的研究依据。当然,电脑不会告诉你哪些词应该被检索;这完全要依赖我们对传媒的持久观察和经验性研究。
从关键词的破译看大局态势
我们要研究传媒上各个关键词的「语源」、「语境」、「语义」和「语义流变」。这种传统的语言学方法,和基于互联网平台的检索手段结合,使我们可以勾勒出更宏观也更准确的图像:传媒在说什么?什么人在说?不同人(不同传媒)所说的有何异同?在不同的时间,所说的又有什么不一样?
更具挑战性的是对检索结果的「破译」:从纷繁的语言现象中,看出语言「棋盘」况各个「棋子」的关系,看出错综的关系如何位移,识别偌大棋局的总体态势。
运用这个方法,二零零一年,我曾检索研究《解放军报》,论证文化大革命从酝酿到爆发的过程,也是有关阶级斗争、个人崇拜、扼制人性等红色口号的勃兴过程;二零零三年,我检索研究了「舆论导向」、「舆论监督」、「新闻改革」和「新闻自由」四个关键词的表现和相互关联,指出中国新闻改革依然受到党的严格控制,争取新闻自由的道路艰难坎坷;二零零六年是唐山地震三十周年,我对中国大陆有关唐山地震的报导做了内容分析和话语分析,发现中国传媒正在出现「静悄悄的裂变」,新闻界奋力突破管制,呼唤人性和公民权利的民间话语在迅速生长。二零零七年,我的研究重点是政治改革。
在中国大陆,有六个词是「政治体制改革」重要的相关词。其中「民主政治」、「政治文明」和「党内民主」属官方话语,见诸于领导人讲话、党的档、党的媒体。而「宪政」、「公民权利」、「公民社会」则是民间话语,知识份子和追求自由的报纸用得较多。无疑,后者显示的政改诉求更加切中要害。
目前官方话语的总体传播强度高于民间话语。使用「慧科搜索」检索二零零四年到二零零七年的中国报纸,我发现:多数使用「政治文明」或「民主政治」或「党内民主」的文字,未使用民间话语中的任意一词。而大多数使用「宪政」或「公民权利」或「公民社会」的文字,未使用官方话语中的任意一词。同时使用两者的文字,比重很低。
中共中央总书记胡锦涛在十七大的政治报告,使用了上述官方话语的三个词,没有使用民间话语的三个词。这也可以证明,有关政治体制改革的两种话语,确有明显的分野。可以假设:未来五到十年,如果民间话语的比重渐大,官、民两种话语的重合日多,那意味着什么?意味着,中国政改将有较大的进展。你也可以想像相反的情形。
十七大召开前后,我在CMP网站(http://cmp.hku.hk)发表了十七篇文章,对中国传媒上的「政治体制改革」话语作了详细分析。正是这一分析,使我们对中国政治体制改革的现状和前景持谨慎冷静的态度:有期望,没有奢望。我们看到政治改革的能量在积聚,也看到曾导致胡耀邦和赵紫阳两任总书记下台的红色镣铐│「四项基本原则」,依然锁着政治家们的双脚。
一个面对中国传媒和中国政治的传媒话语观测系统,正在逐步成型。这个系统可以帮助我们研究中国政治的转型和中国传媒的演变,也可以帮助我们研究中国社会的新陈代谢。目前各种搜索引擎已经开始建立对博客的搜索,假以时日,对不同关键词在博客的传播表现,将可以如报刊文本一样被准确计量。这意味着,传媒话语观测系统还可以观测千姿百态的民间舆论,解析舆情涨落的奥秘。
这张图,显示「政治体制改革」一词在中共中央机关报《人民日报》上的历年被使用篇数。图上的涨跌曲线也和我们的切身经验相吻合:政改在上世纪八十年代出现高潮,一九八九年后戛然而止。最近十多年,起起伏伏,虽有微澜,但政改的热度和二十年前完全不可比拟。
用信息检索分析传媒话语
香港大学新闻及传媒研究中心的中国传媒研究计画(CMP)近年来一直在探讨一种研究方法。我们称其为「基于互联网平台,运用信息检索技术的传媒话语分析」。
人类的诸多秘密潜藏在话语之中。「社会政治权势和意识可以通过话语来维持、认可和再生」(冯.戴伊克:《话语.心理.社会》。思潮的涨落,集体无意识的爆发或者迷失,在话语中皆有踪迹可察。一个个潜藏巨大能量的口号,是怎么降临的?在语言的「华尔街」,不同语词走出了什么样的升降曲线?传媒如何参与制造了话语的波澜起伏│又被这种起伏所裹挟漂流?
新闻媒介上的话语,保存最为完整、最易于检索计量。传媒话语分析从符号学发展而来。西方学者开创了这一理论,但他们开始从事新闻话语研究的时候,还没有互联网和搜索引擎,甚至,还没有个人电脑。
大约在一九九二年,我听说有人在用电脑分析整本《红楼梦》的语言特色,颇觉惊异。后来知道,那时中国已经开始研究「机器翻译」课题,一项名叫「信息检索」的技术应运而生。在香港,著名学者金观涛和刘青峰夫妇,建立了清末民初文献资料库,首创使用电脑检索系统的「计量历史学」方法。
这一时期美国出现了搜索引擎。一九九零年出现了搜索引擎的鼻祖Archie,此后, WebCrawler、Lycos、Infoseek、Alta Vista、Inktomi、Northernlight......,一个又一个互联网搜索引擎诞生,直到Google、Baidu风靡世界和中国。
没有电脑,不可能有电子信息检索。没有网络,不可能有海量信息检索与计量。而互联网的飞速发展,预示了网络信息检索与处理的诱人前景。人们不仅可以在瞬间搜索到所需要的信息,而且可以限定时间、空间(报纸、网站等信息提供者),设定各种逻辑关系,有针对性地搜索和精确计量;不仅可以搜索、计量文字信息,而且可以搜索、计量图片、声音和视频信息;不仅可以搜索、计量传统意义的「大内容」(Macro-contents),而且可以搜索、计量随着Web 2.0而兴盛的「微内容」(Micro-contents)。
我们现在可以方便地对一份报纸的全部历史资料进行检索,也可以方便地对几百种报纸同时进行检索。我们的钥匙就是关键词。每次检索,电脑会给我们一个结果:某一关键词的被使用篇数。这个结果如同人的体温、江河水位、股票价格,是宝贵的研究依据。当然,电脑不会告诉你哪些词应该被检索;这完全要依赖我们对传媒的持久观察和经验性研究。
从关键词的破译看大局态势
我们要研究传媒上各个关键词的「语源」、「语境」、「语义」和「语义流变」。这种传统的语言学方法,和基于互联网平台的检索手段结合,使我们可以勾勒出更宏观也更准确的图像:传媒在说什么?什么人在说?不同人(不同传媒)所说的有何异同?在不同的时间,所说的又有什么不一样?
更具挑战性的是对检索结果的「破译」:从纷繁的语言现象中,看出语言「棋盘」况各个「棋子」的关系,看出错综的关系如何位移,识别偌大棋局的总体态势。
运用这个方法,二零零一年,我曾检索研究《解放军报》,论证文化大革命从酝酿到爆发的过程,也是有关阶级斗争、个人崇拜、扼制人性等红色口号的勃兴过程;二零零三年,我检索研究了「舆论导向」、「舆论监督」、「新闻改革」和「新闻自由」四个关键词的表现和相互关联,指出中国新闻改革依然受到党的严格控制,争取新闻自由的道路艰难坎坷;二零零六年是唐山地震三十周年,我对中国大陆有关唐山地震的报导做了内容分析和话语分析,发现中国传媒正在出现「静悄悄的裂变」,新闻界奋力突破管制,呼唤人性和公民权利的民间话语在迅速生长。二零零七年,我的研究重点是政治改革。
在中国大陆,有六个词是「政治体制改革」重要的相关词。其中「民主政治」、「政治文明」和「党内民主」属官方话语,见诸于领导人讲话、党的档、党的媒体。而「宪政」、「公民权利」、「公民社会」则是民间话语,知识份子和追求自由的报纸用得较多。无疑,后者显示的政改诉求更加切中要害。
目前官方话语的总体传播强度高于民间话语。使用「慧科搜索」检索二零零四年到二零零七年的中国报纸,我发现:多数使用「政治文明」或「民主政治」或「党内民主」的文字,未使用民间话语中的任意一词。而大多数使用「宪政」或「公民权利」或「公民社会」的文字,未使用官方话语中的任意一词。同时使用两者的文字,比重很低。
中共中央总书记胡锦涛在十七大的政治报告,使用了上述官方话语的三个词,没有使用民间话语的三个词。这也可以证明,有关政治体制改革的两种话语,确有明显的分野。可以假设:未来五到十年,如果民间话语的比重渐大,官、民两种话语的重合日多,那意味着什么?意味着,中国政改将有较大的进展。你也可以想像相反的情形。
十七大召开前后,我在CMP网站(http://cmp.hku.hk)发表了十七篇文章,对中国传媒上的「政治体制改革」话语作了详细分析。正是这一分析,使我们对中国政治体制改革的现状和前景持谨慎冷静的态度:有期望,没有奢望。我们看到政治改革的能量在积聚,也看到曾导致胡耀邦和赵紫阳两任总书记下台的红色镣铐│「四项基本原则」,依然锁着政治家们的双脚。
一个面对中国传媒和中国政治的传媒话语观测系统,正在逐步成型。这个系统可以帮助我们研究中国政治的转型和中国传媒的演变,也可以帮助我们研究中国社会的新陈代谢。目前各种搜索引擎已经开始建立对博客的搜索,假以时日,对不同关键词在博客的传播表现,将可以如报刊文本一样被准确计量。这意味着,传媒话语观测系统还可以观测千姿百态的民间舆论,解析舆情涨落的奥秘。