语象方法答客问

2015-07-17

一,语象观察是一种什么方法?

   这是香港大学新闻及传媒中心中国传媒研究计划使用的一种实证研究方法。 它是传统话语分析在新条件下的发展,是一种基于互联网平台的关键词检索分析方法。"语象"是比喻。语象如同天象和气象,可以观察。我们用这个方法分析社会语言的产生和传播,从传媒研究,扩展到政治研究,透过传媒上的语言,观察社会演变。经由语象,观察其背后的动力机制 — 政治。


二,透过语言观察政治,可能吗?

  语言反映现实,也能建构现实。语言学家冯.戴伊克曾说:"社会政治权势和意识可以通过话语来维持、认可和再生"(《话语 心理 社会》页231,中华书局,北京)。中共建政六十多年来,中国成为口号大国。垄断话语权的执政者,建立了独有的话语编码体系。这套体系有相当大的稳定性,其历史演变的脉络清晰可循,透过语象观察政治是可能的。

  2001年,笔者曾检索研究《解放军报》,论证文化大革命从酝酿到爆发,恰是"阶级斗争"等红色口号的勃兴过程;2003年,笔者应香港大学新闻及传媒研究中心总监陈婉莹教授的邀请,到港大从事中国传媒研究。 笔者检索研究了"舆论导向"、"舆论监督"、"新闻改革"和"新闻自由"四个关键词的此消彼长,指出中国新闻改革依然受到严格控制,争取新闻自由的道路艰难坎坷;2006年是唐山地震三十周年,笔者对纪念唐山地震的报导做了话语分析,发现中国传媒正在出现"静悄悄的裂变",新闻界奋力突破管制,呼唤人性和公民权利的民间话语在生长。

  此后,笔者聚焦政治改革。在中共十七大、十八大前后,笔者用语象方法分析政治关键词的表现,对时局的发展作出判断,事实证明基本正确。


三,语象方法是如何产生的?

  传媒话语分析是西方学者开创的。他们开始从事新闻话语研究的时候,尚无互联网,甚至还没有个人电脑。1992年,国内已有人在用电脑分析整本《红楼梦》的语言特色。当时中国已开始研究"机器翻译"课题,和"信息检索"技术。在香港中文大学,著名学者金观涛和刘青峰夫妇,建立了中国近现代思想史研究数据库,首创使用电脑检索系统的"计量历史学"方法。

  这一时期美国出现了搜寻引擎。1990年出现了搜寻引擎的鼻祖Archie,此后, WebCrawler、Lycos、Infoseek、Alta Vista、Inktomi、Northernlight ……,一个个互联网搜寻引擎连翩而至,直到Google、Baidu 风靡世界和中国。数码技术带来了海量搜索和模式识别,语象方法正是这一技术革命的产物。


四,“语象”方法和传统话语分析方法有何异同?

  在电脑与互联网降生之前,学者使用社会科学的各种方法,对包括媒体话语在内的社会语言作过深入研究,积累了丰富的知识。数码科技的崛起,大数据时代的到来,使研究越上了新的平台。

  新闻媒介的语言资料保存完整,易于检索计量。我们现在可以方便地对一份报纸的全部历史资料进行检索,也可以方便地对几百种报纸同时进行检索。不仅可以在瞬间搜索到所需要的资讯,而且可以限定时间、空间(报纸、网站等资讯提供者),设定各种逻辑关系,有针对性地搜索和精确计量;不仅可以搜索、计量文字资讯,而且可以搜索、计量图片、声音和视频信息;不仅可以搜索、计量传统意义的"大内容"(Macro-contents),而且可以搜索、计量随着Web 2.0而兴盛的"微内容"(Micro-contents)。

  今天我们所能拥有的语料库,其规模之巨大前人无法想像,数码科技亦提供了更多分析手段,它让我们用数据支持、修正或否定印象性观察、经验性认知和逻辑推断,让我们透过数据,在社会与政治的"显事实"背后发现"隐事实"。

  例如,笔者曾使用《解放军报》检索系统,发现在"大跃进"、"大饥荒"时期,中共一系列红色口号在1960年达到高峰,1961年至1962年上半年却全线下滑,到1963年再度强劲攀高。这一U字形,反映毛泽东一度退缩,到1962年秋八届十全会后,又强劲反击。

  用一系列数据支持的这个"隐事实",在没有电脑和互联网的时代是无法窥见的。但这个"隐事实",电脑不会直接告诉你,它是具有历史和新闻知识的研究者判读数据所得。搜寻引擎尚在发展。目前条件下,史学、语言学、传播学、政治学,仍是不可或缺的知识基础,而数码化检索和计量是一种辅助手段。

  这种手段也扩展了以往传媒研究的内容分析方法。2003年,SARS疫情爆发。中国媒体曾在短暂时间内对SARS进行过大量报道,但很快就被宣传部压制。在公众需要公共卫生资讯的紧要关头,中国媒体集体噤声。当时笔者刚到香港大学,我们使用"慧科搜索"数据库搜索数百种中国内地报纸,画出了SARS 报道大起大落的准确轨迹图。几乎是同样的一幅图,5年后再次出现。这次是汶川地震中校舍倒塌的报道。又是先大量报道,后突然被禁。

  "语象"方法,融合了定量(量化)研究和定性(质化)研究两种方法。词频数据不难获取,凭借这些数据展开分析得到结论,则需要传统学术研究的功力。


五,你们使用哪些数据库?如何对传播进行计量?

  首先是一批报纸的图文检索系统,如《人民日报》、《解放军报》,它们提供了这些老报纸自创刊以来的所有文字和版面。其二是收录了多种媒体的综合性数据库,如香港的“慧科搜索”,它集纳了近十多年来的数百种报纸,以及一些网站的内容。其三是网络搜寻引擎,如谷歌、百度,这些搜索器提供的高级检索功能,可以限定时段、数据来源,可对语词作搭配检索。

  计量的基本元素是词频。在上述数据库进行关键词检索,都能获得词频数据。所谓词频,可以表现为"全文使用篇数",也可以表现为"标题使用篇数"。对单一文本(一篇文章,或以一个档形式出现的一组文章乃至一本书),可以使用Word的搜索功能,统计某一关键词的绝对频率。词频极其宝贵,如同血压、体温、气温、雨量、水位、股价等不同的测量数据。传媒大数据是研究者的富矿。


六,如何选择、观察关键字?

  在一项研究中,选择什么样的关键词做数码检析,实有赖研究者对媒体和文献的长期观察和阅读经验。例如,笔者自从上世纪八十年代以来一直关注中国的政治体制改革。"政治体制改革"显然是值得观察的关键词语,同时,笔者在2007年便提出,还须关注若干"政治体制改革"的同义语。在中共体制内,它们是:"政治文明"、"民主政治"、"党内民主";在民间,它们是:"宪政"、"公民权利"和"公民社会"。通过数码检析,笔者持续观察这两组词语的交织与冲突,获得宝贵的认识。正是这种较为清晰的认识,当2013年"七不讲"传来,笔者即意识到中国大陆"话语战争"已经开始,此后,发表多文,分析政治改革正在倒退。

  对于关键词,我们观察"语源":一个关键词是何时出生的?在什么背景下出现?我们观察"语流":它的传播,在流量上发生什么样的变化?我们观察"语变":它的衰落,它的消亡。我们观察:潜藏巨大能量的口号,是怎么降临的?在语言的"华尔街",不同语词走出了什么样的升降曲线?传媒如何参与制造了话语的波澜起伏 — 又被这种起伏所裹挟漂流?我们更注重观察"语境"。任何语象都在特定语境下出现,语境不明,语象无解。传统的研究方法,和基于互联网平台的检索手段结合,使我们可以勾勒出更宏观也更准确的图像:传媒在说什么?什么人在说?不同人(不同传媒)所说的有何异同?在不同的时间,所说的又有什么不一样? 从纷繁的语言现象中,经比较,看出语言"棋盘"里各个"棋子"的关系,看出错综的关系如何位移,识别偌大棋局的总体态势。比较,是语象观察的基本方法。

  语象背后的"隐事实",须通过比较发现。任何一个关键词(语)的单一词频数据,若不进入比较,则无意义,无信息。所谓比较,分纵向比较与横向比较。纵向比较,是词语传播的历史观察。如"政治体制改革",可以检索统计自1980年至今在《人民日报》上每年的使用篇数,由一组数据构成传播量变动曲线。纵向比较也可作更细微观察。例如在2003年春非典型肺炎爆发期间,笔者对"非典"一词在报纸上的传播作过逐日统计,其变动曲线,显示了当局对疫情报道从严控到放开的过程。横向比较,可以是一个词与另一个词的比较,可以是一组词和另一组词的比较(包括传播总量和历史曲线),也可以是相同词语在不同媒体上的传播实况的比较。


七,如何通过语象方法提升研究水准?

  此前,研究课题(聚焦点)大多来自研究者的经验性判断。如今,通过使用数码技术的语象方法,研究者有可能发现更多新的探究点。例如,中共十八大后,笔者一直关注习近平提出的各种口号,其中,对"依宪治国"、"依宪执政"在党报上的出现频率作了持续观察。2013年,发现这两个口号倏起忽落,2014年,《习近平总书记系列重要讲话读本》出版。笔者对这本发行逾千万的超级大书进行了语象分析,发现上述二词竟被删去,即撰文《"依宪治国"为什么不见了》,指出这是批判宪政所致。不久,在中共十八届四中全会,这两个词语"复活",笔者遂发表《过山车上的"依宪治国"》,作进一步剖析。可以说,这个研究题目,完全得自语象观察。语象的"异动",往往正是研究的题目。基于语象观察的研究,必须聚焦异动,解释异动,从异动,追踪政治变迁。

  前面谈及,词频数据不难获取,分析研究则需学术功力。但笔者也在尝试,让数码技术在分析研究中扮演更重要角色,例如布尔逻辑的运用。搜寻引擎问世之初,就有布尔逻辑功能(即"逻辑是"、"逻辑非"、"逻辑与"、"逻辑或")。笔者在做"政治体制改革"相关词语研究时,将体制内话语"政治文明"、"党内民主"、"民主政治"编为A组,将民间话语"宪政"、"公民权利"、"公民社会"编为B组,将两者融合部分编为C组,分别检索"有A无B"、"有B无A"、"有A有B"三种结果。统计发现,在中国传媒的传播总量上,A大于B;而AB同时出现的情况稀少。数据证明:关于政改,存在十分明显的话语分野。笔者还使用布尔逻辑方法,分析过语义和语族的变迁。


八,语象方法有多大适用性?有何局限?

  我们从事语象观察的实践表明,以此方法分析华文媒体,如中国大陆媒体,特别是中共党媒,较为有效。中共的政治口号,称为“提法”,是权力话语,它的提出和变动,均受控于权力,有较强规范性,这对研究是一种便利。

  但是中共的话语,有"命脉语"、"穴位语"、"旗帜语"、"皮毛语"、"脂粉语"之分别。如"四项基本原则"这样的命脉语、"依宪治国"这样的穴位语、"毛泽东思想"这样的旗帜语,须长期观测。而几十年如一日的高调,如"人民"、"大好形势"等皮毛语脂粉语,既难检析,对研究也无大价值。

  通过数码技术分析民间语言,也是可能的,主要数据在市场化媒体和网站。但对互联网的检索,须注意到数据库的不稳定。目前,语象方法适用于对百度新闻搜索(高级)和主要门户网站进行较短时段的检索。对社交媒体的关键词检析,笔者做过尝试(如对新浪微博),然而情形较为复杂,尚在探索。


九,语象方法的发展前景如何?

  未来数年,数码技术在储存容量、传输速度、搜索能力等方面将发生革命性飞跃。换言之,我们有可能在更大范围、更高效地进行新闻话语检索计量;借助电脑和网络,分析水准也会大大提高,甚或发生飞跃,有理由乐观期待。

下载
相关文章 / Related Articles

「中国式公关」

刘书贤
2021-03-31

香港学生反修例运动中网络关系解体的实证调查

宋昭勋、吴静、胡欣立
2021-01-11

中国传媒上的「奉劝」

钱钢
2020-05-15