Web 2.0 提高社会对电子政府的要求

2006-12-14
典型的Flickr「词海」—Word Cloud或称Tag Cloud。
  「Web 2.0 ─ 从一系列网站到一个成熟的、为最终用户提供网络应用的服务平台 ─ 它的特点是鼓励作为资讯最终利用者透过分享,使到可供分享的资源变得更丰盛。」《维基百科中文版》
  Web 2.0的使用量激增,为全球的网络文化带来了巨大的转变。现今的全球资讯网系统(World Wide Web)或简称互联网,已经不再是单单一个网上浏览资讯的工具,更是一个能让用户作即时性、与他人互动的资讯交流平台,「知识进化」的哲学理论。以维基网上百科全书为例,用户自由地、无限制地参与该百科全书的编辑。在这种趋势下,使到互联网上资讯的拥有权,从单一地属于资讯拥有者或网主,易手至网络使用者身上。
  在Web 2.0的网络文化下,就着网络使用者的喜好和兴趣而聚集起来的网上社群逐渐增多,并正在互相影响着。典型的网上交流渠道包括用于网上互动聊天的微软网络(MSN)、交友网站Friendster、作为知识及意见交流的网上日志(Weblog)等,这些大大小小的虚拟社群包含了来自不同文化背景、拥有不同学历的人士,通过虚拟社群(e-Communities)的结合及融会,便成了虚拟社会(e-Society)。与现实社会一样,当不同信念、兴趣、价值观的人聚集在一起时,少不免会出现意见不一、分歧甚至纷争;不同的虚拟社群会利用不同的方法去应付这些情况。但当中不乏有人选择较为激进的方法,如邮件炸弹、散播电脑病毒等。现实世界中要对付暴力行为及罪案,政府扮演了一个很重要的角色,它会尽力去明白问题的所在,以及聆听市民的诉求,务求制定有效的政策及其配套以满足市民的需要;这种责任感在虚拟社会中绝对不能缺少。因此网上电子政府(e-Government)需提供服务予网民(e-Citizens),并耹听他们的要求,以此缔造一个和谐健康的网上环境,使网民「安居乐业」。
  怎样去理解电子市民的行为呢?本文介绍针对此课题而研发的两种尖端科技─「社会网络分析」(Social Network Analysis)及「意见采集」(Opinion Mining)。

社会网络分析
  「社会网络分析是一种研究网上用户及资源之间的互动联系的技术......研究成果是能于网上协助联系志同道合的朋友、商业伙伴及其他使用者,使各方都能在互动之下获益。」《维基百科英文版》
  基本上,社会网络分析并不是一个新的概念,在社会科学的领域上已被广泛应用。社会科学家经常设计一些程式或系统去解释人与人之间的关系,并试图找出个人或人际关系在网络中的特质,例如:
─连接性模型(Connectivity Model):在网络上人如何与人连接。
─向心性模型(Centrality Model):人如何在网络上成为其他人的焦点。
─权威性模型(Authoritatively Model):人如何在网络上引导其他人。
  在互联网上,人们与物件组成了虚拟社群,他/它们在网络上不停互动。简单来说,以下几种是常见的模式:
─人与人之间的互动(People-People Interactions):例如在MSN中用户可以互相加入对方的地址库。
─物与物之间的互动(Object-Object Interactions):例如网上日志引述另一网志的内容。
─人与物之间的互动(People-Object Interactions):例如用户利用Flickr上载相片。
─物与人之间的互动(Object-People Interactions):例如网上电子缴费服务。
  在人与物互动期间,会产生大量数据,这些数据为以后的应用提供了宝贵的资料。例如电子客户关系管理系统(e-CRM Customer Relationship Management)能够替一本新书寻找读者;电子商贸(e-Business)能够作出销售预测;网络安全系统(e-Security)能够在虚拟世界内找出有潜在危险的个体或群组;电子政府(e-Government)能加强与网民(e-Citizens)之间的联系等等。
  传统的社会网络分析,多是以问卷或面谈访问形式从小部份人口收集数据,这形式在今日的互联网世界内不大可行,因为这牵涉到数千、甚至数万的人、物及当中的互动,加上传统的统计方式效率较低,试想像在Flickr的「词海」(Word Cloud)当中,字词的重要性会依照它被使用的次数来决定;在这原则下,单凭字词的出现频率便判断此物品的重要性;但Flickr忽略了个别用户的权威性,在现实中不同人所采用的字词带有不同的价值,例如专业用户使用的词按理应比一个新手所用的重要,所以计算时应该较着重前者。所以用于网上世界的社会网络分析应考虑到人与人、物与物,以及人与物的相互关系。
  再来看看在网志上发贴这个例子,如果一篇网志吸引了很多人前来观看并引起激烈的讨论,它会被视为有「权威性」(Authoritative)。但一个很多人到访的网志并不等于它一定是正面的,一些所谓受欢迎网志背后的原因,可能是因为其富争议性甚至挑衅性的话题。要分辨一个网志是正面而有权威性,还是负面且富争议性,这是简单的统计学能力以外的范畴了,需要利用意见采集(Opinion Mining)技术,去深入了解每一个网志的详细内容。

意见采集
  意见采集(Opinion Mining)是一门新兴的研究,是资讯检索与计算语言学的交叉口,所着重的不是文章的本身,而是文章所带出的意见。
  意见采集令网上的内容分析(Content Analysis)更准确、更容易理解,它常被应用于网上自动评估。评估(Evaluation)是社会进程中一个惯常用于衡量他人或物品价值的做法:如学生评估他们的教授、顾客评估产品及服务、评论家评估会议成果或学术文章等。出名的评论网站有书评网站亚马逊(www.amazon.com)和影评网站Imbd(www.imbd.com)。实际上,评估是人与人或人与物之间有效的互动工具。
  在还是Web 1.0的世代,无论是产品或是服务的资料,都是由生产商或服务提供者全权拥有,在市场学的角度,互联网被商家广泛作为推广他们产品的平台。正因如此,在Web 1.0下商品资料常被质疑。再者,在常见的顾客行为(Customer Behavior)中,顾客经常参考专家或有经验用家的意见来作购买的决定;但是在非网络世界中,要请教大量的专家根本是不可行的。Web 2.0的降临正正打破了这个困局,它提供了一个专家/用户互动式的沟通平台。网志自动分析系统是意见采集的最终目标。以下是一句典型的网志意见:
  「黑色的摩托罗拉V3手提电话非常轻巧但是它的RT不太清晰。」
  简单来说,意见采集包含下列几个程序:
(一)目标词抽取(Target Phrase Extraction)─为了从庞大的互联网系统中辨别出特定的意见,必先要一个有效的系统去寻找出目标片语(phrase)。假如该片语已在字典中存在,找寻它便十分简单直接,如例句中的「摩托罗拉V3」;但如果碰上一些意义不明的片语过程便变得十分艰难,例如RT在这里是指电话铃声(Ring Tone)。目标词抽取,正是识辨这些意义不明确词语的技术。
(二)词的客观性(Term Objectivity)─当人们说出对一件物件的相关形容词时,就正正是他对此物件的意见。例如人们会以「黑色」和「轻巧」去形容电话,以「不清晰」去形容电话的铃声。对物件的形容是否属实,往往取决于该词的客观性;在以上的例子中「黑色」是客观存在的,而「轻巧」及「不清晰」则是主观的,所以并不是绝对的。
(三)词的定性 (Term Orientation)─「定性」决定一个主观词是「正面」或是「负面」。在上例中,「轻巧」是正面的,而「不清晰」则是负面的。再者,留意句子中所用的连接词「但是」,它暗示了后段句子与前段句子带有相反意义。
(四)意见分类(Opinion Classification)─意见分类决定句子整体的取向,即这句子是正面的或是负面的。在上例的句子中可分为两部份,前半部是正面的意见,而后半部则为负面,这样会为系统带来模棱两可的尴尬情况。若用最简单的形式去处理,系统可用句子中第一个出现的主观词作结论(例如「非常轻巧」),这样便会得出正面的意见。较有效的方法是加入所有的意见及其比重,得出一个能涵括整体意见的结论。假如「非常轻巧」的比重是0.8,而「不清晰」的比重是0.6,该句子便会被视为正面。在上例中是有把「非常」这词汇计算在内,因此该句子的正面比重是比较强的。但如何对不同的词作分类及比重,现还是一个富有挑战性的研究课题。
  意见采集是集合「网络采集」(Web Mining)、「自然语言处理」(Natural Language Processing)及「本体论」(Ontology)。「网络采集」被用作抽取带有观点的句子;「自然语言处理」能从语法上着手进行分析,并以语义学的理论分析句义。「本体论」则以物件和字词两者间建造一个语义的网络,以描述物与物、物与词及词与词之间的关系。例如「书本」是由「作者」撰写的,「镜头」是「相机」的一部份。还有的是,形容词及他们的意义(例如:词的客观性及定性)与物件的结合,是由本体论所控制着,例如:「黑色」是从客观性的角度去形容「长裙」,「高」则是主观且带有正面含义去形容「人」。

电子政府应以网民为中心
  总括来说,「资料便是王者」(Data is King)正正是Web 2.0的关键所在。因此,政府应该投放更多资源去研究用户在互联网上的行为,这样不单为其行政带来益处,更能造福电子社群。
  政府有责任照顾她的公民。互联网是一个发展中的社会,所以电子政府(e-Government)亦有需要照顾她的网民(e-Citizens),要多留意网上不良行为,例如电子的恶意破坏,电子暴动等等;不然的话,我们未来将会是人心惶惶地在一个极不安全的环境下工作及生活。
  Web 2.0 的出现已经大幅度改变了电子政府的形态,今天的电子政府更应以网民为中心,想网民所想。要满足网客的需要,就必须要深入了解网上行为和网上文化。为此,本文就介绍了两种尖端科技,分别为『社会网络分析』和『意见采集』。要是能有效地运用这两项技术,电子政府就能为网民提供理想的电子服务和网上设施,并且有效防止各种网上罪行,令与生活息息相关的虚拟世界变得更健康和谐。
 
相关文章 / Related Articles

香港学生反修例运动中网络关系解体的实证调查

宋昭勋、吴静、胡欣立
2021-01-11

ICT Use at Home and Telecommuting Practices in Hong Kong

Louis Leung
Renwen Zhang
2016-07-25