校园网受众分析 受众分析结果显示,华中科技大学校园网主页总的日均访问量为8795次,而周末日均访问量 为1783次;校园网用户日均访问量为4792次,而周末校园网用户日均访问量仅为267次。 一文/刘波李芝棠郑竟力 随着校园网规模不断扩大,越来越多 的人成为其信息传播下的受众。校园网管 理者要更好地传播自己的信息,就必须对 校园网受众有清晰的了解。本文讨论了校 园网受众分析的相关技术和分析浏览者行 为的理论与算法,提出了NA阈值聚类算 法,并对校园网站点服务器的日志数据进 行了实例分析,讨论了分析结果所包含的实 际意义。通过校园网服务器日志文件中的 记录来分析网络受众的行为特征,获得了 网络受众的行为动因,以及受众行为规律在 完善校园网络管理时的用处。 互联网的兴起,改变了受众的传统地 位。作为一种交互式媒体,互联网凭借其技 术上的优势,改变了传播者与受众之间的 “点对面”的传播。使媒体与受众之间、受 众与受众之间都可以建立一种“一点对多 点”“多点对多点”、横向与纵向交织的多元 化互动交流关系。校园网门户网站受众行 为的分析已经成为现今的热门话题。对校 园网的受众了解并非想象中那么简单。例 如:在某个具体的时间段内,网站的浏览流 量是多少?有多少用户在访问?这些用户 使用哪些网络协议?他们在访问哪些具体 的网页?用户来自什么地方?在使用哪种 网络工具软件?在访问什么信息等等。如 果网站能够从网络中获得网民的信息并从 中分析其行为动因,那么就比较容易掌握网 民的需求。从日志分析中得到的信息是很 难从真实世界中捕获到的,但这些信息却 38中国教育网络2o1o 4 可以较容易地进行在线收集。 息,可以了解对学校感兴趣或需要学校提 供信息帮助的网络受众的真实需求;总结 受众分析方式 他们的行为规律,又能够反过来发现网站 建设中和网页设计中存在的不妥之处,指 受众研究三大方面 导网站管理人员进行有针对性的修改,提 丹麦学者克劳斯・布鲁恩・詹森(Klaus 高校园网主页服务器的运行效率。 Bmhn Jensen)和瑞典学者卡尔埃里克・罗森 而选择视频点播服务器这个载体进行 格伦(Karl Eric Rosengren)合写了一篇文章 研究是因为网络技术融人电视技术就迅速 《受众调查的五项传统》,将受众研究传统划 发展成综合性新技术——流媒体技术。它 分为五类:效果研究、使用与满足研究、文 利用网络和视频技术的优势,彻底改变了 学批评、文学研究和接受分析。著名传播学 过去收看节目的被动方式,实现了节目的 者丹尼斯・麦奎尔(Denis McQuail)在此基础 按需收看和任意播放,集动态影视图像、静 上,将受众研究划分为三大方面:结构性、 态图片、声音、文字等信息为一体,为用户 行为性和社会文化性分析。 提供实时、交互、按需点播服务的系统。作 三种受众研究传统的比较如表1所示。 为医科学院,我校拥有大量的医学实验、外 研究载体及本地资源 科手术、国内外知名医学权威讲座等一系 研究中选取3W服务器作为信息收集 列宝贵的医学视频教学资源。视频点播服 载体。包括校园网门户网站的主页服务器 务器可以将宝贵的医学视频教学资源提供 和视频点播服务器。 给广大学子,有助于大力提高医科学生的 学校建立自己的门户网站是学校对外 理论水平和实际应用能力,提高我校的教 的重要窗口之一,通过自己的网站,不仅可 学质量和学生的个人素质。选用视频点播 以让外界更全面地了解学校,同时,也能够 服务器进行受众分析,可以从海量的视频 为学校开展远程教育提供了一个平台。所 教学资源中找出热门资源,掌握学生们真 有万维网的用户想要通过万维网与学校建 正感兴趣和真正急需的教学素材,了解学 立连接,都要通过主页服务器来完成。通过 生访问的地理和时间规律,以便合理分配 分析主页服务器日志中记录的受众行为信 和保障应用带宽。 表1受众研究比较 主要方法 实验 心理测试 问卷 定性方法 调查、统计、分析 主要数据 动机 选择和反应 社会和文化语境 统计数据,媒介使用数据 主要目的 解释受众的选择 反应和效果 理解意义及其应用 受众构成,统计数据描述社会关系 表2日志记录字段说明 态,不同的值表示不同的 ^ ,一 三善. — : “(f——,_二一 ,) 应答。 date 2008-09-28 访问行为发生的日期 善 著。 ; time 09:07:56 访问行为发生的时间 分析统计算法 s—sitename W3SVC87308021 站点服务器虚拟主机名称 随着数据挖掘技术 其中,i,i取值为1,2,…,n,表示 S~l0 202.114.128.4 服务器IP地址 的成熟与发展,大量的 网站页面的编号;k,l为用户记录的编号; cs-method GET 客户端请求方法 取值为O,1,2,3,当不为零n,-t表示第 cs--uri--stem /images/photo 08.gif 客户端请求文件 聚类算法被应用于数据 s--port 80 服务使用端口 分析领域。根据聚类对 k个用户记录中对页面i的访问时间,当等 configuration /horne/live/ap/htdocs/ 发布设置的路径和文件 象的不同,一般将Web 于零时表示第k个用户记录没有对页面i进 sc-bytes test.asp 向客户端发送文件字节数 C—ID 46320 客户端IP地址 日志聚类分为用户聚类 行访问。由于无法计算用户访问最后一个 CS(User-Agent) 222.196.119.117 客户端浏览器及 和页面聚类2种。 页面的访问时间,所以把对最后页面的访 MoziIla/4.0(compatible; 客户端系统信息 +MSIE+6.0;Windows5。1) 服务器http状态代码 用户聚类针对用户 问时间S置为1,Mkl为会话k和l之间的 ¥ ̄:--statUS sc-substatus 200 服务器http头状态码 的会话进行分析,根据 相似度的一种表示。令M—max{M,M”1作 服务器系统内核WIN32状态 用户的访问动作,寻找 为记录k和l的相似度,则dkl=d(sk,s1)= 理解WWW日志中的蕴含信息 行为模式相似的用户, f1一M)2作为会话相异度,表示两记录间 将这些用户分为一组。Sumit.Se13和 的距离。 现有数据的解释 Rajesh N.DavC提出了一种模糊关系聚 利用凝聚思想,首先合并距离小于 受众向万维网3W服务器或者通过代 类的凝聚模型以及相应的A~FRC算法, 一个给定阈值的日志记录,产生初始聚 理发出请求,请求中包含了客户端的IP地 将凝聚思想与关系数据的模糊聚类思想 类,再通过一定的条件将具有最小的点 址,浏览器类型、浏览的时间、请求的URL 相结合来产生自然聚类;Hichem Frigui 类距离的一个点和一个类合并,或者具 等一系列信息。Web服务器收到请求后, 和Raghu Krishnapuram提出基于竞争的 有最小距离的两个类合并。合并满足的 根据请求将客户要求的信息内容直接或者 聚类方法CA,这种方法集成了层次聚类 条件如下: 通过代理返回到客户端。如果出现错误, 和划分聚类的优点,将大数据集划分为 1.一个点与其最近的类的距离≤两个 则报告出错信息。客户每发送一次Web请 许多小类,通过类之间竞争数据点来创 类之间的最小距离,则把该点合并到其最 求,上述流程就重复一次,服务器就在Et 建新类或删除弱类,最终产生自然聚类。 近类; 志中增加一条相应的记录。因此,日志文 这两种算法的理论基础是凝聚聚类思 2.一个点与其最近的类的距离>两个类 件比较详细地记载了用户的整个浏览过 想。旧有的基于划分的聚类一般需要事先 之间的最小距离,则把最小距离的两个类 程。服务器中的IIS提供log日志,每个 指定类的个数,而基于凝聚的聚类算法可 合并; 访问行为都会产生一条记录存放在当天 以通过制定不同的规则使类与类之间或点 3.不符合条件的点不合并到任何类中 的日志文件中,所有的记录会按照发生 与类之间竞争,产生类的合并和新类的创 去。 时间的顺序自动排序,每条记录都包含 建,从而产生自然的聚类效果。基于凝聚 定义1(点间距离 两点之间的距离为 很多重要的信息字段,我们通过表2来逐 聚类的思想,一种新的基于阈值的自适应 两个点的相异度,表示为:公式(2) 一进行解释: 聚类算法用于Web服务器日志数据的聚 ((” c ):min如( 。,S )tS。∈(’。,S・∈( 1 记录中的date和time字段中的值除了 类。邻里算法(Neighborhood Algorithm)通 定义2(类间距离 两个聚类之间的距 帮助日志文件按照时问顺序自动对记录进 过将距离小于阙值的访问记录合并产生初 离,定义3(点类距离 一个点与一个类的距 行排序以外,还可以提供进行受众分析时 始类,然后通过一定的规则使其余的记录 离,表示为:公式(3) 所需要的时间戳。而c—ip所提供的客户机 向某个初始类聚集,或者初始类之间合并 (E ):min ( ,S )s@S,S ∈(-1 1IP地址可以帮助我们对网络受众的地理位 弱类来产生新类。通过指定合适的阈值, 因为用欧几里德距离度量用户记录之 置以及使用网络类型进行划分,了解万维 能够得到较好的、自然的聚类结果,并且 间的相似度不合适,所以用相异度代替传 网服务器的受众分布规律。CS—method可以 可以有效地识别孤立点。 统的欧几里德距离来衡量对象之间的差异。 提供受众使用的访问方法。对SC—bytes字段 根据计算日志记录相似度的公式,在 采用有代表性对象策略,用两个类之间所 的读取和统计可以分析流量状况;对SC— 引入离散行为持续时间因素的基础上,考 有的点间距离的最小值作为类间距离,增 status和SC—substatus字段的数据分析可以 虑访问时间、站点结构和uRL三个因素,给 加该算法的健壮性,不容易受极端数据的 了解服务器在特定时间段内的服务响应状 出如下定义:公式(1) 影响,可以识别出孤立点。 2010 4中国教育网络39 访问量13333次÷天数7=1904.71次;而 周末的日平均访问量:周末教育网日平均 访问量1568次÷天数2=784次;周末非 教育网总访问量1463次÷天数2=731.5 次。  ̄Mware CEO:“私有云”更有前途 IT业界最热门的话题之一。从技 术厂商、资本市场到寻常百姓 家,云计算大有“小小一片云,搅 可以看出虽然p陵园网以外的网络受众在 动大世界”之势。作为推动信息 技术发展的主导力量,云计算将 对IT产业乃至人类社会的变革产 周末访问量也下降了,但下降比例远没有校 园网用户下降的比例大。到了休息日,校园 网主页网络受众的主体就变成了校园网外的 万维网用户,这种现象可以从数据分析饼图 3中明确的表达出来。 万维网受众分析结果及若干结论 从信息的分析结果中,可以发现主页 图3周末用户访问次数类别比例 服务器的信息受众主要集中在校园网内, 而社会受众的比例相对较少。对于学校来 说,提高其社会知名度远比仅仅为校园网 用户提供服务要重要得多。而提高社会受 众对学校关注的重要手段之一就是提高学 校主页的社会受众访问量。 要达到这个目的,有必要对学校主页服 务器发 信.息做—些改进。首先应当添加大量 师资力量、教等 、生活环境、学校组织的 社会 等。通过j塞些信息的发布,吸引适 龄^群来关注学佼晴况,为扩大高考考生的志 传工作。 另外,在主页匕开辟医学知识普及栏目, 定期发布常见病、多发病及相关药品的基础知 识,发布社会普遍关注的与医学相关的热 信 息,以此来吸引广大社会网络受众对学校的关 注度。还可以适当将—部分保密级别不高的、 知识产权没有 0网上 提供下载。当然,还有很多其他方法,在这里 就不再赘述了。圆 (作者单位为华中科技大学网络与计算中心) 生深远的影响。然而,在云计算 发展的早期,业界更多地将目光 锁定在公共云服务,企图完全利 用新的应用和架构满足业务需 求。但事实证明,这样的发展路 径过于激进,难以得到客户的广 泛认可,原因在于极少企业会因 为新的架构而抛弃现有应用。 本刊讯三月初,VMware CEO Paul Maritz Paul Maritz表示,与“推倒重来”的云计算 先生来到中国。在两天的时问里,他来到清华 实现模式不同,VMware主张通过在现有基础之 大学参加了与学生的见面会,并做了关于云 上的渐进式发展,即通过业务基础架构虚拟化, 计算的演讲,随后,Paul还与来自全国各地的 将现有的数据中心转化为内部云,实现企业内 广大媒体以及业界人士共同分享了云计算领 部IT资源的共享;同时,与托管和服务提供商 域的最新进展与发展趋势,完整地阐释了 合作,共同实现可兼容的外部云。随后,通过 VMware在云计算领域的核心战略,清晰地勾 在云之间实现联邦和统一管理,使内部资源和 勒出VMware在中国市场的发展蓝图。 可利用的外部资源连接起来,帮助企业获得云 Paul表示,如今,“云计算”已经成为当前 计算的所有好处。 普罗米休斯创新课堂获三奖 思科和北控捷通携手推教育行业 本刊讯日前,一场生动的普罗米休斯 本刊讯3月22日,北控捷通(北京)科技 ActivClassroom互动教学观摩课在北京灯市口 发展有限公司(以下简称“北控捷通”)与思科 小学举行。该解决方案包括ActivBoard互动 正式签署合作备忘录,双方将在教育行业通信 电子白板及ActiVote教学反馈系统等,目前 技术发展方面展开更加深入的合作。 有逾100万学生在日常学习中使用该教学反 根据合作备忘录,双方将主要在以下几个 馈系统。 领域中展开合作: “中国的经济正迅速发展,教育也面临越 首先,针对统一通信和云计算,统一计算在 来越严峻的挑战。我们正在推进传统课堂教 教育领域的应用开发,其次,在教育行业全面 学模式的改革,以培养面向21世纪的年轻人 推广IP技术。依托北京市及各区县教委的网络 才。”灯市口小学的校长王岚表示,“通过应用 通信项目,北控捷通将进一步推广VolP技术在 全球领先的普罗米休斯互动式课堂,灯市口 教育行业专业办公室的通信应用开发,以及在 小学的师生可以更紧密地互动,并在活泼创 教育行业的业务适用性开发、集成和改造。此 新的教学环境中学习,最终收获更好的教学 外,拓展行业市场,加强技术交流。双方将依 成果。” 托试验演示平台和研究开发成果,充分发挥各 观摩课上,普罗米休斯公司同时宣布其 自优势并调动各自资源,共同拓展相关教育行 ActivClassroom互动课堂解决方案及相关技 业市场并开展推广活动。 术荣获中国三大奖项。普罗米休斯表示,这 思科中国资深副总裁张思华表示:“我希 些奖项是对普罗米休斯帮助中国教育工作 望未来思科与北控捷通能有更加深入的合作与 者及学生开展互动式教学所取得成绩的最 交流,携手发挥在教育和网络平台上的各自优 大肯定。 势,从而推动中国教育行业的可持续发展。” 2010 4中国教育网络41