高等教育数字化发展研究 | 张凌燕 张焕明 汤颖颐:基于网络计量学的高校英文网站评价及建设路径
引用格式
张凌燕,张焕明,汤颖颐.基于网络计量学的高校英文网站评价及建设路径[J].中国教育信息化,2023,29(3):74-81.DOI: 10.3969/j.issn.1673-8454.2023.03.009
高等教育数字化发展研究
基于网络计量学的高校英文网站评价及建设路径
张凌燕 张焕明 汤颖颐
摘要:文章以网络计量学的链接分析法对“双一流”大学英文网站建设情况和影响力进行实证研究,获取其建构特征,能为国际化办学进程下的高校英文网站建设发展提供有价值的建议和改革方向。该方法虽被广泛应用,但它依赖于AllTheWeb、Google等搜索引擎的可用性,在主要搜索引擎不可用的情况下,选取“双一流”大学英文网站为研究样本,以链接分析法为基础,重新设定多维度网站评价指标,对指标进行数据获取和处理,计算出网络影响因子,归纳出高校英文网站建设现状中核心网站和二级学院英文网站的问题,并对国内高校英文网站的建设思路进行探讨。
关键词:网络计量学;链接分析法;评价;高校英文网站
中图分类号:G434;G647
文献标志码:A
文章编号:1673-8454(2023)03-0074-08
作者简介:张凌燕,暨南大学网络与教育技术中心高级工程师,硕士(广东广州 510632);张焕明,暨南大学网络与教育技术中心教授级高级工程师(广东广州 510632);汤颖颐,暨南大学网络与教育技术中心助理翻译,硕士(广东广州 510632)
一、引言
网络计量学起源于1997年国外相关学者提出的Webometrics概念,国内学者多在2010年前对网络计量学的定义、发展、趋势进行梳理和概括。大部分学者认为网络计量学是采用数学、统计学等定量方法,对网络信息的组织、存储、分布、引证、利用等进行定量描述和统计分析,以便揭示网络信息内在规律和数量特征的一门新兴学科。相关学者在《网络信息计量学综述》[1]、《网络计量学的理论、方法及应用》[2]、《网络信息计量学研究与发展评述》[3]等论文里对网络计量学的研究方法加以梳理,总结出的研究方法主要有链接分析法、统计分析法、图论分析法。2010年后,链接分析法被普遍使用,有关学者在《基于链接分析的网站评价实证研究》[4]、《基于链接分析法的我国省级教育信息网站影响力评价研究》[5]、《基于链接分析法的我国主要商业银行网站影响力评价研究》[6]诸论文中均利用链接分析法对四大门户网站、省级教育信息网站、主要商业银行网站开展网站评价研究。以上文献所用链接分析法均依赖于搜索引擎的开放性和可用性。然而,被普遍使用的搜索引擎AllTheWeb已于2015年关闭,各大搜索引擎的搜索结果都有一定的局限性。还有学者在《链接指标用于网站评价的缺陷分析》[7]一文中,指出商业引擎难以获取链接指标值。本研究借助链接分析法评价高校英文网站建设并设定网站评价指标,进行指标相关性分析,提出建设对策。
二、研究方案设计
(一)研究样本的选取
国内第一梯队大学英文网站是各高校网站建设对标调研选取的主要参考对象。教育部网站(http://www.moe.gov.cn/)2019年11月发布关于985、211名单咨询的答复中已明确,“985工程”1998年启动,支持39所高校结合国家创新体系进行重点建设。“211工程”1993年启动,先后共有112所高校纳入建设范围。全部高校均属全国普通高等学校,之后将“211工程”和“985工程”等重点建设项目统筹为“双一流”进行建设。因此,本研究选取教育部网站2017年9月公布的“双一流”建设高校名单A类里的35所、B类里的3所共38个英文网站作为样本。样本网站如表1所示。
表1 样本网站列表
(二)评价指标
确定核心网站的评价指标。评价一个高校英文网站的整体建设情况,需要将核心网站和二级网站共同组成一个英文网站集群进行综合分析。这个网站集群的核心网站是这个学校的官方英文网站。
1.核心网站内容指标
确定导航栏目设计和首页展示栏目数、文章数。一个网站的诞生都是从栏目设计规划开始,栏目数量和填充的内容是关乎网站吸引度的灵魂。英文网站通过新闻稿件质量(Events)、科研稿件更新频率(Research)、科研机构(Institute)、招生计划(Admission)、师资介绍(Faculy)展示一个高校国际化视角下的综合实力和科研水平。
核心网站页面设计风格是定性分析的内容,和评价人的主观感受有关。布局的整体性、分割性、色彩搭配等视觉元素运用得别具一格,符合人类审美的基本原则,往往第一眼就能给访问者以震撼的力量。
确定核心网站的网页数、外部链接数、网络影响因子。网页数是网站架构层次分布和内容规模大小指标,网页数越多证明英文网站内容越丰富。外部链接数是外部网站或页面指向该网站的超级链接数量,可以包括文本、图片等格式的链接。外部链接数能反映网站被收录的频次、被关注度、网络影响力。大多数学者选取2006年挪威·阿里雷扎(Noruzi Alireza)根据彼得·英沃森(Peter Ingwerson)提出的WIF公式,修正后的算法为:WIF=外部链接数/搜索引擎搜索到的网站内网页总数[4]。
2.具有特定指向性的标志性指标
核心网站仅是一个权重最高的指标,评价一个高校英文网站的整体建设水平还应选取其它几个维度指标。一是图书馆(Library)有无建设英文网站。建设英文版的数字图书资源库能为留学生开展学术科研提供有力支撑。二是从学校层面统筹建设以独立域名***.edu.cn为标志的英文版教师主页系统。三是英文版新闻网(News)。几乎所有高校都建有官方中文新闻网站,有无建设以独立域名为标志的英文版新闻网,是反映一个高校教学、科研、文化、活动的独树一帜的指标。四是二级学院英文网站建设指标。该二级网站不以首页域名下的超文本标记语言(Hyper Text Mark-up Language,简称HTML)页面学院介绍为评价指标,而是选取以独立域名为标志的二级学院英文网站为指标。Schools网站建设数量的多少反映高校对英文网站顶层设计和纵深发展的统筹规划建设的程度。
(三)研究方法及工具
被网络计量学研究学者普遍使用的几大商业搜索引擎AllTheWeb、Google等均存在误差,对此,有学者在《搜索引擎在网络链接分析中的应用研究》中进行了详细研究。[4-6][8][9] AllTheWeb于2011年4月被关闭停用,通过几大搜索引擎和站长之家(https://tool.chinaz.com/)的SEO查询已经无法直接查询网页数。百度的Domain指令,查询出来的是网站相关域名结果,包含互联网上含有网站URL链接以及网页内容中存在URL字符串的所有页面。只要被搜索引擎收录都有可能当成反链数搜索出来。实际上Domain搜索结果的数量要比网站反链数多很多。
Google查询网站反向链接的最精准的办法就是使用Google的网站管理员工具,但Google网站管理员工具只能查到具有控制权的网站。在站长之家的外链查询的官方网站(https://outlink.chinaz.com/)上显示:该工具用于反链查询(外链查询),可以查看该网站被哪些网站链接。综合比较后选取站长之家的外链查询作为数据采集工具。
三、数据获取和分析
(一)数据获取
大数据分析常用数据采集的方法是使用Phython的Beautifulsoup4库自定义程序爬取样本网站数据。将样本网站的核心网站当成种子结点,从种子结点URL开始,按深度优先的策略分别遍历标签对象、字符对象、HTML对象、注释对象。经过递归遍历产生外部超链接队列,接下来对外部超链接队列进行第一次遍历过滤。设定将域名解析成以edu.cn结尾的URL为目标二级网站;域名解析成非edu.cn结尾的URL为友情外部链接。一方面,一次过滤后的结果就是该样本网站链接的所有二级网站。因爬虫的合法性仍存在争议,为规避对样本网站正常运行的影响、保护数据安全,未采用爬虫库实施样本网站的爬取。另一方面,一次过滤分析后的二级网站包含Admission、Research、Laboratory等栏目下的超链接,超链接跳转的网站有中文网站、英文网站,还需要通过访问进行二次过滤分析,对每个链接进行点击确认是否连接访问有效、是否为英文网站,以及是否重复,研究在2021年6-7月这个时间段内的点击访问样本网站地址,并进行统计分析。最后得到的数据如表2所示。
表2 样本网站特定指向性评价指标(统计时间为2021年6-7月)
双一流大学A类共36所高校,除中央民族大学没有建英文官方网站,其余35所均建设有英文官方网站。从表2中看出,各高校英文官方网站(核心网站)上链接的二级英文网站以独立二级域名算,不含Schools和Departments,建设单位主要是各高校管理部处和职能部门,核心网站上链接二级英文网站较多的是武汉大学(31)、厦门大学(20)、北京大学(17)。仅有5所高校核心网站上链接的二级英文网站≥10,这在所有样本网站上占比约为13%,其它均≤10。
二级学院Schools(不含Departments)建设较多的是山东大学、浙江大学、吉林大学,不少高校Departments也建设有英文网站,在此没做统计,只统计二级学院层面的数据。同济大学的Schools有24个英文网站,但没有在核心网站上进行链接。湖南大学的Schools也有6个英文网站,但也没有在核心网站上进行链接。链接二级Schools较多的有8所高校,其二级Schools英文网站≥30,占比约为21%;链接二级Schools较少的有11所高校,其二级Schools英文网站≤10,占比约为29%;其余近50%的高校Schools链接数量在10~30之间。
教师主页是教师个人学术成果、招生意向的展示窗口。在学校层面统一规划建设英文教师主页的有北京大学、复旦大学等6所高校,其余高校仅部分学院在学院英文网站上有教师主页的展示。
建设图书馆英文网站的有北京大学、清华大学等18所高校,近半数样本网站针对留学生建设有英文版的图书数字学术服务项目。
以独立二级域名算,全国建设英文版新闻网的仅有北京大学(newsen.pku.edu.cn),其它高校均是在英文网站上以News、Events、Research等栏目内容的形式呈现新闻活动类文章,这是北京大学官方英文网站文章数量少的原因。新闻网独立运营一个英文版,也彰显出北京大学英文报道独树一帜的硬实力。
(二)搜索引擎SEO查询数据获取及分析
从表3中看出,各网站网页数差异较为明显,中山大学(4686)、上海交通大学(3367)、清华大学(3001)的栏目文章内容页数量相对较多,排列在网页数的前三名。网页数主要来自栏目文章内容详情页,主要分布于News、Events、Research这三个栏目,以上三个高校的这几个栏目均有历年的文章数据沉淀,总文章数超过其余高校(北京大学除外)文章数的3~4倍。因网站首页导航(About、Admission、Campus Life等)层次和内容建设一般属于静态栏目,网页数和网站导航栏目层次内容关系不大。而News、Events、Research属于动态栏目,文章数量是网站网页数的主要影响因子,文章数量多表示栏目更新维护频次高。北京大学是38个样本里唯一独立建设有英文版新闻网的高校(以独立域名指向算),News、Events栏目均呈现在英文版新闻网,其英文官方网站的网页数较其它高校低。网页数多的高校对学校的新闻、活动事件的英文报道频繁,内容维护力量强。
表3 SEO查询数据统计(搜索时间为2021年7月29日)
站长之家不支持子目录的反向链接查询,清华大学、中国人民大学、天津大学、复旦大学等9个英文网站的地址,是作为子目录放在学校一级域名下的,所以无法获得其英文网站的外部链接数和网络影响因子。其余29个高校英文官方网站外部链接数来自百度搜索引擎,数量普遍偏少,表示这29个高校英文官方网站被其它网站链接的次数比较少。
在已获取外部链接数的29个样本网站里,根据外部链接数和网页数计算的网络影响因子从高到低排序,排名较高的是北京大学(0.557)、北京航空航天大学(0.105)、北京师范大学(0.090),国防科技大学因网页数较少,用公式计算出的网络影响因子很大,远超过其他样本网站的网络影响因子,不列入排名。北京地区的高校样本网站网络影响因子比华东、东北、华南、西部地区高校样本网站的网络影响因子高。其它几个地区的高校样本网站的网络影响因子无显著差异。
收录量反映搜索引擎对网站的收录情况,收录量大的表示网站被关注程度高。不同的搜索引擎对同一个英文网站收录量的结果显示不同。表中的收录量来自百度,南开大学在百度中的收录量显示为2,但在谷歌搜索引擎中的收录量显示为933,吉林大学在百度中的收录量显示为15,但在谷歌搜索引擎中的收录量显示为370。收录量较高的是上海交通大学、中国海洋大学、北京师范大学。
死链指打不开、断掉、报错的链接,是由于内容的删除或程序错误又没有及时维护更新产生的。死链接会直接影响用户体验。死链检测结果显示,有24个高校样本英文网站死链数为0,其余样本网站死链数在1到5之间,死链率极低,意味着所有样本网站的日常维护有保障。
四、英文网站建设现状问题探讨
(一)各高校核心网站建设相对成熟
导航栏目规划主要有About、Admission、Academics、News、Events、Campus Life等,涵盖教学科研、学生活动、对外交流合作、人才招聘等方面的信息,并按角色浏览设置有Faculty、Students、Visitors等栏目,能提供更多有用信息。网站在美工设计上向国际看齐,设计有以Headline为主题的Banner,视觉元素冲击力强,符合国际主流设计,强调适合英语国家本土使用习惯的用户交互体验,突出各自特色,体现出全球视野的理念。
(二)二级学院Schools英文网站缺乏统筹规划
学校二级机构,包括管理职能部门,以及二级学院、系所、科研机构英文网站普及率偏低。在核心网站Schools页面上显示的二级学院英文网站,有的没有建链接,有的链接失效,链接访问有效的网站大都处于分散建设管理维护状态,显得高校的国际化服务水平不高。
(三)高校普遍重视核心网站建设,但二级英文网站建设力量薄弱
有近50%样本高校的图书馆仅建设有中文网站,没有建设英文版网站,这表明针对留学生的服务体验还有待优化。全部样本网站中有30余所高校没有在学校层面统一规划建设英文版教师主页,教师主页仅在学院网站上展示。英文教师主页是海外学生报考学校、了解教师个人信息的途径,各学院显示的教师主页分散,欠缺官方网站上的统一展示窗口。
五、英文网站建设实践路径
(一)强调视觉设计,凸显人文特色
网站信息资源的功能主要是承载内容的表达,页面如何在视觉美感上给读者留下深刻印象、吸引读者,让读者内心愿意在这个页面停留下来阅读尤为重要。国际一流大学网站主体部分以简洁为主,以大图、小图、大色块、小色块来穿插使用,甚至Banner采用满屏大图来增加页面冲击力。因信息结构的不同,每一个版面的表现形式都做侧重处理,让访客浏览时视觉感受更丰富。网站的美工设计应符合国际高水平大学网站建设潮流,本着简洁大方的设计思想,进行清晰明快的版式划分,实现对校园网内信息的整合。页面设计遵循扁平化原则,没有过多的色彩和修饰,色彩搭配与视觉心理反应相适应,色彩关系满足视觉心理平衡,这样的处理能够使网站特色鲜明、重点突出。在色彩组合技巧上整体提高图片色彩的比例,实现高分辨率电脑大屏和移动终端小屏的多屏融合;与国际接轨,个性化地使用VI的标准色,实现同一色调不同深浅度分布;为了增加时代感与空间层次,采用小范围的绚丽色彩加以点缀。在图片和一些小元素的运用上,充分挖掘高校多年沉淀的历史文化内涵,传递人文思想,打造海内外有影响力的新宣传名片。
(二)构建网站群平台的技术支撑体系
塑造一个高校英文网站整体的外宣品牌,不仅要建设好核心网站,还要从顶层设计上统一规划协调,推动二级单位英文网站建设。无论是英文核心网站还是二级机构英文网站建设,都应该将其作为网站集群,放到网站群平台进行统一建设和运维管理。各二级单位英文网站缺少规范化的同时,存在各种安全隐患,英文网站安全性无法得到保证,分散的网站管理加大对服务器管理维护服务的依赖性,也是对技术部门管理资源的极大消耗。
网站群平台采用垂直管理模式,站点体系呈上下级结构,自上而下统一管理,上级站点又完全拥有下级站点的所有信息资源,直接共享下级站点内的信息。内容树(Contents Tree)的概念能实现分级管理信息资源,所有的信息只需要维护一次,上级站点可以直接引用下级站点内的信息。非上下级站点之间也可以采用“信息推荐”“跨站发布”“跨站引用”等方式被其它网站引用到。这种模式实现内容的融合与共享,有利于消除信息孤岛和信息不一致的现象,核心网站和二级网站的英文信息资源可以互相引用,极大地提升学校英文翻译稿件的资源利用率。将核心网站和二级英文网站都放到站群系统并加以整合,节省二级单位网站单独建设的费用,减少网站管理员的工作量。
(三)建立内容建设机制
文章数的产生和内容息息相关,常态化的内容来源是影响网络影响因子的主要因素。技术部门往往缺乏内容翻译力量,而管理部门欠缺技术实现能力。要长效运维一个英文网站,就必须建立一个内容专业翻译机制和网站运作机制,并且成立一个专业的团队。高校部门分散、信息来源众多,各职能部门明确分工,形成内容产生、内容翻译、图片处理、内容审核、内容发布的常态化运作机制,内容维护从各栏目的特性出发,保障信息发布渠道的畅通,坚持定期内容更新发布,宣传学校新时期的形象。
(四)提升海外访问速度
英文网站的访客多在国外,海外内容分发网络(Content Delivery Network,简称CDN)服务,是保障国外访问速度的重要措施。因此,可以在现有的Internet中增加一层新的网络架构,将网站内容发布到最接近用户的网络“边缘”,使用户可以就近取得所需要的内容,提高用户访问网站的响应速度。在完成CDN业务部署后,用户在国内外访问英文网站信息资源的速度得到跨越式提升。
(五)SEO优化
对页面标题进行优化,每一篇文档有独立的标题。设定网站关键词为“**University、Admission、Education、Professor”,在keywords和description标签中使用。内部链接以栏目和功能为导向,结合关键词,设置更方便友好的内部链接跳转。使用重点信息HTML标签,比如 strong / h2-h5 / b 等。完善全站导航,使其具备站点地图功能。链接统计添加title,图片添加 alt 说明,增强收录导向。适当静态化,将事宜公开发布页面静态化。校内链接与反链接方面,优化校内各院系及职能部门链接,做好主页反链接(加title)。增加 robots.txt 文件。抽离 js、css 代码,让页面专注于呈现内容。
(六)开阔全局建设视野
在当今“互联网+”时代手机移动端的广泛应用潮流下,英文网站除了建设电脑PC端版本,手机端版本也要同时建设,以实现访客的多终端访问和网站信息资源的移动端口接入。应当更大力地推动、引导、鼓励二级英文网站建设。从研究数据来看,顶层核心网站的建设已经有比较清晰的思路,形成可复制可推广的经验,建设模式应当推广到全校:一方面要注重核心网站的顶层设计;另一方面继续鼓励二级学院、系、所等科研机构大胆建设英文网站,注重探索,注重核心网站先行,并使顶层设计和先行探索有机结合,不断将高校整体英文网站建设引向深入,借助网站的传播广度和渗透深度,宣传高校的发展成果,加快国际化办学进程,积极谋划、参与国家一流大学和学科建设。
参考文献
[1]邱均平,张洋.网络信息计量学综述[J].高校图书馆工作,2005,25(1):1-12.
[2]王知津,郑红军,张收棉.网络计量学的理论、方法及应用[J].中国图书馆学报,2005(4):11-14.
[3]赵丹群.网络信息计量学研究与发展评述[J].情报理论与实践,2019(6):154-158.
[4]黄贺方,孙建军.基于链接分析的网站评价实证研究[J].情报杂志,2011(1):74-77.
[5]徐芳.基于链接分析法的我国省级教育信息网站影响力评价研究[J].现代情报,2012,32(9):168-171.
[6]张倩,滕红,袁小姗.基于链接分析法的我国主要商业银行网站影响力评价研究[J].情报科学,2011,29(6):833-837.
[7]李江.链接指标用于网站评价的缺陷分析[J].图书馆杂志,2008(5):40-44.
[8]段宇锋,邱均平.基于链接分析的网站评价研究[J].中国图书馆学报,2005(4):19-23,41.
[9]杨木容.搜索引擎在网络链接分析中的应用研究[J].图书情报工作,2006,50(11):91-94.
Evaluation of University English Website and Implementation Path Based on Webometrics
Lingyan ZHANG, Huanming ZHANG, Yingyi TANG
(Network and Educational Technology Center, Jinan University, Guangzhou 510632, Guangdong)
Abstract:On the webometrics link analysis of construction and influence of “Double First-Class” university English websites, this paper makes an empirical study and obtains its construction characteristics, which can provide valuable suggestion and reform direction for the construction and development of university English websites under internationalization context. Although this method is widely used, it relies on the availability of search engines such as Alltheweb and Google. So we select the English websites of “Double First-Class” universities as the research samples when the main search engines are not available. Based on the link analysis method, we reset multi-dimensional website evaluation indicators to acquire and process indicator data, calculate network impact factors, then summarize the problems of core websites and secondary college English websites in the current situation of university English website construction, and discuss the construction ideas of domestic university English websites.
Keywords:Webometrics;Link analysis;Evaluation; University English website
编辑:王天鹏 校对:王晓明
期刊热点
2023-04-20
2023-04-18
2023-04-17
2023-04-12
期刊简介
《中国教育信息化》创刊于1995年8月,是由中华人民共和国教育部主管,教育部教育管理信息中心主办,面向国内外公开发行的国家级学术期刊。期刊内容力求全面深入地记录我国教育信息化的建设进展、研究与应用成果和行业发展状况,开展我国教育信息化发展状况调研和教育信息化国际比较研究,服务于国家教育宏观决策;力求全面准确地把握教育信息化相关的方针政策和标准规范,及时追踪ICT前沿技术的发展趋势及其与教育的融合,深度挖掘教育信息化建设与应用的体制、机制创新,服务于我国教育信息化实践。
●RCCSE中国核心学术期刊
●中国人文社会科学(AMI)扩展期刊
●中国期刊全文数据库收录期刊
●中文科技期刊数据库收录期刊
●国家哲学社会科学学术期刊数据库收录期刊
●中国核心期刊(遴选)数据库收录期刊
●龙源期刊网收录期刊
一年12期,每月20日出版
20元 / 期,邮发代号:82-761
编辑部邮箱:mis@moe.edu.cn
通讯地址:北京市西城区华远北街2号921室