关注我们 - 数字罗塞塔计划 -
一、IIPC概述
IIPC始建于2003年,总部设在法国巴黎,是法国国家图书馆发起成立的国际性组织,创始成员11个,包括法国国家图书馆、英国国家图书馆、芬兰国家图书馆、瑞典国家图书馆、冰岛国家与大学图书馆、加拿大图书馆和档案馆、美国国会图书馆、挪威国家图书馆、澳大利亚国家图书馆、丹麦皇家图书馆以及美国互联网档案馆,中国国家图书馆于2007年7月成为该组织成员。截至 2022 年 1 月,成员单位已达 52 个,包括图书馆、档案馆、博物馆、大学、研究机构等。
IIPC是一个致力于推动国际合作与网络归档(Web Archive,WA)广泛收集、保存和访问的全球性联盟。IIPC致力于改善网络归档的工具、标准和最佳实践,发展至今,已经推出WARC归档标准、Heritrix爬虫和WARC分析工具等,在网络信息归档保存实践中发挥着重要作用。我们曾经介绍过的互联网档案馆项目Internet Archive、澳大利亚国家图书馆的PANDORA项目以及英国国家图书馆的UK Web Archive项目、美国国会图书馆的NDIIPP( National Digital Information Infrastructure and Preservation Program,国家数字信息基础设施和保存计划)项目等都深受其影响。
IIPC致力于保护互联网文化遗产,促进全球知识的共享和传承。它的使命和目标如下:
使命
为世界各地的子孙后代从互联网上获取、保存和访问知识与信息,促进全球交流和国际关系。
目标
√ 使来自世界各地丰富的互联网内容集合能够以一种可以随时归档、保护和访问的方式得到保存。
√ 促进能够创建网络归档的通用工具、技术和标准的开发和使用。
√ 鼓励和支持世界各地的国家图书馆、档案馆和研究机构解决互联网归档和保存问题。
下面我们从工作组、项目和会议三个方面对IIPC进行简要介绍,更多信息可以访问IIPC官网。
二、工作组
IIPC 的具体工作由六个工作组分别开展,成员单位加入各个工作组从事短期或长期项目工作,以推进网络归档的实践。根据IIPC最新的官网信息,六个工作组分别为:采集(Harvesting )、保存(Preservation)、访问(Access)、内容开发(Content Development)、研究(Research)和培训(Training)。其工作职责简要介绍如下:
1 采集工作组
主要关注点是网络采集技术的开发,特别是Internet Archive的Heritrix网络爬虫工具。重点领域包括:
· 支持开源的Heritrix 爬虫;
· 开发智能爬虫并提高采集性能;
· WARC文件格式的开发和支持;
· 用于批量或选择性采集抓取信息的最佳实践;
· 爬虫工具的功能需求;
· 深网数据采集;
· 视频和多媒体信息采集。
2 保存工作组
专注于支持保存网络归档内容及其可访问性的政策、实践和资源。主要任务包括:
· 标识大规模网络资源,以便确定可用于保存数字资产的相关方法、标准和实践;
· 就保存工具、标准、实践、指南、测试以及可能的进一步研究提出建议;
· 为IIPC 指导委员会设计与网络资源保存相关的项目以便进行资金支持;
· 促进对保存网络资源的独特要求的认识,区别于其他数字资产保存计划项目。
3 访问工作组
专注于研究网络资源访问相关的问题,并提供一个论坛,IIPC 成员可以在其中分享经验、建立共同目标并为自己的发展提供信息。重点领域包括:
· 了解和定义用户访问需求;
· 资源发现,包括全文和创新的网络资源搜索方式;
· 访问归档网站中的多媒体内容;
· 网络资源结构和内容分析工具;
· Web归档用例的识别和记录。
4 内容开发工作组
基于Internet Archive的Archive-It服务建立起各类网络资源归档协作馆藏专题。IIPC建立协作馆藏专题的原则包括:
· 从各种角度收集内容,可以包括来自多个国家和多种语言的相关网站。对于可能引起争议的话题(例如政治或社会冲突),工作组将从不同的角度进行收集;
· 所创建的协作馆藏专题可能与现有的个人或机构主题重叠,工作组应承认此类重叠并确定所创造的附加值(例如,公共访问、更全面、更广阔的视角等);
· 馆藏专题可以被认为是开放式的(在多年内以可控的速度持续增长),或者是有限的;可以同时开发和维护多个专题。
2016年以来建立的协作馆藏专题如下所示:
5 研究工作组
旨在促进研究人员使用网络资源和IIPC协作馆藏,在IIPC成员单位中共享有关网络资源研究项目的信息,包括工作流程和经验教训,并促进传播和讨论用例的方式。重点关注领域包括:
· 在IIPC内共享有关网络资源研究使用的信息;
· 在IIPC网站上推广研究人员用例示例;
· 在IIPC成员之间收集和共享有关研究相关活动的信息;
· 有关法律问题的常见问题解答;
· 共享工作流程(创建数据集,与其他研究人员合作)。
6 培训工作组
致力于实现使IIPC成为向其成员、网络资源管理员和从事网络归档的技术人员提供网络归档培训的世界领导者的愿景。主要工作内容包括:
· 调查IIPC成员单位的培训需求;
· 对现有网络归档培训课程的广大社区进行调查;
· 利用成员的专业知识,编写高质量的培训课程;
· 亲自和/或通过网络研讨会提供培训;
· 根据反馈评估和完善课程。
三、项目
IIPC 根据年度《征求建议书》和《战略行动计划》中概述的目标资助技术和教育项目。该联盟还通过共享数据和测试工具在研发项目上进行合作,成立研究工作组来研究具体问题并提出建议,也赞助联盟自己的项目和工作包。
官网上公布的当前项目包括(注:由于翻译问题,以下内容中“爬行”实际为“爬虫”):
1 、2021-2022 年酌情资助计划
2、IIPC工具开发项目
3、正在进行的项目
四、会议
IIPC各个工作组都会定期组织会议,IIPC年度大会自2007年开始基本上每年召开,一般同时会召开网络归档会议。成员单位和社区公众在会议期间分享经验并提出解决方案。
最新的2023年IIPC年度大会与网络归档会议刚刚结束,官方宣传海报如下:
会议在位于希尔弗瑟姆的荷兰声音与视觉研究所举行。
网络归档会议的主题报告人:
对网络信息进行保存,能够及时、有效地记录时代文明发展脉络,提炼、积累与传承中华优秀文明最新成果及其生动展现形式,有利于讲好中国故事,传播中国声音,提升我国在信息环境下的文化软实力,不断增强中华文化竞争力。与国外发达国家相比,我国网络信息保存工作整体差距还比较大,应重点加强社会上下对网络信息保存工作的认识,加大在政策法规、资金投入等方面对网络信息保存的支持力度,使我国网络信息保存工作为国家安全、政府决策、经济发展和社会管理等方面提供科学权威的智力支持。
数字资源长期保存是数字罗塞塔项目的核心研究内容。数字罗塞塔计划是由杨安荣博士联合国内知名投资机构发起的一项利用蓝光存储、数字胶片、玻璃存储等技术,旨在解决电子档案乃至数字资源长期保存的国产化替代科技攻关工程项目,以实现“保存社会记忆,传承人类文明”的最终目标。
关注我们 - 数字罗塞塔计划 -
本文暂时没有评论,来添加一个吧(●'◡'●)