当前位置: 首页 > 新闻中心 > 行业动态

众包:众志成城发展档案事业

来源: 中国档案资讯网 发布时间:2020-11-30 字体:[ ]

相信大家在日常生活中都接触过百度词条、维基百科、知乎、大众点评、滴滴等网站或手机应用软件,它们或多或少都应用或体现着众包模式。那么,档案众包是何含义?国外有哪些成功实践?有何价值呢?

何为档案众包?

“众包”一词最早由美国《连线》杂志记者杰夫·豪提出,他援引了商业活动中的一些案例来解释众包,而后在自己的博客中给出“众包”的定义:“众包是指企业或机构以公开邀约的方式,将原本应由员工承担的职能外包给非限定(且通常大规模)的人际网络的行为。当需要合作完成项目时,众包可以采取协作形式;但众包项目通常是由个人承担的。众包中关键的先决条件是通过公开邀约方式构建起庞大的劳动者网络。”

虽然“众包”作为商业概念被提出,但可与各行各业结合并促进各领域发展。档案界早有关于引入众包模式的呼吁,国内不少学者对档案众包的应用持乐观态度。全球已有多个运营多年的档案众包项目,国内学者较为关注的项目包括澳大利亚国家图书馆于2008年开展的澳大利亚报纸数字化项目、伦敦大学学院于2010年开展的边沁手稿转录项目、苏格兰国家文件署和图书馆于2013年开展的苏格兰地名转录项目等。

虽然已有多个项目成功开展,但学界对于档案众包还未形成统一定义。综合来看,学界在对档案众包的阐述中包含着3个关键要素:档案机构、网络平台和社会大众。这三方分别对应发包方、发包平台和接包方。档案机构通过自建网络平台或购买已有平台,对档案资源进行任务切割并公开,社会公众可通过该平台参与本应由机构员工完成的工作,如文字转录、添加标签等,从而共同完成档案数字化任务。符合该行为的即可认为该机构开展了档案众包实践。

成功案例

一、“公民档案员”项目

美国国家档案与文件署署长大卫·肖恩·菲尔里诺于2010年提出“公民档案员”这一概念。他借鉴了“公民科学家”的概念,进而指出:“‘公民档案员’是指来自于社会各界参与档案工作的非档案专业人士。”2011年9月,美国国家档案与文件署在其官方网站上创建了“公民档案员”版块;2012年“公民档案员”这项倡议荣获“美国年度政府最佳创新实践奖”。

美国国家档案与文件署专门设立了公民档案员项目平台,公众可在该平台上参与标记、转录、注释和评论等众包活动。

标记即为“添加标签”,它对应的是档案的著录工作。公众可为文件添加标签以达到提炼重点的目的。正如美国国家档案与文件署所说:“通过在文件中添加关键字、术语和标签,您可以帮助下一个人发现该文件。”

转录则是将馆内经过数字化扫描的图片形式文档中的内容转化为文字。由于该馆的许多历史档案都是手写原件,对其一一进行转录是个大工程,且文字识别的准确率不能达到100%,因此,转录成为公民档案员的主要任务。根据手稿的难易程度,美国国家档案与文件署提供了初级、中级、高级3个难易等级供公众根据自身水平进行转录。网站上指出,转录时不必太担心匹配原始文档的确切格式,而应考虑转录文本是否有助于利用者阅读文档、搜索文档及使用其中信息,并要求用户将文档内容如实地转为文字。

注释是为档案文件增加背景信息,多用于对图片的背景介绍。评论可以为用户提供社交机会,用户可以在评论区与他人分享档案众包工作中的知识及体会,同时也能表达自己的需求甚至解决问题。

二、“众在参与”项目

“众在参与”项目是一家名为“图片”的公司与阿姆斯特丹城市档案馆合作开发的网站。图片公司是一家致力于档案及其他文化遗产数字化、保存及提供利用的公司,它为“众在参与”项目提供了可靠的技术支持,与阿姆斯特丹城市档案馆合作开发了该项目的专用平台。

该项目提供的档案众包同样包括著录、转录等内容,在内容与操作方式上与美国国家档案与文件署类似,不再赘述。较为突出的是,“众在参与”项目会对每个项目的进度进行可视化展示,以便公众快速了解项目的完成度,避免重复劳动。

在项目官网上,每个项目的进度会被分成3个部分,黑色部分表示“无须操作”,橙色部分表示“已完成待审核”,蓝色部分表示“已通过审核”即“已完成”。当将鼠标指针放至进度条时,会显示出每个部分所占的百分比。可视化进度条下还会显示出具体数字,包括扫描件份数和参与者人数。这种可视化进度与具体数据的标注,一方面便于用户根据自己的偏好来选择项目,另一方面也便于档案馆对项目进度进行更好的把控,可以适时添加新内容或调整审核节奏等。

而在某一子项目的界面中,“众在参与”项目会给出该子项目的背景信息、需要进行的工作、适合参与该子项目的用户群体以及参与该子项目可得到的奖励。以《找到了!州政府的决定》项目为例,该项目承诺:每次输入都会给予用户2个积分,累积到一定积分量后可兑换5本限定书籍。右侧栏中则会列出本项目的参与者,以及参与者关于该项目的经验、问题等交流互动内容,方便公众更顺畅地完成项目工作。

2011年至今,“众在参与”项目已拥有18911名参与者,累计完成了近600万份扫描文件的众包工作(当前的总体目标约为810.7万份)。

档案众包有何价值?

通过以上两个项目,可以看到档案众包所具有的重要价值。

对接包方即社会大众而言,通过档案众包可以有更多机会接触到档案资源,并亲身参与到档案资源数字化的过程中去。在完成众包任务时,为确保工作质量,公众需要查阅相关资料,有的项目还会对参与者进行培训,这非常有利于公众吸收新知识;若众包平台拥有社群机制,公众还可通过参与档案众包找到志同道合的朋友,满足交际需求。根据当前的研究,档案众包多为公益项目,公众持续参与项目的驱动力大多来源于个人兴趣,在参与档案众包的过程中,参与者能够实现个人价值与社会价值,能够获得情感上的满足和社会认同。

对于发包方即档案机构而言,档案众包显而易见的好处是可以帮助机构在短时间内完成大量工作,减轻其资金、人力、时间等方面的压力。由于众包的一大特色为“集体的智慧”,由公众而非仅仅依靠机构工作人员来完成工作,一方面可以减轻工作人员的个人负担,提升整体工作效率,另一方面也有利于为机构工作提供新思路、新视角。通过档案众包,纸质档案文件可以在更短时间内实现数字化、完善著录标签,这非常有利于档案资源的进一步开放、开发与利用。此外,档案众包有利于紧密档案机构与社会公众之间的联系,激发公众对馆藏档案的兴趣,从而为参与式档案馆的建设提供一定的贡献,进而提升档案、档案工作的社会影响力。

当然,档案众包在应用过程中也伴随着一系列问题,如平台如何建设与维护、如何设置成功的激励机制以吸引更多用户持续参与项目、如何设置后续的审核机制以确保众包的质量等。但总体而言,众包模式的引入有利于档案工作的开展。调查显示,目前我国的档案众包项目并不多,较为典型的是上海图书馆主办的“历史众包平台”。笔者在此呼吁国内档案界积极拥抱众包模式,通过档案众包进一步拉近档案机构与社会公众之间的距离。

原载于《中国档案报》2020年11月26日 总第3607期 第三版