用于手稿的 HTR 仍然看起来有点像科幻小说,但自从弗雷德里克·卡普兰 (Frederic Kaplan) 宣布计划将威尼斯国家档案馆中的手稿数字化(威尼斯时光机项目)后,HTR 似乎变得更加切实可行。但实现这一目标的挑战是巨大的。该项目的宣传视频让人们看到了待数字化和转录的材料的规模,同时也表明了尚未证实的可行性。[21] HTR 的核心重点仍然是模式识别。如果这些模式不够统一,上面解释的方法也会达到其极限。神经网络研究在未来也可能提供有趣的推动力,因为众所周知,人们(经过一定程度的训练)能够阅读历史手稿。[22]
除了威尼斯时光机之外,目前还有其他有前景的项目正在处理手稿自动化和数字化支持转录的问题。转录和识别平台 (TRP) 由因斯布鲁克大学的 Günter Mühlberger 和瓦伦西亚理工大学的 Joan Andreu Sánches 领导的欧洲研究小组提供,现在通过基于训练的优化可以实现令人惊讶的高识别率,有时可超过 90%。[23]专家表示,这项技术即将取得突破,考虑到档案馆保存的大量手写资料,人们不难想象,这项技术将对中世纪晚期以来的大量书面资料的编目产生怎样的影响。[24]欧盟也认同这一观点,因此在“地平线 2020”框架下资助了这一名为 READ 的项目。
图 1:transkribus.eu 项目的 HTR 检测示例。此处显示的图像是根据 §51 UrhG 的科学引用。它可能只能在这个意义上使用;任何版权都必须遵守。
图 1:transkribus.eu 项目的 HTR 检测示例。此处显示的图像是根据 §51 UrhG 的科学引用。它可能只能在这个意义上使用;任何版权都必须遵守。
HTR 还涉及数字方法与历史辅助科学之间的关系——这是数字历史的一个尚未得到充分研究的领域。[25]有人试图将 HTR 等数字方法重新归类为历史辅助科学。这一运动主要由历史学家协会发起,但也得到了许多以数字化增强而非数字化启发的方式开展业务的知名历史学家的支持。未来几年将会表明整个数字人文学科界和数字历史作为一个子集将如何响应这一任务。无论如何,我希望将 HTR 理解为数字历史的前瞻性视角,它可以通过对以前几乎无法获得的来源进行全文索引,为产生新发现做出决定性的贡献。[26]
5. 可视化和网络分析而且由于计算机是可视化大量数据的理想工具,因此链接是自然的选择。[27]除了从描述性统计中了解到的图表之外,DH还开发或发现了新的可视化形式,例如:例如,根据术语出现的频率加权的词云和图表。
尽管抽象层次不同,但历史网络分析也具有类似的潜力,其当前方法借鉴了社会 亚美尼亚电报数据 科学网络分析 (SNA),可以为社会关系结构提供新的见解,而由于社会关系结构过于复杂,前几代研究人员从根本上无法理解这些结构。由于对连续传记资料进行了定性的重新评估,这种方法在历史科学中得到了越来越广泛的认可。[28] Gephi、nodeXL 等可视化工具为这一研究方法提供了相对简单的介绍。[29]特别是,社会和科学历史的问题可以通过这种方式得到成功的研究。[30]
历史上的网络分析起源于数学的图论。对计算社会网络的中心性、密度和派系分析的方法进行了区分。中心性程序旨在识别网络中最重要的参与者。可以计算行为主体的度中心性、中介中心性、接近中心性以及关系的方向。密度(定义为现有关系与可能关系的最大数量的比例)是表征网络或网络部分活动的一种度量。最后,团伙分析尝试将网络分解为子群并识别它们。这种分析形式的真正意义在于对“社会群体”概念进行图论形式化。
该方法可以提供灵感并产生全新的见解,尤其是在较大的网络中。启蒙运动时期科学史上使用网络分析描述社会关系的最突出的例子可能是斯坦福大学的“文人共和国”项目。[31]除此之外,作者还研究了 18 世纪跨大西洋书信联系网络,例如,本杰明·富兰克林的书信联系就被证明非常广泛。[32]
可视化网络不仅可以对人、群体及其关系产生新的见解,而且看起来也很美观。借助 Sigmajs 等 Javascript 框架,可以精美地呈现图表。[33]作为一个代表性例子,我们在此展示的是国际知识合作协会从 1926 年到 1946 年成员的通信网络,该协会是一个促进科学和知识交流的国际组织,也是今天的联合国教科文组织的前身,由马丁·格兰让根据日内瓦联合国档案的数据创建。