人工智能博客系列：介绍我们的人工智能生成的元数据

jrineakter · Post by **jrineakter** » Wed Jan 22, 2025 3:17 am

在与我们的用户社区密切合作的过程中，科睿唯安旗下的 Ex Libris 了解到大规模编制完整元数据记录的挑战。

由于各种来源产生多种格式、多种类型内容，保持元数据的一致性和连通性变得比以往任何时候都更加重要，也更加复杂。

到目前为止，编目员和图书馆工作人员已经投入了大量的时间和精力来创建强大的元数据记录，以简化后端的编目工作并提高前端用户的可搜索性。

更丰富的记录使馆藏开发、馆藏管理和内容发现工作更加全面——但手动生成密集的书目数据是一项永无止境的任务。输入整个图书馆馆藏的完整描述信息几乎是不可能的，因为馆藏信息总是在不断变化。

因此，我们问：“如果可以招募人工智能来帮忙会怎么样？”

介绍 Ex Libris 的 AI 元数据生成器

我们很高兴能够分享一个人工智能驱动的元厄立特里亚电子邮件列表数据生成器的创建，它已经能够丰富Alma 社区区书目记录。当前的丰富重点是 AI 为三个特定 MARC 字段生成的元数据：

语言（041 和 008）
摘要 (520)
LC 主题词 (650)

我们从 Alma 社区区中的 MARC 记录存储库开始开发这项革命性技术，让 AI 处理书籍的全文或部分全文，然后根据内容自动生成元数据。我们的重点集中在上述语言、摘要和主题标题领域，以符合国会图书馆的标准。

截至 2024 年 2 月，我们的 AI 元数据生成器已上线，包含来自 ProQuest EBook Central 的 200 部电子书，并且数量还在不断增加。随着我们继续添加更多书目、向其他书目开放访问权限以及深化与 ProQuest 资源和其他内容提供商的 AI 生成元数据合作，还有很多工作要做。

有关 AI 生成元数据不断发展的状态的更多详细信息和更新，阅读文章在 Ex Libris 知识中心。

为什么这很重要？

这种可扩展的技术将对编目员、图书馆工作人员及其用户产生深远影响。人工智能生成的元数据丰富功能不仅可以节省图书馆工作人员的时间和精力，还可以确保书目记录包含全面且有用的信息。对于馆藏开发和馆藏管理而言，这意味着可以轻松发现可用资源的空白，并且可以毫不费力地将来自各种来源的新资源纳入目录。

此外，AI 生成的元数据增强功能提供了更强大的书目信息，使图书馆用户更容易发现馆藏。这将帮助用户访问支持其学习目标和研究领域的相关资源，为令人兴奋且通常新颖的见解、知识和理解开辟道路，并可能增加图书馆资源的使用率。

在从书本上，使用人工智能技术始终是为了解决现实用户、图书管理员和图书馆的现实挑战。我们尊重隐私和知识产权考虑的需要，最重要的是，我们了解使用可信的学术内容来生成结果和信息的重要性。

本文是我们的第四篇Ex Libris 人工智能发展系列。阅读我们之前的博客文章图书馆标题匹配的统一方法。

学术图书馆对于获取可靠的学术资料至关重要。下载白皮书学习生成式人工智能等新方法和技术以及其他图书馆软件解决方案可以增强图书馆的发现体验并使其与动态的用户期望保持一致。