但许可证明确禁止将架构或模型权重

suchona.kani.z · Post by **suchona.kani.z** » Wed Jan 29, 2025 4:21 am

用于生产或商业目的。这也适用于所有基于 Llama 的研究项目，例如 Vicuna，它们也不能用于商业用途。限制 Llama 许可的决定可能是在 Facebook 之前发布的语言模型 Galatica 的发布经验背景下做出的。 Galatica 作为开源发布，但 AI 伦理界的一些参与者利用该模型的有问题的答案引发了公众争议，随后该模型被撤回。需要强调的是，像 Llama 或 ChatGPT 这样的模型不是真理机器，而是单词预测模型。尽管面临这些挑战，Llama 仍在对人工智能社区产生重大影响。它在开源社区中引发了一股热情，并成为许多项目的基础 - 例如 GPT4All。

2023 年 7 月，更新版本 Llama v2 在允许商业使用的许可下发布。一些人认为这是 Meta 试图挑战 OpenAI 在聊天模型领域的主导地位。 Llama v2 扩大了数据和训练量，符合为更好的模型提供更多、更高质量的数据的趋势。但需要注意的是，该许可证在这里也有限制，仅适用于月活跃用户数不超过 7 亿的应用程序。目前，Llama v2 是最好的开源语言模型。

最后，Llama 催生了一个广泛的开源生态系统，包括 OpenLlama (Fully-OSS)、Vicuna (Instruction) 和 Llama.c (Edge) 等项目。各种各样的用例展示了 Llama 的多功能性和令人印象深刻的功能。

鹘
阿联酋技术创新学院 (TII) 于 2023 年 3 月推出 Falcon LLM。它是一个全面且开医疗实践电子邮件列表放的语言模型，可用于研究和商业目的。与许多其他模型不同，Falcon LLM 是完全开源的，允许广泛的应用场景。 Falcon LLM 已发布多个版本，包括 70 亿个参数模型和所谓的指令模型。指令模型是专门为遵循指令而设计的。例如，它可以配置为仅使用 JSON，以确保数据处理的最佳输出。借助这些自定义选项，用户可以显着控制和提高模型的性能。除了70亿参数版本之外，TII还发布了400亿参数版本。这里也提供标准版本和指令版本。

Falcon LLM 模型是在 Apache License Version 2.0 下发布的，允许商业使用。 Falcon LLM 的一个特点是其训练所依据的广泛且精心策划的数据集：RefinedWeb。该数据集是专门为 Falcon 项目创建的，包含比典型数据集更高比例的高质量文本。这使得 Falcon LLM 的性能优于许多其他未接受如此高质量数据训练的模型。在 LLama v2 发布之前，Falcon LLM 在所有开源 LLM 排行榜上名列前茅。

前景
两份相关出版物讨论了开源模型的挑战。一份谷歌工程师文件假设商业提供商很难与开源模型竞争。尽管如此，OpenAI 的 GPT-4 仍然处于领先地位，尽管开源模型正在迎头赶上。另一个问题可能是欧盟的人工智能法案，该法案为基础模型制定了严格的规则。《模仿专有法学硕士的虚假承诺》论文表明，在 GPT-4 等专有模型上训练的小型法学硕士很难泛化。尽管如此，开源法学硕士的进展令人印象深刻。因此，开源是对人工智能民主化和塑造包容性数字未来的重要贡献。

您想了解更多关于 adesso 世界中令人兴奋的话题吗？那么请看一下我们之前发布的博客文章。

也很有趣

欧洲大型语言模型快速入门：Aleph Alpha 的 Luminous
大语言模型自动文档处理简介
马克·梅兹格图片
作者马克·梅兹格

Marc Fabian Mezger 是一位人工智能专家顾问，专门研究医学深度学习、计算机视觉和漂移领域。他目前在人工智能和数据科学能力中心担任职务，负责为客户提供有关人工智能解决方案及其实施的建议。他拥有丰富的机器和深度学习知识。