用于生产或商业目的。这也适用于所有基于 Llama 的研究项目,例如 Vicuna,它们也不能用于商业用途。限制 Llama 许可的决定可能是在 Facebook 之前发布的语言模型 Galatica 的发布经验背景下做出的。 Galatica 作为开源发布,但 AI 伦理界的一些参与者利用该模型的有问题的答案引发了公众争议,随后该模型被撤回。需要强调的是,像 Llama 或 ChatGPT 这样的模型不是真理机器,而是单词预测模型。尽管面临这些挑战,Llama 仍在对人工智能社区产生重大影响。它在开源社区中引发了一股热情,并成为许多项目的基础 - 例如 GPT4All。
2023 年 7 月,更新版本 Llama v2 在允许商业使用的许可下发布。一些人认为这是 Meta 试图挑战 OpenAI 在聊天模型领域的主导地位。 Llama v2 扩大了数据和训练量,符合为更好的模型提供更多、更高质量的数据的趋势。但需要注意的是,该许可证在这里也有限制,仅适用于月活跃用户数不超过 7 亿的应用程序。目前,Llama v2 是最好的开源语言模型。
最后,Llama 催生了一个广泛的开源生态系统,包括 OpenLlama (Fully-OSS)、Vicuna (Instruction) 和 Llama.c (Edge) 等项目。各种各样的用例展示了 Llama 的多功能性和令人印象深刻的功能。
鹘
阿联酋技术创新学院 (TII) 于 2023 年 3 月推出 Falcon LLM。它是一个全面且开 医疗实践电子邮件列表 放的语言模型,可用于研究和商业目的。与许多其他模型不同,Falcon LLM 是完全开源的,允许广泛的应用场景。 Falcon LLM 已发布多个版本,包括 70 亿个参数模型和所谓的指令模型。指令模型是专门为遵循指令而设计的。例如,它可以配置为仅使用 JSON,以确保数据处理的最佳输出。借助这些自定义选项,用户可以显着控制和提高模型的性能。除了70亿参数版本之外,TII还发布了400亿参数版本。这里也提供标准版本和指令版本。
Falcon LLM 模型是在 Apache License Version 2.0 下发布的,允许商业使用。 Falcon LLM 的一个特点是其训练所依据的广泛且精心策划的数据集:RefinedWeb。该数据集是专门为 Falcon 项目创建的,包含比典型数据集更高比例的高质量文本。这使得 Falcon LLM 的性能优于许多其他未接受如此高质量数据训练的模型。在 LLama v2 发布之前,Falcon LLM 在所有开源 LLM 排行榜上名列前茅。
前景
两份相关出版物讨论了开源模型的挑战。一份谷歌工程师文件假设商业提供商很难与开源模型竞争。尽管如此,OpenAI 的 GPT-4 仍然处于领先地位,尽管开源模型正在迎头赶上。另一个问题可能是欧盟的人工智能法案,该法案为基础模型制定了严格的规则。 《模仿专有法学硕士的虚假承诺》论文表明,在 GPT-4 等专有模型上训练的小型法学硕士很难泛化。尽管如此,开源法学硕士的进展令人印象深刻。因此,开源是对人工智能民主化和塑造包容性数字未来的重要贡献。
您想了解更多关于 adesso 世界中令人兴奋的话题吗?那么请看一下我们之前发布的博客文章。
也很有趣
欧洲大型语言模型快速入门:Aleph Alpha 的 Luminous
大语言模型自动文档处理简介
马克·梅兹格图片
作者 马克·梅兹格
Marc Fabian Mezger 是一位人工智能专家顾问,专门研究医学深度学习、计算机视觉和漂移领域。他目前在人工智能和数据科学能力中心担任职务,负责为客户提供有关人工智能解决方案及其实施的建议。他拥有丰富的机器和深度学习知识。