合作的出版商在
Posted: Tue Mar 18, 2025 8:21 am
生活中没有什么是免费的,人工智能公司也知道这一点。出版商对受版权保护的材料的强烈抵制迫使人工智能公司与新闻集团和阿克塞尔·施普林格等精选出版商达成独家许可协议。许多出版商显然都使用了 robots.txt 规则作为这些谈判的筹码。
单击此处下载 PDF 格式的图形并浏览源链接。
这是否意味着出版商在许可协议方面更加突出?
不会。虽然与 AI OpenWebText2 中的出现频率比在 WebText Top 1000 中的出现频率更高,但这种相关性并不是绝对的。
OpenWebText 2 排名前五的出版商中的三个(NYT、Advance 和 Gannett)没有与 OpenAI 签订许可协议。此外,WebText Top 1000 中这些发布商的比例高于 OpenWebText2(13.47% vs. 12.04%)。我只想说,人工智 电话号码业务线索 能合作伙伴关系并不能保证数据集的高代表性。还值得注意的是,《纽约时报》毯子阻止了 robots.txt 中的几乎所有人工智能爬虫,因此它出现在该数据集中表明这些数据集的创建者想要使用《纽约时报》内容,但并非他们能够这样做。
Ziff Davis 研究对 SEO 意味着什么?
内容仍然为王。
每个主要出版商都依靠高质量的内容而蓬勃发展——从突发新闻和调查性新闻到数据主导的报告和专家分析。纵观 Ziff Davis 研究中的顶级出版商,我们看到了家喻户晓的名字,例如:
纽约时报 (nytimes.com)
Buzzfeed, Inc. (buzzfeed.com、huffpost.com)
康泰纳仕 (wired.com、newyorker.com、vogue.com)
新闻集团(wsj.com、thesun.co.uk、nypost.com)
这些出版商主导搜索,自然获得反向链接,并经常用于 LLM 培训数据集,从而增强了其可信度。
单击此处下载 PDF 格式的图形并浏览源链接。
这是否意味着出版商在许可协议方面更加突出?
不会。虽然与 AI OpenWebText2 中的出现频率比在 WebText Top 1000 中的出现频率更高,但这种相关性并不是绝对的。
OpenWebText 2 排名前五的出版商中的三个(NYT、Advance 和 Gannett)没有与 OpenAI 签订许可协议。此外,WebText Top 1000 中这些发布商的比例高于 OpenWebText2(13.47% vs. 12.04%)。我只想说,人工智 电话号码业务线索 能合作伙伴关系并不能保证数据集的高代表性。还值得注意的是,《纽约时报》毯子阻止了 robots.txt 中的几乎所有人工智能爬虫,因此它出现在该数据集中表明这些数据集的创建者想要使用《纽约时报》内容,但并非他们能够这样做。
Ziff Davis 研究对 SEO 意味着什么?
内容仍然为王。
每个主要出版商都依靠高质量的内容而蓬勃发展——从突发新闻和调查性新闻到数据主导的报告和专家分析。纵观 Ziff Davis 研究中的顶级出版商,我们看到了家喻户晓的名字,例如:
纽约时报 (nytimes.com)
Buzzfeed, Inc. (buzzfeed.com、huffpost.com)
康泰纳仕 (wired.com、newyorker.com、vogue.com)
新闻集团(wsj.com、thesun.co.uk、nypost.com)
这些出版商主导搜索,自然获得反向链接,并经常用于 LLM 培训数据集,从而增强了其可信度。