扩张的OpenAI将打造怎样的商业帝国?何时跻身2万亿俱乐部?一直以来 AI 生成内容版权一直充满争议,以下是最近的一些案例,概括了当前的法律挑战:- Getty Images 诉 Stability AI:Getty Images 已在美国和英国起诉 Stability AI,称其在未经许可的情况下使用了 Getty Images 超过 1200 万张图像来训练其 AI 模型。这一正在进行的案件至关重要,因为它解决了未经授权使用受版权保护的内容来训练 GenAI 的合法性。
- Tremblay 诉 OpenAI:作者指控 OpenAI侵犯版权,涉嫌未经许可使用其作品来训练 ChatGPT。该诉讼凸显了使用潜在版权材料训练人工智能模型的复杂法律领域。
- Nazemian 诉 Nvidia:本案涉及针对 Nvidia 的直接版权侵权索赔,因为 Nvidia 在其 NeMo Megatron LLM 系列的训练数据集中包含版权作品。该案件围绕“The Pile”数据集的使用展开,据称该数据集包含受版权保护的材料。
除了上述争议之外,还有其他备受瞩目的案件,例如涉及 Midjourney、Stability AI 和 DeviantArt的问题,以及 OpenAI 此前与《纽约时报》之间的案件。4 月 29日,《金融时报》在其官网宣布与 OpenAI 达成战略合作,并签署内容许可协议。据悉,这项合作的主要目的集中在英国《金融时报》增强其对生成式 AI 的理解,特别是作为一种内容发现工具,以及旨在开发“为英国《金融时报》读者的 AI 产品和功能”的专项合作,新闻出版商将更广泛地扩大 AI 技术的使用。通过此次合作,ChatGPT 用户将能够看到《金融时报》精选摘要、引述以及英国《金融时报》新闻报道的丰富链接,并回应相关查询。在内容许可方面,这次合作将涵盖 OpenAI 使用英国《金融时报》的内容来训练 AI 模型,并在适当的情况下显示由 ChatGPT 等工具生成的反馈,与此前合作的其他出版商交易非常相似。今年早些时候,《金融时报》成为 OpenAI ChatGPT Enterprise 的一员,《金融时报》集团 CEO John Ridding 表示,从很多方面来看,这是一项重要的协议,它认可了新闻业的价值,并将让读者尽早了解如何通过 AI 呈现内容。”Ridding 认为,除了给英国《金融时报》带来好处之外,这对整个新闻媒体行业也有更广泛的影响。AI 平台向出版商支付使用其材料的费用是正确的,OpenAI 理解透明度、归属和补偿的重要性——所有这些至关重要。与此同时,这些产品包含可靠的来源显然符合用户的利益。ChatGPT 等聊天机器人有时会出现伪造信息或“幻觉”的问题,这与新闻业截然相反,而记者会努力核实他们提供的信息尽可能准确。因此,OpenAI 早期针对模型训练内容许可的举措主要集中在新闻业,OpenAI 可能希望这能有助于解决“幻觉”问题。 另一个主要的推动因素是版权的法律责任。去年12 月,《纽约时报》宣布起诉 OpenAI,指控其未经许可的情况下使用其受版权保护的内容来训练模型。OpenAI 对此提出异议,但消除新闻出版商进一步诉讼风险的一种方法是向出版商支付使用其版权内容的费用,因为新闻出版商的内容很可能从公共互联网上刮取(或以其他方式获取)以促进 LLM 的发展。就出版商而言,他们将从内容许可中获得一些现金。OpenAI 表示,它们已经签署大约十几个出版商协议,并补充说还有许多协议正在进行中。出版商也有可能获得一些读者。如果 ChatGPT 用户选择点击链接到其内容的引文。从《金融时报》与 OpenAI 的战略合作可以看到出版商与生成式 AI 公司未来的合作趋势,AI 公司可能会评估与使用抓取内容相关的风险,并导致其转向许可内容用于训练目的。通过与成熟的内容提供商合作并获得适当的许可,AI 公司可以降低法律风险,同时访问高质量的数据集来训练其模型,这种伙伴关系强调了 AI 技术开发中采用法律和道德实践的重要性。最近的合作伙伴关系,例如BRIA 和 Getty Images 的合作,还有 OpenAI 与 Le Monde 以及 Prisa 的合作,都体现了这一趋势。vAIsual 是体现这一趋势的公司。他们已成为 AI 行业数据集市场的领导者,为 AI 训练提供合法干净的数据集。自成立以来,vAIsual 一直致力于提供现成的数据集,为AI 创新者节省时间并降低法律风险,其定制数据集服务迎合了寻求高质量数据来训练 AI 模型的全球公司,突显了 AI 生态系统中对合法合规数据集的需求不断增长。根据 Straits Research 的报告,到 2030 年, AI 训练数据集市场预计将达到 72.3 亿美元,2022 年至 2030 年的复合年增长率为 20.8%。这种增长不仅由数据集规模的增加推动,还由通过数据集类型的多样化。从历史上看,特定的数据集——尤其是医疗保健和制造等行业的数据集,这些数据集需要无法轻易从公共领域收集的数据——一直主导着市场。然而,随着 AI 应用对生成内容的需求不断增长,此类数据集预计将成为这个不断扩大的市场不可或缺的一部分。信任和透明度成为客户的关键价值观,表明 AI 生成内容时需要披露信息,尤其是在编辑环境中。这一趋势反映出,当 AI 用于生成内容时,尤其是在编辑和纪录片制作等敏感领域,对明确披露的需求不断增长。Zach Seward 在 SXSW 2024 上强调了随着新闻机构越来越多地尝试 AI ,保持编辑完整性的重要性,他强调 AI 生成的内容如何使用并向公众呈现的透明度,确保受众了解他们正在消费的内容的性质。此外,内容真实性倡议 (CAI) 和 内容来源和真实性联盟 (C2PA) 等标准的出现也发挥着至关重要的作用。这些组织正在开发技术和标准,以提高数字内容的起源和历史的透明度。通过支持数字来源的使用,这些努力旨在打击错误信息并确保消费者能够验证内容的真实性和完整性。尽管目前还没有普遍制定的规则,但这些公司正在采取积极措施制定并遵守内部准则,以确保在内容创建过程中人工智能的透明度和道德使用。在我们之前的一篇文章中, 我们推荐了 如何在营销活动和设计项目中使用人工智能的几种实践,包括:个性化是营销和广告公司的重要推动力。可能会出现一种趋势,公司利用其产品内容来制作特定于品牌的 AI 生成内容,从而增强营销策略中的个性化触感,以下是一些突出这一趋势的案例和策略:- Adobe 的内容供应链解决方案:Adobe 开发了内容供应链解决方案,深度集成生成式 AI 功能,以简化跨品牌的内容创建。该平台允许品牌生成个性化的营销文案和其他与其数字战略完美契合的内容类型,确保所有沟通在各个渠道上保持一致的品牌形象。该系统旨在显着加快内容创建速度,同时允许高度个性化。
- Typeface Hub 的多模式 AI:Typeface Hub 增强了其多模式 AI 功能,可以更好地控制特定于品牌的内容生成。他们更新的品牌套件会自动调整以适应品牌独特的声音和风格,确保所有内容,无论是文本还是图像,都严格遵守预定义的品牌指南。这对于在大规模数字营销活动中保持一致的品牌特别有用。
- Flair.AI:一款用于产品拍摄、可视化和动画的人工智能设计工具。FlairAI 专为营销人员和品牌设计,用于生成品牌特定内容。该工具使品牌能够创建不仅符合其身份的内容,而且还可以进行调整以满足受众的独特喜好。
最后,大部分 AI 炒作还都集中在基础模型的横向能力上,但 AI 的真正机会在于 AI 以及 Agent 如何重新配置与创造 B2B 价值链,硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则,增速远超 SaaS,AI 应用层拐点来临了么?1、Financial Times announces strategic partnership with OpenAI,Financial Times;2、Key Trends and Forecasts Influencing the GenAI Market in 2024,Everypixel Journal;
免责声明:本文不代表米塔之家立场,且不构成投资建议,请谨慎对待。
版权声明:作者保留权利。文章为作者独立观点,不代表米塔之家立场。
了解更多元宇宙知识,结识元宇宙人脉,扫码加入元宇宙行业生态社群。