科技之家

科技之家,汇聚专业声音 解析IT潮流

软件 >

首页 > 软件 >

OpenAI被控非法使用图书数据训练AI系统,版权问题如何解决?

来源:新浪科技 时间:2023-07-01 22:52:24

  7月1日,据报道,两名作者在美国旧金山联邦法院起诉OpenAI,他们认为OpenAI滥用其作品,用作品训练ChatGPT。

  来自美国马萨诸塞州的作家Paul Tremblay和Mona Awad说,ChatGPT未经许可从大量图书中复制提取数据,侵犯了作者的版权。

  训练先进的AI系统需要用到大量数据材料,这种使用方式在法律上面临诸多挑战。比如,源代码所有者将矛头指向OpenAI和微软旗下GitHub,视觉艺术家起诉Stability AI、Midjourney和DeviantArt等AI工具。被告则认为,系统合理使用了有著作权的作品。

  当用户向ChatGPT给出提示语时,AI会快速回应,虽然这种回应充满争议。ChatGPT仅仅开放两个月,1月时活跃用户便达到了1亿。

  ChatGPT及其它生成式AI系统会用海量数据创造内容,很多数据来自互联网。作家Paul Tremblay和Mona Awad认为书本是关键数据材料,因为它们是高质量长文写作的典范。

  诉状估计,OpenAI的训练数据包含了至少30万本图书,当中有许多是没有获得许可、非法获取的有版权图书。

  两名原告称ChatGPT可以对他们写的书作出非常精准的总结,也就是说他们的书被吸纳进数据库。

相关文章