©CC BY-NC-SA 4.0

频道: cx.ms/channel
笔记: cx.ms/memo
博客: cx.ms/blog
剪贴: cx.ms/clip
社交: cx.ms/sns
对大型生成模型「下毒」的数字资产保护工具

继 Glaze 之后, 来自芝加哥大学的团队公布了另外一种保护图像的工具 "Nightshade", 相比于 Glaze 通过调整图像细微像素来误导模型训练时的判断, 从而使人类艺术家保护自己艺术品真正重要的东西 —— 艺术风格. 而 Nightshade 则是直接对可能会被用于模型训练的材料进行「下毒」, 含毒的材料如果经过加工被添加到数据集中, 会影响整个 prompt 关键词的生成结果, 使模型生成与 prompt 完全不相干的结果, 而模型中毒后现有的手段也难以从数据集中分辨和剔除这部分有毒的材料, 从而实现更深远的 "资产保护" 效果.

参考文章

Glaze - What is Glaze
50张图“毒倒”Stable Diffusion,汽车和牛都分不清了 - 微信公众号 (存档)
This new data poisoning tool lets artists fight back against generative AI | MIT Technology Review
2310.13828 Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models - arXiv
New data poisoning tool lets artists fight back against generative AI : r/artificial

#人工智能 #AIGC #知识产权

via CXPLAY's Memos
Stack Overflow 将对使用其数据训练 AI 收费

2023-04-23 18:50:00 by 好兆头

在 Reddit 之后,编程问答社区 Stack Overflow 也将对科技巨头们使用其数据训练 AI 收费。和 Reddit 类似,Stack Overflow 也有着高质量的问答语料库,它有 2000 万注册用户,5000 万问题和答案。Stack Overflow 的内容所有权属于原作者,采用了 CC BY-SA 授权,也就是使用时要求署名。CEO Prashanth Chandrasekar 称,使用该平台数据集训练大语言模型的公司违反了该许可证,在将模型出售给客户时无法为每一个问题和答案归属,违反了 CC 许可证。无论是 Stack Overflow 或 Reddit 都没有公布收费价格。也许 Twitter 的定价可以作为参考:每月 4.2 万美元。

https://www.wired.com/story/stack-overflow-will-charge-ai-giants-for-training-data/

#人工智能
RIAA 将 AI 视为新兴的版权威胁

2022-10-21 23:18:00 by 猛兽的财富

美国唱片业协会(RIAA)向美国贸易代表办公室递交了最新的恶名市场名单(PDF),其中包括了 BT 网站、网盘以及盗版串流服务。此外,RIAA 还将 AI 视为新兴的版权威胁。RIAA 称有在线服务利用 AI 创作出与参考的艺术家乐曲相似或几乎一样的新乐曲。RIAA 提到的一个服务是 Songmastr,其底层技术是开源的 Matchering 2.0,代码发布在 GitHub 上。该网站许诺可根据知名乐人如碧昂丝、泰勒斯威夫特、鲍勃迪伦的乐曲创作(或称为 master)相似风格的乐曲。

#人工智能
 
 
Back to Top