©CC BY-NC-SA 4.0

频道: cx.ms/channel
笔记: cx.ms/memo
博客: cx.ms/blog
剪贴: cx.ms/clip
社交: cx.ms/sns
#article #read

In reply to nevent1q…m8um
_________________________

HuggingFace 一名用户名为 nyuuzyou 的用户未经授权抓取了七个创作托管平台的内容, 包括:

1. Archive of our Own (AO3)
2. Artfol
3. Artgram
4. Character Hub
5. Itaku
6. PaintBerri
7. PaperDemon

大量平台内的艺术家参加抗议, 比如 AO3 的作者纷纷锁定内容为仅注册查看. 平台也送去了 DMCA 在内的反制措施要求 HuggingFace 处理这些数据集. 截止目前这些数据集大多已经处于临时禁用下载的状态, 但只有 Artfol 和 Itaku 的数据集被彻底删除.

AO3’s Data Was Scraped For AI: What To Know : AO3
https://old.reddit.com/r/AO3/comments/1k6ie6v/ao3s_data_was_scraped_for_ai_what_to_know/

IMPORTANT: Your art and writing has been scraped and published in an AI dataset - Art RPG Event - PaperDemon Art RPG - PaperDemon
https://www.paperdemon.com/app/g/pdarpg/events/view/994/immediate-action-required-your-art-and-writing-has-been-scraped-and-published-in-an-ai-dataset/1

#copyright #AI

via Nostr@cxplay_clip
#article #read

AI 购物应用 CEO 被控欺诈,AI 的背后其实是人

AI 购物应用 Nate 的创始人、前 CEO Albert Saniger 被控欺诈投资者。Nate 成立于 2018 年,从 Coatue 和 Forerunner Ventures 等投资者筹集了逾 5000 万美元,2021 年完成了由 Renegade Partners 领投的 3800 万美元 A 轮融资。Nate 声称,在 AI 的帮助下其应用的用户只需点击一下即可在任何电商网站上购物。但起诉书指出,Nate 实际上严重依赖菲律宾呼叫中心的数百名合同工手动完成购买操作。Saniger 声称 Nate 能“无需人工干预”进行在线交易,除非出现 AI 无法完成交易的极端情况。但美国司法部称,尽管 Nate 获得了一些 AI 技术并聘用了数据科学家,但其应用的真实自动化率实际上为 0%。
美国司法部的 起诉书 称,Nate公司资金耗尽,于2023年1月被迫出售资产,导致其投资者“几乎全部”损失。Albert Saniger的领英个人资料显示,他自2023年起不再担任首席执行官。

- https://www.solidot.org/story?sid=81028
- https://techcrunch.com/2025/04/10/fintech-founder-charged-with-fraud-after-ai-shopping-app-found-to-be-powered-by-humans-in-the-philippines/

#AI

via Nostr@cxplay_clip
CXPLAY World
- 我希望反对或限制第三方处理我的个人信息用于建立和改进 Al at Meta
> https://www.dacs.org.uk/news-events/what-artists-and-their-beneficiaries-need-to-know-about-metas-new-privacy-policy

美国《版权法》保护传统独立博客的 RSS Feed 内容作者权利, 不得将内容未经许可重新发布. 但是 Fediverse 和其他大多数拥有互操作能力的分布式社交网络与 RSS 有不同的地方, 最基本也是最重要的能力就是跨联邦和跨点互联, 用户生成的内容将能够在这些节点网络中自由传播, 这实际上就是在各自节点网络中无数遍 "重新发布", 包括到达 Meta 的 Threads 节点. Werd I/O 的文章对此也给出了一些想法.

#RSS #Fediverse #AI #Legal #Copyright

via Nostr@cxplay What artists and their beneficiaries need to know about Meta's new privacy policy - DACS
openai-powershell - 在 PowerShell 里和大型语言模型对话

在 PowerShell 里对话和进行其他 AIGC 的非官方模块.

支持 OpenAI, Azure OpenAI, Databricks, KIMI, 智谱清言以及大量由 ollama 维护的开源模型(如 llama3 等)和与 OpenAI 服务兼容的其他平台和大型模型.

• GitHub: https://github.com/chenxizhang/openai-powershell

#PowerShell #AI #LLM

via CXPLAY's Memos
OpenAI 推出网络爬虫 GPTBot

类似于搜索引擎的索引机器人 "蜘蛛", GPTBot 将会遵守 robots.txt 和 OpenAI 的内容政策对网站内容进行抓取, 用于改进新模型.

GPTBot 的 UserAgent: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

GPTBot - OpenAI API
ref: OpenAI Launches GPTBot With Details On How To Restrict Access

#OpenAI #AI

via CXPLAY's Memos OpenAI Platform
马斯克的新项目 xAI: x.ai

Twitter: xAI (@xai) / Twitter

甚至专门买了个域名, 有钱真好.

#吐槽 #AI

via CXPLAY's Memos
一直在说, 用于训练大型语言模型的简体中文语料数量多但质量差. 我更好奇的是, 这部分数据质量是与哪部分对比的? 什么是质量差, 质量差在哪里, 什么是 "优质语料"?

我一直认为语言和文字不存在高低贵贱, 只有其承载的信息才有. 如果简体中文这种语言, 这种文字已经可以用来代表一股信息流的质量好坏, 那才是真的文化奇观.

而对于现如今的大型语言模型, 在我看来, 这其实就是刘慈欣写过的科幻小说「诗云」的现实版本:

----------------------
《诗云》中,一个高等外星文明为了写出超越李白的诗歌,穷尽了太阳系的大部分能量,列举出了所有可能的字词组合,最终,他们“借助伟大的技术,我写出了诗词的巅峰之作”,却还是选择了认输,因为他们“不可能把它们从诗云中检索出来”。《诗云》描述的是“技术与艺术的对抗”,这个主题语也是刘慈欣小说选集本出版社的宣传语。source
----------------------

理想已经照进现实, 也许我会花时间好好看看这本小说.

#吐槽 #AI #LLM

via CXPLAY's Memos
TextAIBot - 通过短信使用 Chat GPT

目前只有一个号码: +1 (507)-596-7771, 回复速度对于短信来说算很快了.

站点: TextAIBot | Text ChatGPT from anywhere

#web #AI #OpenAI #ChatGPT #SMS

via CXPLAY's Memos
LLM.report - 显示 OpenAI API 用量的在线工具

直接在浏览器储存 API Key, 显示实时状态或指定日期内的用量信息.

站点: https://llm.report/

#software #web #AI #OpenAI #opensource

via CXPLAY's Memos
问 ChatGPT 但是它的回答达到字数上限而中断怎么办? 只需要中断后回它一句 "继续说" 就行了, 当然前提是会话支持上下文. 太合理了, 感觉可以试试用这个办法给输入的问题 "分片". #吐槽 #AI

via CXPLAY's Memos
OpenAI 今天凌晨似乎放过了一批申请过上次 GPT-4 等待列表的组织。现在有权限用 GPT-4 的组织已经被炒到两千人民币以上了。 #吐槽 #ai

via CXPLAY's Memos
 
 
Back to Top