#article #read
In reply to nevent1q…m8um
_________________________
HuggingFace 一名用户名为 nyuuzyou 的用户未经授权抓取了七个创作托管平台的内容, 包括:
1. Archive of our Own (AO3)
2. Artfol
3. Artgram
4. Character Hub
5. Itaku
6. PaintBerri
7. PaperDemon
大量平台内的艺术家参加抗议, 比如 AO3 的作者纷纷锁定内容为仅注册查看. 平台也送去了 DMCA 在内的反制措施要求 HuggingFace 处理这些数据集. 截止目前这些数据集大多已经处于临时禁用下载的状态, 但只有 Artfol 和 Itaku 的数据集被彻底删除.
AO3’s Data Was Scraped For AI: What To Know : AO3
https://old.reddit.com/r/AO3/comments/1k6ie6v/ao3s_data_was_scraped_for_ai_what_to_know/
IMPORTANT: Your art and writing has been scraped and published in an AI dataset - Art RPG Event - PaperDemon Art RPG - PaperDemon
https://www.paperdemon.com/app/g/pdarpg/events/view/994/immediate-action-required-your-art-and-writing-has-been-scraped-and-published-in-an-ai-dataset/1
#copyright #AI
via Nostr@cxplay_clip
In reply to nevent1q…m8um
_________________________
HuggingFace 一名用户名为 nyuuzyou 的用户未经授权抓取了七个创作托管平台的内容, 包括:
1. Archive of our Own (AO3)
2. Artfol
3. Artgram
4. Character Hub
5. Itaku
6. PaintBerri
7. PaperDemon
大量平台内的艺术家参加抗议, 比如 AO3 的作者纷纷锁定内容为仅注册查看. 平台也送去了 DMCA 在内的反制措施要求 HuggingFace 处理这些数据集. 截止目前这些数据集大多已经处于临时禁用下载的状态, 但只有 Artfol 和 Itaku 的数据集被彻底删除.
AO3’s Data Was Scraped For AI: What To Know : AO3
https://old.reddit.com/r/AO3/comments/1k6ie6v/ao3s_data_was_scraped_for_ai_what_to_know/
IMPORTANT: Your art and writing has been scraped and published in an AI dataset - Art RPG Event - PaperDemon Art RPG - PaperDemon
https://www.paperdemon.com/app/g/pdarpg/events/view/994/immediate-action-required-your-art-and-writing-has-been-scraped-and-published-in-an-ai-dataset/1
#copyright #AI
via Nostr@cxplay_clip
#article #read
Our Best Customers Are Now Robots · The Fly Blog
https://fly.io/blog/fuckin-robots/
#PaaS #AI
via Nostr@cxplay_clip
Our Best Customers Are Now Robots · The Fly Blog
https://fly.io/blog/fuckin-robots/
#PaaS #AI
via Nostr@cxplay_clip
#article #read
AI 购物应用 CEO 被控欺诈,AI 的背后其实是人
AI 购物应用 Nate 的创始人、前 CEO Albert Saniger 被控欺诈投资者。Nate 成立于 2018 年,从 Coatue 和 Forerunner Ventures 等投资者筹集了逾 5000 万美元,2021 年完成了由 Renegade Partners 领投的 3800 万美元 A 轮融资。Nate 声称,在 AI 的帮助下其应用的用户只需点击一下即可在任何电商网站上购物。但起诉书指出,Nate 实际上严重依赖菲律宾呼叫中心的数百名合同工手动完成购买操作。Saniger 声称 Nate 能“无需人工干预”进行在线交易,除非出现 AI 无法完成交易的极端情况。但美国司法部称,尽管 Nate 获得了一些 AI 技术并聘用了数据科学家,但其应用的真实自动化率实际上为 0%。
美国司法部的 起诉书 称,Nate公司资金耗尽,于2023年1月被迫出售资产,导致其投资者“几乎全部”损失。Albert Saniger的领英个人资料显示,他自2023年起不再担任首席执行官。
- https://www.solidot.org/story?sid=81028
- https://techcrunch.com/2025/04/10/fintech-founder-charged-with-fraud-after-ai-shopping-app-found-to-be-powered-by-humans-in-the-philippines/
#AI
via Nostr@cxplay_clip
AI 购物应用 CEO 被控欺诈,AI 的背后其实是人
AI 购物应用 Nate 的创始人、前 CEO Albert Saniger 被控欺诈投资者。Nate 成立于 2018 年,从 Coatue 和 Forerunner Ventures 等投资者筹集了逾 5000 万美元,2021 年完成了由 Renegade Partners 领投的 3800 万美元 A 轮融资。Nate 声称,在 AI 的帮助下其应用的用户只需点击一下即可在任何电商网站上购物。但起诉书指出,Nate 实际上严重依赖菲律宾呼叫中心的数百名合同工手动完成购买操作。Saniger 声称 Nate 能“无需人工干预”进行在线交易,除非出现 AI 无法完成交易的极端情况。但美国司法部称,尽管 Nate 获得了一些 AI 技术并聘用了数据科学家,但其应用的真实自动化率实际上为 0%。
美国司法部的 起诉书 称,Nate公司资金耗尽,于2023年1月被迫出售资产,导致其投资者“几乎全部”损失。Albert Saniger的领英个人资料显示,他自2023年起不再担任首席执行官。
- https://www.solidot.org/story?sid=81028
- https://techcrunch.com/2025/04/10/fintech-founder-charged-with-fraud-after-ai-shopping-app-found-to-be-powered-by-humans-in-the-philippines/
#AI
via Nostr@cxplay_clip
> https://www.dacs.org.uk/news-events/what-artists-and-their-beneficiaries-need-to-know-about-metas-new-privacy-policy
美国《版权法》保护传统独立博客的 RSS Feed 内容作者权利, 不得将内容未经许可重新发布. 但是 Fediverse 和其他大多数拥有互操作能力的分布式社交网络与 RSS 有不同的地方, 最基本也是最重要的能力就是跨联邦和跨点互联, 用户生成的内容将能够在这些节点网络中自由传播, 这实际上就是在各自节点网络中无数遍 "重新发布", 包括到达 Meta 的 Threads 节点. Werd I/O 的文章对此也给出了一些想法.
#RSS #Fediverse #AI #Legal #Copyright
via Nostr@cxplay
在 PowerShell 里对话和进行其他 AIGC 的非官方模块.
支持 OpenAI, Azure OpenAI, Databricks, KIMI, 智谱清言以及大量由 ollama 维护的开源模型(如 llama3 等)和与 OpenAI 服务兼容的其他平台和大型模型.
• GitHub: https://github.com/chenxizhang/openai-powershell
#PowerShell #AI #LLM
via CXPLAY's Memos
OpenAI 推出网络爬虫 GPTBot
类似于搜索引擎的索引机器人 "蜘蛛", GPTBot 将会遵守 robots.txt 和 OpenAI 的内容政策对网站内容进行抓取, 用于改进新模型.
GPTBot 的 UserAgent:
● GPTBot - OpenAI API
● ref: OpenAI Launches GPTBot With Details On How To Restrict Access
#OpenAI #AI
via CXPLAY's Memos
类似于搜索引擎的索引机器人 "蜘蛛", GPTBot 将会遵守 robots.txt 和 OpenAI 的内容政策对网站内容进行抓取, 用于改进新模型.
GPTBot 的 UserAgent:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
● GPTBot - OpenAI API
● ref: OpenAI Launches GPTBot With Details On How To Restrict Access
#OpenAI #AI
via CXPLAY's Memos
一直在说, 用于训练大型语言模型的简体中文语料数量多但质量差. 我更好奇的是, 这部分数据质量是与哪部分对比的? 什么是质量差, 质量差在哪里, 什么是 "优质语料"?
我一直认为语言和文字不存在高低贵贱, 只有其承载的信息才有. 如果简体中文这种语言, 这种文字已经可以用来代表一股信息流的质量好坏, 那才是真的文化奇观.
而对于现如今的大型语言模型, 在我看来, 这其实就是刘慈欣写过的科幻小说「诗云」的现实版本:
----------------------
《诗云》中,一个高等外星文明为了写出超越李白的诗歌,穷尽了太阳系的大部分能量,列举出了所有可能的字词组合,最终,他们“借助伟大的技术,我写出了诗词的巅峰之作”,却还是选择了认输,因为他们“不可能把它们从诗云中检索出来”。《诗云》描述的是“技术与艺术的对抗”,这个主题语也是刘慈欣小说选集本出版社的宣传语。source
----------------------
理想已经照进现实, 也许我会花时间好好看看这本小说.
#吐槽 #AI #LLM
via CXPLAY's Memos
我一直认为语言和文字不存在高低贵贱, 只有其承载的信息才有. 如果简体中文这种语言, 这种文字已经可以用来代表一股信息流的质量好坏, 那才是真的文化奇观.
而对于现如今的大型语言模型, 在我看来, 这其实就是刘慈欣写过的科幻小说「诗云」的现实版本:
----------------------
《诗云》中,一个高等外星文明为了写出超越李白的诗歌,穷尽了太阳系的大部分能量,列举出了所有可能的字词组合,最终,他们“借助伟大的技术,我写出了诗词的巅峰之作”,却还是选择了认输,因为他们“不可能把它们从诗云中检索出来”。《诗云》描述的是“技术与艺术的对抗”,这个主题语也是刘慈欣小说选集本出版社的宣传语。source
----------------------
理想已经照进现实, 也许我会花时间好好看看这本小说.
#吐槽 #AI #LLM
via CXPLAY's Memos
目前只有一个号码:
+1 (507)-596-7771
, 回复速度对于短信来说算很快了.站点: TextAIBot | Text ChatGPT from anywhere
#web #AI #OpenAI #ChatGPT #SMS
via CXPLAY's Memos
直接在浏览器储存 API Key, 显示实时状态或指定日期内的用量信息.
站点: https://llm.report/
#software #web #AI #OpenAI #opensource
via CXPLAY's Memos
via CXPLAY's Memos