©CC BY-NC-SA 4.0

频道: cx.ms/channel
笔记: cx.ms/memo
博客: cx.ms/blog
剪贴: cx.ms/clip
社交: cx.ms/sns
AnyViewer 使用兑换码 8238-E56A-802B-0C6E 再得一年专业版订阅. #羊毛

via CXPLAY's Memos
#吐槽

In reply to nevent1q…fsgw
_________________________

MediaWiki 系列软件可以去用指向当前修订页面版本的 oldid, 或者使用当前条目的 curid 作为参数替代条目标题使用.
oldid 在条目菜单的 "永久链接" 里面, curid 在条目元数据里面.

via Nostr@cxplay
#吐槽

In reply to nevent1q…sl3p
_________________________

Finding out who our friends and enemies are from random people on the internet is impossible, and I gave up years ago. Now AI will be a good "reverse Turing test" for humans.

via Nostr@cxplay
#article #read

In reply to nevent1q…m8um
_________________________

HuggingFace 一名用户名为 nyuuzyou 的用户未经授权抓取了七个创作托管平台的内容, 包括:

1. Archive of our Own (AO3)
2. Artfol
3. Artgram
4. Character Hub
5. Itaku
6. PaintBerri
7. PaperDemon

大量平台内的艺术家参加抗议, 比如 AO3 的作者纷纷锁定内容为仅注册查看. 平台也送去了 DMCA 在内的反制措施要求 HuggingFace 处理这些数据集. 截止目前这些数据集大多已经处于临时禁用下载的状态, 但只有 Artfol 和 Itaku 的数据集被彻底删除.

AO3’s Data Was Scraped For AI: What To Know : AO3
https://old.reddit.com/r/AO3/comments/1k6ie6v/ao3s_data_was_scraped_for_ai_what_to_know/

IMPORTANT: Your art and writing has been scraped and published in an AI dataset - Art RPG Event - PaperDemon Art RPG - PaperDemon
https://www.paperdemon.com/app/g/pdarpg/events/view/994/immediate-action-required-your-art-and-writing-has-been-scraped-and-published-in-an-ai-dataset/1

#copyright #AI

via Nostr@cxplay_clip
#article #read

帮助:在中国大陆正确使用知识共享许可协议 - 求闻百科,共笔求闻
https://www.qiuwenbaike.cn/index.php?oldid=7586891

via Nostr@cxplay_clip
#article #read

求闻百科:何谓“中国价值观基础上的客观观点”?简谈维基式“中立”的虚伪 - 求闻百科,共笔求闻
https://www.qiuwenbaike.cn/index.php?oldid=8381554

via Nostr@cxplay_clip
#吐槽

我的朋友, 不要再往文档和文章的 HTTP URL 路径里面装非 ASCII 字符了.

在 URL 里面用中文字符作为文章唯一 ID 还不如用 UNIX 时间戳, 就算是随机哈希和自增 ID 都比百分号编码后的 URL 的传播效果更好. 仅仅是为了中文本地化还是中文国际化? 就和 IDN 域名一样, 只是浏览器地址栏的虚假表象而已. HTTP, HTTP URL 并不同于文件系统, 更不同于软件里的引用 path.
在信息传播面前, URL 是不如 Open Graph 可靠的, 不应该期望 URL 就携带大部分可读信息, 况且这还是指向中心化的 PGC 甚至 UGC 内容.
指向内容和信息的 URL 要更利于传播, 而不是利于直接信息表达, 应该直接携带文章标题分享而不是把文章标题直接写进 URL 然后去指望传播途中不出差错. 百分号编码之后的非 ASCII 字符对人类的可读性和传播性为零, 更不要说人人都在依赖各式各样平台的各种奇怪的行为的自动链接识别, 这是更加不可靠的传播障碍.

在有标记语法和富文本渲染里面使用直接的 Unicode 编码 HTTP URL 而不是百分号编码是合理的, 因为人可以完全限定这段字串符的属性. 标记语言特别是 Markdown 更不应该期待解析器去自动处理链接, 应该使用尖括号来标记这段「HTTP 开头的 Unicode 字串符是链接」, 这是写给解析器看的, 更是写给人类看的. 标记语言的源代码人类可读性就和文件扩展名一样, 对机器来说完全是浪费时间和空间, 但这是人类始终需要的.

为了浏览器自动编码, Web 服务器和文件系统的冲突的妥协并不难理解, 况且这部分连字母大小写的标准都是问题. 但是, 文章的「永久链接(Permalink)」这不是文件系统和 Web 服务器强迫 CMS 做的, 如果你的 CMS 还在只能用标题作为永久链接还不会自动忽略非 ASCII 字符并添加唯一标记, 那么说明这个 CMS 该换了. 给文章脸滚键盘打个永久路径 ID 并不比起文章标题要难.

如果不是体量巨大的中心化 UGC, 或者是日发文章也能上千万的 PGC 平台. 不想用自增 ID, 那 UNIX 时间戳甚至 CRC8 就足够了, 哈希碰撞很难找到被协议, 域名和路径重重限定的 HTTP URL 上. 最后剩下的就只有锚点 ID 了, 这就更是纯看 CMS 愿不愿意而不是写的人想不想了, 只有很少的一部分 CMS 和解析器支持自定义锚点 ID, 这是客观现状, 如果不能或者不想继续麻烦给每个分节标题定义 ID, 妥协罢了.

via Nostr@cxplay
#吐槽

In reply to nevent1q…fswy
_________________________

I'm thinking that John Connor got his job taken away by the AI and is now unemployed, looking for simple labor to keep him fed, and then Elon Musk will build cheaper robots to keep replacing him. Great, we're screwed.

via Nostr@cxplay
#吐槽

In reply to nevent1q…ukrh
_________________________

But I don't know how to destroy these robots, so I'm definitely not. Can anyone else? Does Elon Musk?

via Nostr@cxplay
#article #read

什么是超个性化?| IBM

超个性化利用 人工智能 (AI)、 生成式 AI 、 机器学习 (ML) 和实时数据分析等技术来打造高度个性化的客户体验。它比传统的个性化更深入,传统的个性化可能涉及称呼客户的名字或根据他们的购买历史推荐产品。超个性化会利用更精细的数据点,例如浏览行为、位置、偏好,甚至天气或一天中的时间等情境因素。这些细节使企业能够提供高度相关的个性化体验,让每位客户都感受到独一无二,从而培养一种联系感和信任感。[...]

https://www.ibm.com/cn-zh/think/topics/hyper-personalization

via Nostr@cxplay_clip
Back to Top