CXPLAY World

©CC BY-NC-SA 4.0

频道: cx.ms/channel
笔记: cx.ms/memo
博客: cx.ms/blog
剪贴: cx.ms/clip
社交: cx.ms/sns

21:00 · 2025年5月13日 · 周二

#article #read

「在他们的研究中，研究人员检查了六年间 590 万次 Reddit 互动，并根据用户行为发现了五种不同类型的用户。其中一个有趣的群体脱颖而出——“反对者”。这些用户积极寻找对话只是为了争论。他们不是建设性地讨论话题，而是跳入辩论，发表反对意见，然后不等回复就离开。这类用户在政治相关的子版块如 r/news、r/politics 和 r/worldnews 中最为常见。但令人惊讶的是，他们在现已被禁的 r/The_Donald 这个支持特朗普的子版块中并不常见。在那个论坛中，人们大多互相认同，但对外来者表现出敌意。
[...]

这些发现对社交媒体平台可能非常有用。与传统的审核方法不同，传统方法专注于检测有害内容，而这种行为(检测)方法更难被欺骗或规避。(社交媒体)用户要改变措辞很容易，但改变互动方式则需要更多的努力。版主可以利用这项研究尽早识别有问题的用户，甚至在他们开始发布大量有害内容之前发现他们。

最终，这项研究强调了一个重要的教训：我们在网上说的话很重要，但我们的互动方式对塑造数字世界的影响更大。随着社交平台在处理骚扰、虚假信息和两极分化等问题时遇到困难，将行为分析与传统的内容审核相结合可能是创建更健康、更具建设性的在线社区的关键。」

quoting
nevent1q…rh7z
新研究用逆强化学习识别 Reddit 用户行为：部分网友“就是爱抬杠”

以往的方法多半着眼于用户说了什么或和谁互动，但这些方式本身也有盲点。新研究提出了一个更有效的视角：观察用户的行为模式，而不仅仅是他们说的话。

https://www.ithome.com/0/852/462.htm #强化学习 #行为识别 #社交媒体

- https://www.neowin.net/news/science-proves-some-reddit-users-just-love-to-troll-disagree-and-argue/
- https://dl.acm.org/doi/10.1145/3696410.3714618
- https://theconversation.com/some-reddit-users-just-love-to-disagree-new-ai-powered-troll-spotting-algorithm-finds-255879

#Censorship #Moderation

via Nostr@cxplay_clip

IT之家 (npub1kx…2nkgr)

IT之家 on Nostr:

新研究用逆强化学习识别 Reddit 用户行为：部分网友“就是爱抬杠” 以往的方法多半着眼于用户说了什么或和谁互动，但这些方式本身也有盲点。新研究提出了一个更有效的视角：观察用户的行为模式， [...]

article read 强化学习行为识别社交媒体 Censorship Moderation

15:27 · 2025年5月6日 · 周二

CXPLAY World

#吐槽 quoting naddr1qv…k6xz 看了较多的插画, 对于内容级别模糊认知是一个在整理过程中很大的问题, 频道最常用 R18 来作为情色已否的一个最重要的分界点, 但是这个界限对于我来说依旧是模糊不清的, 现在会考虑的因素包括裸露及接近裸露的程度 / 裸露的内容占比 / 暗示程度. 于是我还是得好好学习一下关于内容分级的一些常识, 这里我能找到的写得最清晰明了的介绍关于内容分级的是 Google Play 的帮助文档和维基百科词条, 不同的国家地区都有不同的分级制度, 因此如果要面向…

这个区域中作品是所有分级制度中对于情色划分争议最大的地方, 有不少国家和地区的分级制度和观众认识会将它打上 R18 的标签, 况且 Pixiv 这里还仅仅是针对于 "插画" 这一个很小的艺术门类... 很详细, 且这类作品不能用 R18 来形容, 且 Pixiv 也没有单独为这类区分对待, 那种 "三眼色"(?) 的作品也被划进全年龄榜单了...

~~色情真是个可怕的东西~~

日语用户给 Bluesky 总结的绘画内容分级标准. 很显然, "日本人的标准" 和 "海外标准" 也有一些区别.
https://bsky.app/profile/shibokuyoshi.bsky.social/post/3korc6ow3sh2s

比如兔女郎和死库水装束的人物也要附加内容警告, 而如果不按 Bluesky 的审核规则主动添加内容警告, 则有可能会被社区规则制裁甚至被封号.

#Censorship #Moderation #Bluesky

via Nostr@cxplay

CXPLAY (npub1gd…ch58h)

CXPLAY on Nostr:

nostr:naddr1qvzqqqr4gupzqs60j7vnvfl3uc03fm40vr923n7uasg2tyk2l7p9pjp9y5k4frq4qyt8wumn8ghj7mn0wd68yttjv4kxz7fwv9c8qtcpr9mhxue69uhhyetvv9ujumt0d4hhxarj9ecxjmnt9uqzycfdvejhwttwda6x2ueddahz6unpw35kueedd9kxcatnw3exzarfdahq0hk6xz 日语用户给 Bluesky 总结的绘画内容 [...]

Censorship Moderation Bluesky

15:58 · 2025年4月26日 · 周六

#article #read

澳大利亚监管机构对 Telegram 审核调查的一些细节 — Teletype
http://archive.today/2025.04.26-073840/https://cn.tginfo.me/esafety-analysis

#Censorship #Moderation #Telegram

via Nostr@cxplay_clip

archive.ph

澳大利亚监管机构对 Telegram 审核调查的一些细节 — Teletype

archived 26 Apr 2025 07:38:40 UTC

article read Censorship Moderation Telegram

09:16 · 2025年4月18日 · 周五

#吐槽

#Censorship 是 #Moderation 的超集, 追求后者会直接带动前者增长, 但单独的前者增长并不能表面后者也在增长. #Bluesky 的审查和审核存在于网络中常人能够接受和理解的 PDS 之外, 资源开销在 PDS 之上. 要完整重建 Bluesky 网络的开销并不比 #Fediverse 低, 大多数普通人只能在 bsky.app (联邦)的审查框架之下实行自己(个体)的审核.

quoting
nevent1q…346r
After a court order by the Turkish government, Bluesky made accounts unavailable for Bluesky users in Turkey this week.

I take a closer look at geographic-based moderation works on #Bluesky and #atproto, how it can be sidestepped, and much more

https://fediversereport.com/bluesky-censorship-and-country-based-moderation/

#信任与安全

via Nostr@cxplay

npub1daf0jwnmp53cgvw536lnh5e7qc4anqesecyldu73fm0e54kccyeskw783p

npub1da…w783p on Nostr:

After a court order by the Turkish government, Bluesky made accounts unavailable for Bluesky users in Turkey this week. I take a closer look at geographic-based moderation works on #Bluesky and #atproto, how it can be sidestepped, and much more https://fediversereport…

吐槽 Censorship Moderation Bluesky Fediverse Bluesky atproto

00:17 · 2025年4月17日 · 周四

#article #read

In reply to nevent1q…sfj6
_________________________

## Bluesky 应用的消息审核能力: 对全球性, 区域性和特定消息实施影子禁令

土耳其要求 Bluesky 拿下某些账户和消息, 但实际上 Bluesky 可能是为了满足隐私政策要求只对这些账户和消息进行了隐藏操作:
- https://bsky.app/profile/osma.fishpool.org/post/3lmvwsnotva22
- https://bsky.app/profile/nekorug.moe/post/3lmwgtwfggs2e

只要土耳其用户还在使用 bsky.app 提供的客户端, 那么就会被强制订阅来自 Bluesky 官方的消息审核过滤器: moderation-tr.bsky.app
Bluesky 会将这些目标账户和消息打上标签然后在不同的审核过滤器上发布, 使得做到全球性(moderation.bsky.app)和区域性审核, 实现的手段是限流. 账户和帖子实际上都没有消失, 只是被不同程度隐藏了起来. 对于规避区域审核只需要切换网络或第三方客户端, 而全球审核则只能依靠第三方客户端规避. 由于 bsky.app 目前占据 Bluesky 网络生态头部已经形成中心化导致了事实上的垄断, 导致这种本应该会被去中心化的的网络特性无效化的影子禁令切实地在 Bluesky 有效地实现了.

#Moderation #Censorship #Bluesky

via Nostr@cxplay_clip

cxplay_clip (npub18d…0sy5z)

cxplay_clip on Nostr:

## Bluesky v1.90 对于审核(moderation)功能的改进 (2024.08.29) 1. 贴文的引用(quote)转发次数被独立显示, 总的转发次数仍然计入引用转发次数. 2. 允许贴文发布者将贴文从已经被其他用户引用的贴文中「分离(detach)」 [...]

article read Moderation Censorship Bluesky

23:17 · 2024年10月21日 · 周一

#article #read

## Bluesky v1.90 对于审核(moderation)功能的改进 (2024.08.29)

1. 贴文的引用(quote)转发次数被独立显示, 总的转发次数仍然计入引用转发次数.
2. 允许贴文发布者将贴文从已经被其他用户引用的贴文中「分离(detach)」出来, 分离之后将无法从对应引用转发贴文中查看被引用到的自己的贴文, 会为后续访客显示 "已被作者删除", 但已被分离的引用转发不会减少转发计数.
3. 允许贴文发布时和发布后关闭引用贴文的转发功能.
4. 允许贴文发布者隐藏贴文线程下的回复, 被隐藏的回复以及该回复之后的子节点会被折叠到线程中的 "被隐藏的回复" 中. 隐藏操作可以对自己或对所有人(仅贴文发布者)生效.
5. 关注时间线只会显示至少两个或以上已经关注的用户之间的对话, 对话将会始终显示的回复者和贴文发布者的对话上下文(中间节点将被折叠). 因此, 对关注时间线的设置中中不再有 "仅已关注用户" 和 "按点赞数" 过滤选项.
6. 可以设置定时失效和仅用于未关注用户的屏蔽关键词.
7. 通知过滤器中可设置仅接收来自已关注用户的通知.
8. 屏蔽用户将会同时屏蔽用户创建的列表(入门包和(用户)列表).

- https://bsky.social/about/blog/08-28-2024-anti-toxicity-features
- https://bsky.app/profile/bsky.app/post/3l2s5luwyg22t
- https://gigazine.net/news/20240829-bluesky-anti-toxicity-features/

#Moderation #Censorship #Bluesky

via Nostr@cxplay_clip

Bluesky