#article #read
「在他们的研究中,研究人员检查了六年间 590 万次 Reddit 互动,并根据用户行为发现了五种不同类型的用户。其中一个有趣的群体脱颖而出——“反对者”。这些用户积极寻找对话只是为了争论。他们不是建设性地讨论话题,而是跳入辩论,发表反对意见,然后不等回复就离开。这类用户在政治相关的子版块如 r/news、r/politics 和 r/worldnews 中最为常见。但令人惊讶的是,他们在现已被禁的 r/The_Donald 这个支持特朗普的子版块中并不常见。在那个论坛中,人们大多互相认同,但对外来者表现出敌意。
[...]
这些发现对社交媒体平台可能非常有用。与传统的审核方法不同,传统方法专注于检测有害内容,而这种行为(检测)方法更难被欺骗或规避。(社交媒体)用户要改变措辞很容易,但改变互动方式则需要更多的努力。版主可以利用这项研究尽早识别有问题的用户,甚至在他们开始发布大量有害内容之前发现他们。
最终,这项研究强调了一个重要的教训:我们在网上说的话很重要,但我们的互动方式对塑造数字世界的影响更大。随着社交平台在处理骚扰、虚假信息和两极分化等问题时遇到困难,将行为分析与传统的内容审核相结合可能是创建更健康、更具建设性的在线社区的关键。」
- https://www.neowin.net/news/science-proves-some-reddit-users-just-love-to-troll-disagree-and-argue/
- https://dl.acm.org/doi/10.1145/3696410.3714618
- https://theconversation.com/some-reddit-users-just-love-to-disagree-new-ai-powered-troll-spotting-algorithm-finds-255879
#Censorship #Moderation
via Nostr@cxplay_clip
「在他们的研究中,研究人员检查了六年间 590 万次 Reddit 互动,并根据用户行为发现了五种不同类型的用户。其中一个有趣的群体脱颖而出——“反对者”。这些用户积极寻找对话只是为了争论。他们不是建设性地讨论话题,而是跳入辩论,发表反对意见,然后不等回复就离开。这类用户在政治相关的子版块如 r/news、r/politics 和 r/worldnews 中最为常见。但令人惊讶的是,他们在现已被禁的 r/The_Donald 这个支持特朗普的子版块中并不常见。在那个论坛中,人们大多互相认同,但对外来者表现出敌意。
[...]
这些发现对社交媒体平台可能非常有用。与传统的审核方法不同,传统方法专注于检测有害内容,而这种行为(检测)方法更难被欺骗或规避。(社交媒体)用户要改变措辞很容易,但改变互动方式则需要更多的努力。版主可以利用这项研究尽早识别有问题的用户,甚至在他们开始发布大量有害内容之前发现他们。
最终,这项研究强调了一个重要的教训:我们在网上说的话很重要,但我们的互动方式对塑造数字世界的影响更大。随着社交平台在处理骚扰、虚假信息和两极分化等问题时遇到困难,将行为分析与传统的内容审核相结合可能是创建更健康、更具建设性的在线社区的关键。」
quoting
nevent1q…rh7z
新研究用逆强化学习识别 Reddit 用户行为:部分网友“就是爱抬杠”
以往的方法多半着眼于用户说了什么或和谁互动,但这些方式本身也有盲点。新研究提出了一个更有效的视角:观察用户的行为模式,而不仅仅是他们说的话。
https://www.ithome.com/0/852/462.htm #强化学习 #行为识别 #社交媒体
- https://www.neowin.net/news/science-proves-some-reddit-users-just-love-to-troll-disagree-and-argue/
- https://dl.acm.org/doi/10.1145/3696410.3714618
- https://theconversation.com/some-reddit-users-just-love-to-disagree-new-ai-powered-troll-spotting-algorithm-finds-255879
#Censorship #Moderation
via Nostr@cxplay_clip
这个区域中作品是所有分级制度中对于情色划分争议最大的地方, 有不少国家和地区的分级制度和观众认识会将它打上 R18 的标签, 况且 Pixiv 这里还仅仅是针对于 "插画" 这一个很小的艺术门类... 很详细, 且这类作品不能用 R18 来形容, 且 Pixiv 也没有单独为这类区分对待, 那种 "三眼色"(?) 的作品也被划进全年龄榜单了...日语用户给 Bluesky 总结的绘画内容分级标准. 很显然, "日本人的标准" 和 "海外标准" 也有一些区别.
~~色情真是个可怕的东西~~
https://bsky.app/profile/shibokuyoshi.bsky.social/post/3korc6ow3sh2s
比如兔女郎和死库水装束的人物也要附加内容警告, 而如果不按 Bluesky 的审核规则主动添加内容警告, 则有可能会被社区规则制裁甚至被封号.
#Censorship #Moderation #Bluesky
via Nostr@cxplay
#article #read
澳大利亚监管机构对 Telegram 审核调查的一些细节 — Teletype
http://archive.today/2025.04.26-073840/https://cn.tginfo.me/esafety-analysis
#Censorship #Moderation #Telegram
via Nostr@cxplay_clip
澳大利亚监管机构对 Telegram 审核调查的一些细节 — Teletype
http://archive.today/2025.04.26-073840/https://cn.tginfo.me/esafety-analysis
#Censorship #Moderation #Telegram
via Nostr@cxplay_clip
#吐槽
#Censorship 是 #Moderation 的超集, 追求后者会直接带动前者增长, 但单独的前者增长并不能表面后者也在增长. #Bluesky 的审查和审核存在于网络中常人能够接受和理解的 PDS 之外, 资源开销在 PDS 之上. 要完整重建 Bluesky 网络的开销并不比 #Fediverse 低, 大多数普通人只能在 bsky.app (联邦)的审查框架之下实行自己(个体)的审核.
via Nostr@cxplay
#Censorship 是 #Moderation 的超集, 追求后者会直接带动前者增长, 但单独的前者增长并不能表面后者也在增长. #Bluesky 的审查和审核存在于网络中常人能够接受和理解的 PDS 之外, 资源开销在 PDS 之上. 要完整重建 Bluesky 网络的开销并不比 #Fediverse 低, 大多数普通人只能在 bsky.app (联邦)的审查框架之下实行自己(个体)的审核.
quoting#信任与安全
nevent1q…346r
After a court order by the Turkish government, Bluesky made accounts unavailable for Bluesky users in Turkey this week.
I take a closer look at geographic-based moderation works on #Bluesky and #atproto, how it can be sidestepped, and much more
https://fediversereport.com/bluesky-censorship-and-country-based-moderation/
via Nostr@cxplay
#article #read
In reply to nevent1q…sfj6
_________________________
## Bluesky 应用的消息审核能力: 对全球性, 区域性和特定消息实施影子禁令
土耳其要求 Bluesky 拿下某些账户和消息, 但实际上 Bluesky 可能是为了满足隐私政策要求只对这些账户和消息进行了隐藏操作:
- https://bsky.app/profile/osma.fishpool.org/post/3lmvwsnotva22
- https://bsky.app/profile/nekorug.moe/post/3lmwgtwfggs2e
只要土耳其用户还在使用 bsky.app 提供的客户端, 那么就会被强制订阅来自 Bluesky 官方的消息审核过滤器: moderation-tr.bsky.app
Bluesky 会将这些目标账户和消息打上标签然后在不同的审核过滤器上发布, 使得做到全球性(moderation.bsky.app)和区域性审核, 实现的手段是限流. 账户和帖子实际上都没有消失, 只是被不同程度隐藏了起来. 对于规避区域审核只需要切换网络或第三方客户端, 而全球审核则只能依靠第三方客户端规避. 由于 bsky.app 目前占据 Bluesky 网络生态头部已经形成中心化导致了事实上的垄断, 导致这种本应该会被去中心化的的网络特性无效化的影子禁令切实地在 Bluesky 有效地实现了.
#Moderation #Censorship #Bluesky
via Nostr@cxplay_clip
In reply to nevent1q…sfj6
_________________________
## Bluesky 应用的消息审核能力: 对全球性, 区域性和特定消息实施影子禁令
土耳其要求 Bluesky 拿下某些账户和消息, 但实际上 Bluesky 可能是为了满足隐私政策要求只对这些账户和消息进行了隐藏操作:
- https://bsky.app/profile/osma.fishpool.org/post/3lmvwsnotva22
- https://bsky.app/profile/nekorug.moe/post/3lmwgtwfggs2e
只要土耳其用户还在使用 bsky.app 提供的客户端, 那么就会被强制订阅来自 Bluesky 官方的消息审核过滤器: moderation-tr.bsky.app
Bluesky 会将这些目标账户和消息打上标签然后在不同的审核过滤器上发布, 使得做到全球性(moderation.bsky.app)和区域性审核, 实现的手段是限流. 账户和帖子实际上都没有消失, 只是被不同程度隐藏了起来. 对于规避区域审核只需要切换网络或第三方客户端, 而全球审核则只能依靠第三方客户端规避. 由于 bsky.app 目前占据 Bluesky 网络生态头部已经形成中心化导致了事实上的垄断, 导致这种本应该会被去中心化的的网络特性无效化的影子禁令切实地在 Bluesky 有效地实现了.
#Moderation #Censorship #Bluesky
via Nostr@cxplay_clip
#article #read
## Bluesky v1.90 对于审核(moderation)功能的改进 (2024.08.29)
1. 贴文的引用(quote)转发次数被独立显示, 总的转发次数仍然计入引用转发次数.
2. 允许贴文发布者将贴文从已经被其他用户引用的贴文中「分离(detach)」出来, 分离之后将无法从对应引用转发贴文中查看被引用到的自己的贴文, 会为后续访客显示 "已被作者删除", 但已被分离的引用转发不会减少转发计数.
3. 允许贴文发布时和发布后关闭引用贴文的转发功能.
4. 允许贴文发布者隐藏贴文线程下的回复, 被隐藏的回复以及该回复之后的子节点会被折叠到线程中的 "被隐藏的回复" 中. 隐藏操作可以对自己或对所有人(仅贴文发布者)生效.
5. 关注时间线只会显示至少两个或以上已经关注的用户之间的对话, 对话将会始终显示的回复者和贴文发布者的对话上下文(中间节点将被折叠). 因此, 对关注时间线的设置中中不再有 "仅已关注用户" 和 "按点赞数" 过滤选项.
6. 可以设置定时失效和仅用于未关注用户的屏蔽关键词.
7. 通知过滤器中可设置仅接收来自已关注用户的通知.
8. 屏蔽用户将会同时屏蔽用户创建的列表(入门包和(用户)列表).
- https://bsky.social/about/blog/08-28-2024-anti-toxicity-features
- https://bsky.app/profile/bsky.app/post/3l2s5luwyg22t
- https://gigazine.net/news/20240829-bluesky-anti-toxicity-features/
#Moderation #Censorship #Bluesky
via Nostr@cxplay_clip
## Bluesky v1.90 对于审核(moderation)功能的改进 (2024.08.29)
1. 贴文的引用(quote)转发次数被独立显示, 总的转发次数仍然计入引用转发次数.
2. 允许贴文发布者将贴文从已经被其他用户引用的贴文中「分离(detach)」出来, 分离之后将无法从对应引用转发贴文中查看被引用到的自己的贴文, 会为后续访客显示 "已被作者删除", 但已被分离的引用转发不会减少转发计数.
3. 允许贴文发布时和发布后关闭引用贴文的转发功能.
4. 允许贴文发布者隐藏贴文线程下的回复, 被隐藏的回复以及该回复之后的子节点会被折叠到线程中的 "被隐藏的回复" 中. 隐藏操作可以对自己或对所有人(仅贴文发布者)生效.
5. 关注时间线只会显示至少两个或以上已经关注的用户之间的对话, 对话将会始终显示的回复者和贴文发布者的对话上下文(中间节点将被折叠). 因此, 对关注时间线的设置中中不再有 "仅已关注用户" 和 "按点赞数" 过滤选项.
6. 可以设置定时失效和仅用于未关注用户的屏蔽关键词.
7. 通知过滤器中可设置仅接收来自已关注用户的通知.
8. 屏蔽用户将会同时屏蔽用户创建的列表(入门包和(用户)列表).
- https://bsky.social/about/blog/08-28-2024-anti-toxicity-features
- https://bsky.app/profile/bsky.app/post/3l2s5luwyg22t
- https://gigazine.net/news/20240829-bluesky-anti-toxicity-features/
#Moderation #Censorship #Bluesky
via Nostr@cxplay_clip
Twitter 中已知的几种账号限制策略
● 用户名.
● 搜索建议限制(Search Suggestion Ban)
● 搜索结果限制(Search Ban)
● 限流(Ghost Ban, Shadowban)
● 回复降权(Reply Deboosting)
#Twitter #censorship
via CXPLAY's Memos
● 用户名.
账号可见性的基础, 用户名与用户 ID 关联但不绑定.
● 搜索建议限制(Search Suggestion Ban)
被限制的账号无法出现在匿名搜索建议中, 但对于已登录账号, 算法建议中认为关系密切的限制账号还是会出现在搜索建议中.
● 搜索结果限制(Search Ban)
被限制账号的推文会在搜索结果中完全隐藏, 无论是否应用了过滤条件.
● 限流(Ghost Ban, Shadowban)
使用包括搜索结果封禁来限制其他账号看到限制账号的推文及回复, 被限制的账号本身难以觉察, 只有其他用户会观测到被限制账号的推文和回复被刻意隐藏, 完整的回复线程会因为限流而突然断开.
● 回复降权(Reply Deboosting)
被限制账号的回复会被折叠在 "查看更多回复" 中, 和 Twitter 社区治理规则有关也和账号本身的算法偏好有关.
#Twitter #censorship
via CXPLAY's Memos