长毛象的中心化趋势 

#论文导读 #老奶奶都能懂的论文导读 @mature

研究人员爬取了在2017年4月到2018年7月期间的1750个实例,涵盖了23.9万用户和六千七百万条嘟嘟。基于这些数据,构建了用户相互关注的网络,以及实例之间的连接网络。

通过分析这些网络,论文发现了长毛象的中心化趋势。以下结果是基于搜集到的样本,不是全长毛象数据。

1. 用户方面,大约50%的用户都集中在10%的实例里面,因此少数的管理员在长毛象联邦中拥有过量的影响力。开放注册的实例拥有的用户比邀请注册实例里的更多,但是,邀请注册实例的用户平均嘟嘟数量差不多是开放实例用户嘟嘟数量的两倍(187嘟/人 vs. 95嘟/人)。不管哪种实例,都有中心化趋势,服从幂律(power law),前5%的实例容纳了约95%的嘟嘟;

2. 内容方面,只要关掉最大的10个实例,跨站时间轴上62.69%的嘟嘟都会消失。有些实例带有话题标签,研究发现,科技相关实例占据了55.2%的实例,却只容纳20.8%的用户和24.5%的嘟嘟。相比之下,虽然只有12.3%的实例是跟色情相关,但是却吸引了61%的全网用户;

3. 服务器方面,大部分实例都集中在少数的自治系统(Autonomous System, AS)上,主要在日美法德四国。最大的三个AS就有62%的实例。比如亚马逊AS上集中了62%的用户,尽管上面只有6%的实例。关注网络上,92%的用户是连接在一起的,但在极端情况下,只要五个AS崩坏,就会把相互连接的用户数量减到46%。

作者还分析了网络结构的强度。虽然长毛象分成了很多独立的实例,但是用户之间是高度连接的,跟推特相比,长毛象的连接更加脆弱,只要破坏少量的重要节点(高关注用户)就能够极大破坏原本的连接,相比之下,推特的关注网络就比较稳健。

伦理声明:
研究通过了大学伦理审查,只收集了公共嘟嘟,并进行了匿名处理,论文结果不包括任何的嘟文内容分析。

更多的结果,可以参考原文。
传送门:dl.acm.org/doi/10.1145/3355369

@durian 中心化程度有没有和推特对比?相比之下有不那么中心化吗

@konatasick 有对比。中心化程度是个很模糊的描述,假如是说power law的话,只有量的区别,没有质的区别。不过要说集中程度,长毛象用户之间的平均连接更少,高度连接的用户节点反而更少,被实例阻隔了,在长尾分布显得更集中。但是集中程度指连接程度的话,还是推特集中。这个结果在Fig.11,我没放。

Follow

@durian @konatasick 我觉得和 mastodon 的设计机制有关,一切外来实例的嘟文,都要先莫名其妙地 cache 到本实例服务器,才能被阅读,由此导致的就是在 surf 陌生人的历史嘟文时,界面实在是太不友好了,从而导致横向互相关注度急剧下降……

另外伦理审查不做内容分析,又是怎么识别出 spam adult advertising 的……

· · Web · 0 · 0 · 2
Sign in to participate in the conversation
Fivediverse

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!