中文独立博客 – 当下与过往

当下

今年重拾博客,看到一些中文独立博客的列表/名录,收录量大概在1200~4100之间:

根据联合国教科文组织的数据,全球会说中文的人口总量约为16亿,按4000个博客换算,大概40万人中有一个在写独立博客,实在有些少得可怜。

Github那个列表中,每个博客都有标签,对这些标签做了点儿数据分析,看看列表中博客的主要内容是关于什么的。

图1:中文独立博客标签使用频次柱状图(全部766个标签)
图2:标签使用频次柱状图(频次最高的60项)

图1、2是反映标签短语使用频次的柱状图。图1 列出了1365个博客用到的全部766个不重复的标签短语的情况,图2 仅列出了前60项的情况。

“编程”是使用频次最高的标签,共有768个博客使用了这个标签,占列表中所有博客的56.3%。

标签使用频次是典型的长尾分布,前9项使用频次超过100次,第10至76项使用频次超过10次,而仅出现过一次的标签有452项之多,占到所有标签短语数量的59.0%。

图3、4是反映标签短语共现关系的弦图。图3 反映了全部766个标签短语的共现关系,图4 按共现次数超过30次进行了筛选,只有12个标签短语。

共现频次最高的四大标签短语分别是:编程、生活、随笔、技术,其他的标签和这四项比起来有数量级上的差别。“编程”同样是和其他标签共现次数最多的,总共现次数达到了2400次以上,仅仅和筛选出来的高共现Top12标签之间就有970次。

数据反映出一个很明显的特征:这个圈子主要是程序员、IT人,内容以编程、技术以及他们的生活、兴趣爱好为主。

当然,这个博客列表的数据有采样上的偏差,毕竟是 github 上进行申请和发布。但去看看其他的列表或索引,比如 博客之家,左侧的分类导航目录只有”程序员“有二级目录,且前六项一级目录都和IT相关。

过往

印象里当年Blog刚兴起的阶段,并不是这样。既有很多非IT类网红博主,比如东东枪的枪、不许联想,也有当时还不是很出名的 画画的扫把,同行的 城市笔记本。此外还有 MSN Space、搜狐博客、Blogbus 上众多普通人的琐碎日常,虽然严格来说这些大概算不上独立博客。

曾经喧嚣热闹、五花八门的博客圈,最终沦落成了技术人的小圈子。

时代变迁大概是主因,移动互联网兴起以后,全球的 Blog 圈子都在萎缩,曾经大红大紫的 Blogger.com 也早已光环不在。但感觉国外的 Blog 似乎并没有萎缩得这么严重,内容领域仍然涉及广泛,Blogger既没有数据遗失也没有关停,整体来说并非技术人的小圈子。

有点怀念那个时代,好在互联网是有记忆的,有些遗迹现在还能找到,比如自2010年后就再也没有更新过的 城市笔记本,也许回头可以做些考古来聊聊。

发布日期

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注