为了写好一篇文章,了解现在大家都在写什么,读者们都喜欢什么,我分析了2.5万篇后端开发类型的文章,得出了一些小结论。
首先,我们来看看大家都喜欢什么时候发表文章:
从时段上来看,10点是个一枝独秀的时段,主要的发布时间也落在中下午。
从每周来看,周一到周六呈递减状态,可能随着工作时间增多,由于疲惫没有时间写文章?
从月份上来看,4、5、6月是高峰时期,其他月份相对平均,这个时间段比较多是因为“金三银四”跳槽后刚进新公司在学习总结?
分析了文章标题后,我们得到一些高频提到的关键词,大致看去JAVA真的是独领风骚,Go的表现也令人惊喜,其中“坑”字被206篇文章提到,为背后的作者默默捏了一把汗,感谢他们为我们踩坑。作者们也比较喜欢分析源码,仅是源码的文章就有1752篇。而“使用”这个关键词竟然也有1666篇,说明有些把一些使用笔记也当做文章发布了出来。
下图是文章标题关键词的频率统计前150:
下图是文章关键词的图云:
从分类标签上来看,Java还是独领风骚最强的,Python与Go表现也不俗,但是与Java差距巨大,作者们也比较喜欢发布数据库、架构方面的文章,有点没想到的是正则表达式也有比较多的作者关心。
下图是分类标签的文章发布数据:
下图是分类标签的发布数据词云:
从作者数据来看,4526名作者贡献了24757篇文章,人均5.47篇,众数1篇,中位数2篇,最高502篇,发表数量前20%(905名)的作者发表了72.74%(18009篇)的文章,二八定律诚不欺我。
下图是发布数量与人数折线图:
换个角度,我们从读者这面来看,以文章对应的分类标签的点赞数据为分析,可以看到读者们也是非常关心Java相关的,面试和算法非常靠前,说明大家也重在平时积累,一些具体的技术也有自己的一席之地。
下图是文章分类对应的点赞量:
下图是文章分类对应点赞量的图云: