100万访问量 服务器配置(访问量最高超7百万的Stack)(1)

整理 | Jane

出品 | AI科技大本营(公众号id:rgznai100)

Stack Overflow,一个面向开发者的 IT 技术问答网站,很多程序员都会在上面提问,浏览问题,查找技术知识。在 Top Question 页面,我们可以根据 Hot、Week、Month,亦或是标签对问题进行筛选过滤。当我们想对上面的问题进行数据统计与分析时,这些功能显然不够直观与聚合。

100万访问量 服务器配置(访问量最高超7百万的Stack)(2)

近日,一位来自 Google 的开发者 Felipe Hoffa 发表了一篇文章,分析 Stack Overflow 上不同时间、不同语言的热门问题,他用了一个交互式的数据展示界面,无论是让概览问题还是分析数据都变得非常简单。

首先,你可以在左上方的折线图中看到不同时间的热门问题 Top10(时间统计单位为季度)

100万访问量 服务器配置(访问量最高超7百万的Stack)(3)

其次,你可以在右侧的选项栏中根据 tag、 top for quarter、section 和 subtag 四个选项进行数据筛选。

技术类别根据此类问题浏览总量由低到高排列。

100万访问量 服务器配置(访问量最高超7百万的Stack)(4)

选择 tag 后,还可以选择此技术类别下的 sub tag。

100万访问量 服务器配置(访问量最高超7百万的Stack)(5)

问题不仅可以看 Top10,还可以看 Top30 前的三个区间。

而在问题罗列区,我们可以看到除问题本身外,还有问题发起时间、回答数量及排名等信息。

100万访问量 服务器配置(访问量最高超7百万的Stack)(6)

有了上面这些内容与数据的直观展示,作者对一些数据进行了统计与分析,下面我们就一起来看看 Stack Overflow 上的用户在过去和现在都在关注哪些问题。

1.最热门的问题:所有时间 VS 2018 Q4

下面的数据显示的是在 Stack Overflow 上,迄今为止关注度最高的十个问题:

100万访问量 服务器配置(访问量最高超7百万的Stack)(7)

最火的十个问题涉及了五个话题,4 个与 Git 相关,3 个与 JavaScript 有关,Java、Linux 和 html 的问题各有一个,没有任何一个问题涉及目前很火热的 AI、大数据乃至 Python 等技术领域。

也许受时间积累的影响?那我们回到最近一个季度(2018 Q4)的数据中,看看哪些是近几个月有哪些热门问题?

100万访问量 服务器配置(访问量最高超7百万的Stack)(8)

两个图表的数据对比发现,近期的十个热门问题中,新增了 4 个 Python 问题,其他 6 个并没有发生变化。问题“如何撤销 Git 中最新的 commits?”一直位居 Top1 的位置,浏览量直逼 8 百万,仅上个季度的浏览量就达到了 40 万 ,但是都没有 Java 的问题上榜。

2.问题领域发生了哪些变化?

100万访问量 服务器配置(访问量最高超7百万的Stack)(9)

100万访问量 服务器配置(访问量最高超7百万的Stack)(10)

看过 Top 10 的数据后,我们把数据范围拓展到热门问题 Top30。Python 相关的问题成为最近最受关注的领域,相比全部时间里的问题 Top 30,最近的一个季度里,已经没有 Java 和 SQL 相关的问题了。

3.JavaScript、Python 和 Go 三类语言中,最受关注的十个问题(时间截止到 2018 Q4)

下面的三幅图分别展示了截止到 2018 年的 Q4,JavaScript、Python 和 Go 语言的问题 Top 10,以及这十个问题在过去两年的时间里的变化趋势:

我们还能从图中看到,随时间的推移,大部分问题的关注度并没有很大的波动,然而却也有一两个问题,上升趋势变化非常明显、突出。比如:

100万访问量 服务器配置(访问量最高超7百万的Stack)(11)

JavaScript 问题中“如何获取当前数据”与”如何四舍五入时,保留小数后面两位“,这两个问题(蓝色与紫色)在 2017 年的 Q3 和 Q4 期间分别有关注度下降的趋势,但随后关注度反升,并且以很快的速度缩短了与其他问题访问量的差别,截止到 2018 年 Q4,差距已经远没有一开始时悬殊了。

100万访问量 服务器配置(访问量最高超7百万的Stack)(12)

Python 问题也有此类现象,”如何将字符串解析为浮点数或整数“,这个问题从 2017 年的 Q4 季度到 2018 年的 Q3 季度,近一年的时间都是下降趋势,然而就从 2018 年 Q3 季度开始却突然反温,一下减少了与上一名问题之间的差距。

更有甚者,问题”如何利用 Pandas 在数据结构中根据列选择行“,在一开始并没有太多人问,却从 2017 年 Q4 季度开始上升势头迅猛,不断超过其他问题,跃居 Top5。这一年中学习使用 Pandas 的开发者们看来增多了不少啊!

100万访问量 服务器配置(访问量最高超7百万的Stack)(13)

Go 语言的问题中,”如何列出目录中所有文件“这个问题的关注度一直在增加,到最后还反超了两个问题的浏览量。

这些问题是否也曾让你纠结烦恼呢?

猫眼电影演出

4.TensorFlow 的挣扎

怎么能少了近几年发展最快的人工智能领域。开发者们在 AI 技术领域中又在频频问哪些问题呢?

100万访问量 服务器配置(访问量最高超7百万的Stack)(14)

TensorFlow 可以说是使用人数最多的深度学习框架了,问的最多的问题是”不能用 pip 方法找到 TF“、”怎么查询我系统中安装 TF 的版本信息“或是当前 CPU/GPU 组合能力等问题。看来大家在入门时遇到了很多共同问题,相信这些问题随着时间的推移,也仍然是最常被问的问题。

5.其他类别的热门问题 Top10

1.Redis 及子类与 Java 和 C# 相关的问题

开发者们问的最多的是”如何在 Windows 上安装“。Redis Java 中的问题大多与 Spring 相关,和 C# 中问的最多的是想要简单实例。

100万访问量 服务器配置(访问量最高超7百万的Stack)(15)

100万访问量 服务器配置(访问量最高超7百万的Stack)(16)

100万访问量 服务器配置(访问量最高超7百万的Stack)(17)

大家如果想看更多分析与查询语句,可访问

towardsdatascience/finding-the-real-top-stack-overflow-questions-aebf35b095f1

最后,给大家分享这个数据交互界面的地址,看看 Stack Overflow 上的小伙伴们都在问些什么?

数据交互界面:datastudio.google/reporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg

(本文为AI科技大本营原创文章,转载请微信联系 1092722531,添加微信csdnai2,备注公司 研究方向,和志同道合的小伙伴一起探讨AI技术)

,