天津乐搏教育

创办教学质量过硬的软件测试培训学校

学校课程咨询服务:
400-666-4820
培训世界 >天津乐搏教育 >新闻中心 >为什么Python发展得如此之快?

为什么Python发展得如此之快?

2022-06-24 11:31:23来源: 天津乐搏教育
为什么Python发展得如此之快?
导读:

Stack Overflow 最近的调查显示,Python 已经成了发展最快的主流编程语言,也是 Stack Overflow 上来自高收入国家的访问中,点击量最高的标签。为什么突然间 Python 就发展如此快了? 随小编看下去!

文章详情
1
写在前面

  Stack Overflow最近的调查显示,Python已经成了发展最快的主流编程语言,也是Stack Overflow上来自高收入国家的访问中,点击量最高的标签。
  为什么Python发展得这么快?Python的应用范围非常广,从网站开发到数据科学,再到DevOps,到处都可以看到它的身影。所以值得认真研究一下Python最近到底是在哪些具体的方面应用得更广了。我是一个使用R语言的数据科学家,我对Python在我从事的领域内的发展很感兴趣。在本文中,我会从另一个角度解读Stack Overflow的数据,理解具体是哪些方面的Python应用在增长,以及在什么样的公司和组织中Python用得最多。
  分析得出了两个结论。首先,对Python的使用发展得最快的主要有以下几个领域:数据科学、机器学习和学术研究。这一点从Pandas包的使用增长率就可以很容易看出,这也是网站上和Python相关的标签中访问量增长最快的。至于是哪些行业在使用Python,我们发现在下面几个行业使用得更多些:电子、制造、软件、政府,尤其是大学。不过,总体来看Python的增长在各个行业之间的分布还是比较均衡的。总之,我们可以从结论中看出数据科学和机器学习已经在许多不同类型的公司中普及开了,而Python则是在这个过程中为大家所普遍接受的选择。
  我们的分析数据都来自于世界银行组织认可的高收入国家。

2
Python 发展的类型

  Python是可以适用于多种用途的编程语言,可以用于网站开发、数据科学等各种不同类型的任务。那我们该怎样整理出Python最近在这些领域之间的发展情况呢?
  作为新手,我们可以查看每个领域内最有名的Python包,看看代表它们的标签的访问量的增长情况。可以把网站开发框架Django和Flask与数据科学的包NumPy、Matplotlib和Pandas等进行对比。(你也可以用Stack Overflow Trends来比较问题的提问率,而不仅仅是访问量)
  从来自于高收入国家的Stack Overflow访问量来看,很明显Pandas是增长最快的Python包:它在2011年才刚刚出现,现在Stack Overflow上却有约1%的问题是关于它的。随着时间的增长,关于NumPy和Matplotlib的问题量也有了很大增长。与之形成对比的是,与Django相关的问题量在这段时间内保持得很平稳,Flask虽然有所增长,但占比还比较小。这表明Python的增长应该主要归功于数据科学,而不是网站开发。
  但这么看还不全面,因为这里只显示出了那些应用很广的Python特有的包。系统管理员和DevOps工程师们也在很多地方用到了Python,他们提的Python问题也会涉及Linux、Bash和Docker等。同样,很多与Python有关的网站开发问题没有提到Django或Flask,那些开发者提的问题关联的是JavaScript、HTML和CSS之类的“技术支持”标签。但我们不能把Linux、Bash、JavaScript等标签也直接考虑进来,武断地假设它们就是与Python相关的。因此,我们只探讨那些与Python被一起提到的标签。
  我们只考虑2017年夏天(七月和八月)的访问量,这样就排除了学生的影响,而且还排除了跨越很长统计周期带来的巨大计算量问题。我们只考虑已注册的用户,而且要在这个时间段内起码浏览过50个Stack Overflow上的问题。我们认为要把一个人称为Python用户至少要满足两个条件:1、他浏览的标签主要是Python;2、他访问的页面至少有20%是与Python相关的。

3
按主题的增长

  现在我们已经看到与Python有关的Stack Overflow访问可以被大致分成几个主题。接下来我们就可以分析到底是哪些主题带来了Stack Overflow上Python访问量的巨大增长了。
  想像一下,假设当我们查看一个用户的浏览历史时,我们发现Python是他访问得最多的标签。那我们怎么可以判断出他是一个网站开发者、数据科学家、系统管理员,或者别的什么呢?我们应该看看他访问得第二多的标签,然后是第三个,等等,顺着他的访问量列表一直看下去,直到发现了某些与上图中某个簇相关的东西。
  我们总结出了下面的简单方法,可以将一个用户归类入某个主题。以下是用户最常访问的九个标签,根据这些就可以把他们分类了。
  数据科学家:Pandas、NumPy或Matplotlib;
  网站开发者:JavaScript、Django、HTML;
  系统管理员或DevOps:Linux、Bash或Windows;
  其它:除上面的九个标签之外,其它标签所占的流量都不超过5%。
  这样做虽然不够严密,但已经足以让我们快速地评估每一类Python增长带来的影响了。我们也试过像潜在狄利克雷分布这样更严格的算法,但得到的结果都差不多。


 如果还有什么疑问,可以点击进入【天津乐搏学院】网站咨询我们的老师。预约试听后可免费领取学习资料资料。

天津乐搏教育

  天津乐搏教育信息技术有限公司——致力于培养专业软件测试的人才。   从全栈软件测试领域到自动化测试领域再到安全测试领域,最后到leader管理提供1站式服务

展开更多

咨询热线:400-666-4820

课程导航

1