本帖最后由 喝酸奶不舔盖 于 2024-7-2 11:30 编辑
据2021年TIOBE 编程语言社区的排名情况,目前Python以市场占比12.90%排名第一位,市场占比上升0.69%,排名第二位的是C,市场占比11.80%,市场占比下降-4.69%,排名第三位的是Java,市场占比10.12%,市场占比下降-2.41%。
从Python市场占比的历史趋势来看,从2014年开始,Python市场占比逐年升高,至2022年,Python市场占比达到历史历史最高峰,由此来看,Python的应用之广泛,现如今Python 的流行与人工智能和大数据等领域的热度紧密不分。
Python的特点
对于一个成熟的数据分析师来说,Python成为数据分析的标配,Python作为一种解释型的高级程序设计语言,其特点毋庸置疑,简单来说,Python简单易学、开源免费、功能强大、代码简洁。
一、简单易学 Python语言中的关键字较少,其语法结构简单,相较C语言,Python定义变量简单明确,在书写代码的时候也更加清晰。 二、开源免费 Python开源免费,在社区中不仅提供Python软件免费下载,还有众多开源的代码可以共享,增加了代码交流的机会。 三、功能强大 Python的功能不仅体现在数据分析上,可以提高计算能力,优化计算结果,还可以做软件开发、技术应用等。
在数据分析中的作用 Python有什么用?如果你是一名财务分析人员,每天都要用Excel做报表,计算财务状况;如果你是一名物流分析师,每天都要跟踪和统计单量和收入情况;如果你是一名HR招聘人员,工资计算、考勤报表、绩效考核都离不开大量的数据统计;如果你是XXX。 我们每天都要与数据打交道,无论你是不是从事数据分析行业,都多多少少从事一些与数据相关的事情,数据统计占据我们日常工作的大部分时间,反复、枯燥、耗时成为当下工作日常的痛点,而Python的出现,是解决这些问题的良药。
一、网络爬虫 我们日常做数据统计,一部分数据是来源于公司内部业务系统产生的数据,这部分数据属于内部分析数据,另外一部分数据是公开的数据,来源于网络,爬虫的出现使得获取网络数据成为可能,Python拥有与网络爬虫相关的库,比如请求库:requests、解析库:beautifulsoup、存储库:pymysql等,非常便捷的爬取网络数据,比如电影评论数据、商品价格、图书排行榜、网页图片等。
二、数据清洗与统计运算 Excel目前仍然是办公使用最多的数据处理软件,但是Excel是百万数量级,超过百万数量级就无法使用,且在处理大数据时,数据线程较多,运行速度很慢,这个时候Python就显示其特点了,Python内置的有很多数据处理的库,比如pandas、numpy等,可以处理复杂的数据导入、数据清洗、数据统计运算、数据导出等功能,处理速度快、导入功能简单,一行代码就可以处理复杂的数据任务。
三、机器学习 对数据分析师来说,日常也引入一些机器学习内容,比如回归、聚类、分类、因子分析等,对数据建模一般会使用SPSS、Stata、SAS等专业的数据挖掘软件,这些数据挖掘软件学习成本较高,需付费使用,功能相对单一,而Python有专门可以用来做机器学习的库,比如Scikit-learn是Python一个专门用于机器学习的库,拥有着完善的文档,内部封装了大量的机器学习算法可以调用。
四、数据可视化 数据分析离不开数据可视化,图表是展现数据最好的方式,能简单高效地沟通信息,表达数据内容,Python中内置有很多库可以画一些极具美观的分析图表,比如matplotlib库上手容易,seaborn库是改良matplotlib库的图表画法,pyecharts和plotly库则用于创建有交互性的图表。
五、外部数据库对接 数据分析后,还需要将数据进行存储,相较于存储本地文件夹,更建议将数据连接数据库进行存储,方便数据引用时及时调用,Python中PyMySQL库可以用于Python与MySQL进行连接,并且支持SQL语句,使用PyMySQL库要求我们掌握常用的SQL语句的用法,对于数据存储和管理。
六、办公自动化 如果你每天的任务是重复性的复制粘贴表格数据、修改数据格式和单元格格式、重复拆解Excel文件、手动发送Email邮件等,那你更应该学习使用Python,Python有很多与办公自动化相关的库,比如openpyxl用于处理简单的表格,包括数据批量合并和自定义单元格格式等,Python自动发邮件的库比如smtplib库和yagmail库,可以简单高效地批量发送Email邮件。
文章源自:大话数据分析
|