#校园V# 今天这篇文章主要分为两部分,第一部分先介绍如何对数据进行描述性统计,第二部分将介绍R语言的常用语法。在进行数据分析时,我们会先进行描述性统计,像盲人摸象一样,从整体认识需要分析的数据。那么具体应该怎么做呢?下面进行详细介绍。
描述性统计R里最常用summary命令,可以对需要分析的数值型数据进行最大值、最小值、1/4分位数、3/4分位数、中位数及平均数的统计,如果是分类变量,可以进行频数统计。
summary示例
除了使用summary命令,我们也可以用函数计算统计量,常用的统计量包括了均值、众数、中位数、百分位数等等。接下来讲讲这些常用的函数。首先是mean()可以用来求平均值;median()用来计算中位数;sd()可以用来求标准差;var()函数可以求方差;mad()可以求绝对中位差;quantile(x,probs)可以用来求分位数,其中x是需要分析的数值型变量,probs为0到1之间的概率值组成的数值向量;range可以求值域;sum函数可以用来求和;min函数可以求最小值;max函数可以求最大值;table()函数可以求出现的频数。
常用语法首先介绍的是R语言常用的分支结构,该结构通常使用if、else、if...else、switch等语句。
if语句通常是包含一个布尔表达式后加一个或多个语句,基本语法是if (boolean_expression){ //statement(s) will execute if the boolean expression is true}。如果是if...else...语句,当If语句布尔表达式是false时,else部分的语句将被执行。switch语句基本语法为switch(expression, case1, case2, case3,...),如果expression等于n时,执行第n条分支的case语句,如果取值大于list对象长度,返回值为NULL。
其次介绍R语言的循环结构。repeat语句是重复循环一次又一次的相同代码,直到满足停止条件,repeat{commands if(condition){ break}}。while循环主要是一次又一次执行相同代码,直到条件满足,基本语法是while(test_expression){statement}。for循环主要用于执行特定次数的循环,基本语法是for(value in vector){ statements }。
以上就是今天的分享,欢迎讨论~
,