常识社

当前位置:主页 > 职场工作 >

常见的数据处理方法有哪些

常见的数据处理方法有哪些 实验数据分析中需掌握的策略(2)

发布时间:2022-12-11 14:46:22 来源:常识社 作者:李悦

常见的数据处理方法有哪些

三,表格的合并

表格的合并指的是在数据处理中,两个表格需要合并成同一个表格。

当然在合并的过程中不必把所有的列都合并到一起,可以把只需要的表格合并到一起。

这个过程在数据处理中也是十分常见的,因为在有一定规模的公司的数据库中,不可能所有的信息都存在一个表格中。

比如在超市中,会员的信息可能在一个表格中(可能有姓名,年龄,会员时长等信息),而会用的消费信息会在另一个表格中。

如果一个课题是想要分析不同年龄段的消费信息的话,那就需要把两个表格合并到一起。

这首先需要两个表格有一个共同列,这是两个表格合并的基础和先决条件。

合并表格在SQL中用的是join,join也包括left join,right join,inner join和outer join。

最常用的就是left join (其实right join和left join在逻辑上是一样的)。

当然在其他的软件中也有不同的方法进行合并,比如在SAS中的Date Step用的就是merge。

常见的数据处理方法有哪些

四,数据的提取和运算

这个在理解上很简单,说得直白点就是把对应的数据提取出来做加减乘除,应用其实大家也很好理解。

比如还是在超市中,超市内部的系统记录的肯定是每次购买的记录,可能每一项就在数据库中记录一行。

举个例子,比如你去超市买了一个苹果,一盒鸡蛋和一个面包,当在付款的时候收银员会扫描你所购买的东西,在数据库中的记录是三行,苹果一行,鸡蛋一行,面包一行。

每一行中记录的可能有时间,地点,价格,以及各分类的具体信息,比如面包是什么牌子的,产地哪里,保质期多长等等十分详细的信息。

当分析人员想要知道上个星期面包的销售额的时候,那就需要在提取数据的时候加上两个条件,一个是时间条件“上个星期”,一个是商品条件“面包”,然后做加法。

常见的数据处理方法有哪些

在提取上,一般语句用到的都是where语句,当然,有的软件或语言也有if then语句。

在做运算的时候就需要把各分类做一个分类合计了,在SQL中的分类合计最基本的就是在select模块中用sum方程,这个很好理解,就是合计,之后在运用group by,这个就是分类。

除了上面介绍的四个方法外,其实在数据处理中根据不同的商业逻辑经常用到的方法还有很多,比如删掉不想要的列或行,这个就比较简单了。

比较复杂的还有数据的排序,最复杂的是方程或公式(function)的运用,这个在数据分析中是非常大的一部分,有对处理数字型数值运算的方程,比如sum,average,rank等。

也有对处理字符型数值运用的公式,比如从一串字符中提取想要的信息,合并两个数值等。

本文分享的实验数据分析中需掌握的策略及其常见的数据处理方法有哪些的方法介绍,大家作为一个参考建议。

相关阅读