运用Excel进行数据分析

    技术2025-01-10  16

    (1) 有些时候,可以利用Excel进行简单的数据分析,写数据报表时也会运用到,针对案例,使用Excel的部分功能来实现以下目标。

    (2) 现在你有一份的餐食数据,我想通过excel知道以下问题:   1. 全国点评数最高的饭店是哪家?   2. 哪个城市的饭店人均口味最好?   3. 哪个类型的餐饮评价最好?   4. 类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?   5. 口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最 多?   6. 上海地区中,各个类型饭店服务前五名?   7. 没有评价的饭店有几家?   8. 将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少?   9. 将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。   10. 对上海地区的日本料理,做一次描述性分析(开放题)

    (3) 数据:            

    链接: 数据下载 提取码:2ns3

    目录

    (1)问题一(2)问题二(3)问题三(4)问题四(5)问题五(6)问题六(7)问题七(8)问题八(9)问题九(10)问题十


    (1)问题一

    问题:全国点评数最高的饭店是哪家? 解答:运用 INDEX() 和 MATCH() 进行数据分析

    步骤: (1) 找出点评数最高的值var (2) 通过 INDEX() 函数来进行var在“点评”列中的坐标定位,再通过 MATCH() 进行店名中的坐标查找

    实现过程

    (1) 找出点评数最高的值var

    =MAX(D:D)

    (2) 找出点评数最高的饭店是哪家?

    =INDEX(C:D,MATCH(21180,D:D,0),1)

    最后,得到的结果是:

    (2)问题二

    问题:哪个城市的饭店人均口味最好? 解答:运用 数据透视表 进行数据分析

    步骤 和 实现过程: (1)全选表格,点击“插入”,点击“数据透视表”。             (2)创建数据透视表             (3)选择行:城市;选择列:口味;选择 “值字段设置” :平均值            

    最后,进行数据排序,人均口味最好的城市是上海, 最高约为:7.95

    (3)问题三

    问题:哪个类型的餐饮评价最好? 解答:运用 数据透视表 进行数据分析

    针对问题三,同样按照问题二的步骤。 最后,对数据进行排序,餐饮评价最好的类型是火锅, 最高约为:80589                  

    (4)问题四

    问题:类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字? 解答:运用 COUNTIF() 进行数据分析

    步骤: (1) 运用 COUNTIF()统计每个店名中出现「麻」的字数 (2) 运用 COUNTIF()统计每个店名中出现「辣」的字数 (3) 控制第一行,点击“数据”,点击“筛选”;将“类别”选成“川菜”;最后,统计「麻」,「辣」列中有多少个带「辣」字,又有多少个带「麻」字

    实现过程

    (1) 新增一列,运用 COUNTIF()统计

    =COUNTIF(C2,"*麻*") =COUNTIF(C2,"*辣*")

    (3) 统计个数             结果:   统计「麻」个数:28   统计「辣」个数:44   可以大致了解到类型为川菜的店名,同时在「麻」和「辣」两个字做选择,普遍爱好「辣」字。

    (5)问题五

    问题:口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最 多? 解答:运用 “筛选” 进行数据分析

    步骤 和 实现过程: (1)控制第一行,点击“数据”,点击“筛选”;将“口味”,“环境”,“服务”选成8.0以上;             (2)统计饭店的数量,重新复制“城市”,运用数据透视表 统计并描述“城市”的信息。                  

    结果:   统计饭店的数量:457   北京占比最多。

    (6)问题六

    问题:上海地区中,各个类型饭店服务前五名? 解答:运用 IF()和 “筛选” 进行数据分析

    步骤 和 实现过程: (1) 控制第一行,点击“数据”,点击“筛选”;将“城市”选成“上海”;选择“城市”、“类型”、“店名”、“服务”指标后,赋值到新的Sheet中。            

    (2) 首先对“服务”降序;再对“类型”进行降序(都是扩展到整个区域)。             会发现类型相同的店,它们的服务是降序排列。

    (3) 按数字递增来描述“类型”,用到:IF()函数。            

    (4) 接下来,筛选第“E”列前五名"<=5"。                         最后得到了,各个类型饭店服务前五名。

    (7)问题七

    问题:没有评价的饭店有几家? 解答:直接对数据进行操作

    步骤 和 实现过程: 直接筛选“点评”为空格,再统计类型的总数就是空格的总数,得到没有评价的饭店有1355家。

    (8)问题八

    问题:将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少? 解答:运用 “除”和 “取整” 和"数据透视表" 进行数据分析

    步骤 和 实现过程: (1)运用“除”和 “取整” 将人均价格分段。            

    =E2/50 =INT(I2)+1

    (2)将“>=5”的price_level全都统一成5,运用“数据透视表”统计城市与价格之间的关系             替换                              (3)将数据赋值到新的Sheet中,然后计算占比。            

    (9)问题九

    问题:将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。 解答:运用 log() 和 “线性加权” 进行分析

    步骤: (1)剔除空值和异常值 (2)将“口味” 、“环境” 、“服务” 按不同权重线性加权后,形成新的一个指标。 (3)运用 log()函数,将“点评” 缩小到1~5范围内(可以选任意底数)。 (4)运用 log()函数,将“人均” 缩小到1~5范围内(可以选任意底数),人均取负值。因为价格越低,消费者会越喜欢。 (5)最后,将所有指标线性加权,形成综合评价系数 。

    实现过程: (1)控制第一行,点击“数据”,点击“筛选”;剔除空值和异常值;重新赋值到新的Sheet中。 (2)线性加权             (3)(4)运用 log()函数            

    =LOG(D2,10) =LOG(E2,5)

    (5)线性加权,并按综合评价系数 排名。            

    注意: 各指标的权重,按需求而定。

    (10)问题十

    问题:对全国的日本料理,做一次描述性分析(开放题) 解答:运用 “数据分析” 进行处理

    步骤 和 实现过程: (1)控制第一行,点击“数据”,点击“筛选”;将“类型”选成日本料理;重新赋值到新的Sheet中。            

    (2)点击“数据”,点击“分析”,点击 “数据分析”。                                   以上就是对全国的日本料理,做的一次描述性分析。

    Processed: 0.010, SQL: 9