分析案例丨朝阳医院在2018年里的销售情况
2020-12-28 11:18:47 阅读(188) 评论(0)
1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]: 购药时间 社保卡号 商品编码 销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五 001616528 236701 强VC银翘片 6 82.8 691 2018-01-02星期六 001616528 236701 清热解毒口服液 1 28 24.642 2018-01-06星期三 0012602828 236701 感康 2 16.8 153 2018-01-11星期一 0010070343428 236701 三九感冒灵 1 28 284 2018-01-15星期五 00101554328 236701 三九感冒灵 8 224 208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间 6576社保卡号 6576商品编码 6577商品名称 6577销售数量 6577应收金额 6577实收金额 6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前 ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值 ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后 ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据 ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8") ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8") ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8") ...:dataDF.dtypesOut[13]:销售时间 object社保卡号码 object商品编码 object商品名称 object销售数量 float64应收金额 float64实收金额 64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数 ...:defsplitsaletime(timeColser): ...: timelist=[] ...: fortintimeColser: ...: timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片 ...: timeser=pd.Series(timelist) #将列表转换为一维数据Series类型 ...: returntimeser ...:In[16]:#获取"销售时间"这一列数据 ...:t=dataDF.loc[:,"销售时间"] ...:#调用函数去除周,获取日期 ...:timeser=splitsaletime(t) ...:#修改"销售时间"这一列日期 ...:dataDF.loc[:,"销售时间"]=timeser ...:dataDF.head()Out[16]: 销售时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额0 2018-01-01 001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02 001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06 0012602828 236701 感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701 三九感冒灵 1.0 28.0 28.004 2018-01-15 00101554328 236701 三九感冒灵 8.0 224.0 然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期 ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat ...:dataDF.loc[:,"销售时间"]=
推荐阅读
- 2022年制作app用什么软件比较好
已经2022年了,肯定有许多人想知道该怎么自己制作一款软件吧?今天我就给大家盘点盘点2022年制作app用什么软件比较好,保证帮助新手小白们跳过雷点,选择到适合自己上手的制作app软件。 1.AppMobi AppMobi…查看详情
- windows10怎么调节屏幕亮度
Windows10专业版是微软公司为企业和专业人士打造的一款优秀的操作系统。在使用Windows 10专业版时,我们有时需要根据实际需要调节屏幕亮度或恢复出厂设置来解决问题,下面将为大家详细介绍Windows 10专业版如何调节屏幕…查看详情
- 个人网站设计容易吗?个人网站设计怎么做
现在的网络技术其实是比较受欢迎的,也是一个发展的趋势正,是因为网络的时代,很多的企业以及个人都会建立自己的网站,在建立网站的时候也应该要注意细节问题,这样建设出来的网站才能够更好的展现出自己的品牌形象,也能够得到更好的宣传策划。…查看详情
- 6款比较好用的家庭记账软件,提高记账效率
家庭记账软件可以帮助我们更好地规划我们的工资,提高我们的生活质量,让每一笔钱的来龙去脉都一清二楚。下面是我自己也在用的6款比较好用的家庭记账软件,有需要的小伙伴可以看一看。 1.家庭记账本 它是一款免费、实用的家庭记账软件…查看详情
- 免费好用的项目时间管理系统,让每一天都更充实
对于一些项目来说,为了能让项目更好的完成,时间对项目来说是非常重要的,项目时间管理软件也可以很好的帮助我们管理时间,那么,有哪一些好用的项目时间管理软件呢?让我们一起来看看吧。 1.成功gtd 这款软件让你不再盲目的工作,不…查看详情
- 天猫购物券怎么使用?
优质答案(1) 1、我们领取天猫超市优惠券简单快捷的方式,就是到氧惠领券中心领取了。 2、氧惠领券中心为大家搜集和整理天猫超市的各种优惠券领取入口,大家根据自己的需求,选择领取即可。 3、氧惠领券中心天猫超市优惠券领取地址 4、…查看详情
- 怎么下载itunes到电脑上?
优质答案(1) 1. 点击开始菜单或者点击win10系统的win图标,打开找到应用商店。 2. 在应用商店中输入“iTunes”进行搜索,找到对应的应用打开。 3. 目前itunes是可以在应用商店中免费下载使用的,点击获取…查看详情
- caj阅读器目录不见了怎么找
CAJ阅读器是一种常用的电子文献阅读工具,它可以方便地访问和阅读CAJ格式的学术期刊、学位论文等文献资源。然而,有时候用户可能会遇到CAJ阅读器目录不见的情况,导致无法快速定位和浏览文档中的内容。下面将介绍一些解决该问题的方法。 方法一:检…查看详情
- 京东网店入驻规则有哪些?
京东近年来的发展是比较迅速的,很多商家在看中京东的商机后,也是纷纷选择入驻京东,但是对于平台的不了解,不到它的入驻规则是什么,那京东商家入驻规则有哪些?下面*就给大家来详细介绍一下。京东网店入驻规则有哪些 一、京东招商对象 1、京东…查看详情
- 怎样制作小程序,按照这几点即可
我们都知道小程序在电商行业已经掀起风浪很长时间了,但是到现在也还是各个商家热捧的对象。就因为它是腾讯开发的,就因为它可以自带流量,以至于可以帮助到商家实现流量转化。那么问题来了,怎样制作小程序呢?制作小程序都有哪些步骤呢?接下来小万就来和大…查看详情
- 搭建网站需要遵循的四大基本原则
搭建网站能够帮助企业更好的发展,同样也是代表了整个企业的门面,能够帮助企业留住更好的潜在客户,还能够将产品更好的推广出来。因为现在也是网络的时代,不管是什么样的行业,很多人都会在网上来寻找信息,所以说想要得到更好的发展,离不开网…查看详情
- 桌面时钟软件有哪些 桌面时钟软件排行榜
很多小伙伴在平时工作的时候喜欢在自己的电脑桌面上设置一些时钟软件,下面小编就来给大家详细介绍一下桌面时钟软件有哪些 桌面时钟软件排行榜这一块的相关内容,希望能帮助到大家。 桌面时钟软件排行榜 1、《翻页桌面时钟》 极简高级时间…查看详情
- 使用小程序会员系统功能,抓住更多用户、保证销量
商家使用小程序核心目的是通过流量获取,抓住用户,提升销量,取得收益。但除去新用户获取,商家同样也面对着如何留住用户这一难题。小程序的出现,可通过小程序获取流量,再通过小程序会员系统功能,留住用户。 图片来源于网络 小程序会员系统功能,可以帮…查看详情
- 搞笑电视剧排行榜前十名,每一部都乐趣十足
如果感觉生活缺少了乐趣,一定不要消沉,可以通过看一些搞笑的电视剧,来释放出负能量,让生活中也多了更多的乐趣,减少压力对于生活的影响,那么下面就为大家介绍几部搞笑的电视剧,每一部都乐趣十足,快来看吧。 1、老友记 这部搞笑的…查看详情
- 股价大跌5%!时代变化快,连麦当劳都跟不上了?
麦当劳第三季度财报显示,净利润下滑2%,约合人民币114亿元,麦当劳第一次出现业绩下滑。受财报影响,麦当劳股价也大跌5%,市值蒸发约合人民币566亿元。面对时代变化,麦当劳一直在追随:和外卖商合作增加网上订购、送餐上门等服务;开发订餐小程序…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



