对于Citi Bike和用户骑行的分析
2020-12-31 14:46:10 阅读(251) 评论(0)
“花旗银行”是纽约2013年5月27日启动的自行车共享计划(CitiBank)赞助并命名为“花旗自行车”(CitiBike)。皇后区和泽西市有8000辆自行车和500个车站,在曼哈顿,布鲁克林。为纽约居民和游客提供方便、快捷、省钱的出行方式。到处都可以借到CitiBank,并在他们的目的地归还。使用CitiBank的方法很简单,购买会员资格,然后在附近找到可用的CitiBank,使用会员key解锁,在有效时间内(30或45分钟)归还并锁定CitiBank。由于每个CitiBank租赁站点都有GPS位置信息,因此可以记录用户租赁和骑行过程中的数据。“CitiBank“官方网站为用户提供每次骑行的数据,包括租赁开始和结束的位置和时间、整个骑行过程的时间、自行车ID、用户的性别和出生日期。我们将使用python对“CitiBank为了了解纽约自行车共享计划,分析了2015年的数据。并回答问题,比如谁在使用CitiBike时开始每次骑行的时间和距离,以及哪些骑行路线最受欢迎。首先,我们将需要使用的库文件导入python,包括numpy,pandas,datetime和pyplot用于数据可视化,我们将根据不同的分析方向导入其他库文件。123456importnumpimpandaspdimportime,datetimeimportmatplotlib.pyplotasplt#读取CitiBike数据,创建数据表cb1=pd.DataFrame(pd.read_csv('201501-citibike-tripdata.csv'))按月存储CitiBike数据,因此,我们需要每月阅读并拼接每个月的数据。12345#拼接导入的数据表,总结后的数据表称为cbcb=cb1.append(cb2,ignore_index=False)#查看数据表维度cb.shape(9937969,15)2015年CitiBike数据共包含993万行,15列数据。每一行数据都代表“一次”CitiBank租赁和骑行记录。每一行数据都代表“一次”CitiBank租赁和骑行记录。我们首先对2015年的“惊人的990万次骑行”进行了调查CitiBank统计数据中的几个关键指标,每年共有497个租赁点,即车站,8477辆自行车被使用。自行车的使用次数高达993万次,平均每辆自行车每天租3.21次。可见人对“可见人对”CitiBank”的热情。平均每次骑行时间为16.13分钟。以下是每个关键指标的统计代码和结果。12346791111211141618(cb['startstationname'].unique()497#唯一的自行车ID计数len(cb['bikeid'].unique()8477#骑行次数计数cb['starttime'].count()9937969#每辆自行车租赁频率cb[ལbikeid'].count()/len(cb['bikeid'].unique()1172.34505133239#每辆自行车每日租赁频率cb['bikeid'].count()/len(cb['bikeid'].unique()/3653.21904250178966#每次租赁的平均时间(分钟)cb['tripduration'].sum()/cb['bikeid'].count()CitiBike在6016.134942371323582015年的总体使用趋势由低到高,CitiBike在2月份使用量最低,然后使用量逐月增加,直到9月份使用量最高。十一月份使用量开始下降。11月份使用量开始下降。这可能是由季节和温度因素引起的。以下是对骑行数据的季度汇总和比较。以下是每月汇总骑行数据和折线图的代码。123467891111211114161718#starttime设置日格式cb[ལstarttime']=pd.to_datetime(cb['starttime'])#将startime设置为数据表索引cb=cb.set_index('starttime')#按月计算骑行数据cb_month=cb.resample('M',how=len)#bikeid字段group提取汇总cb_month=cb_month['bikeid']#按月汇总的骑行次数折线图plt.rc('font',family='STXihei',size=15)a=np.array([1,2,3、4、5、6、7、8、9、11、12)plt.plot(group_cb_month,'g8',group_cb_month,'g-',color='#39A2E1',linewidth=3,markeredgewidth=3,markeredgecolor='#39A2E1',alpha=0.8)plt.xlabel('月份')plt.ylabel('租赁骑行次数')plt.title('2015年,CitiBike每月骑行次数')plt.grid(color='#95a5a6',linestyle='--',linewidth=1,axis='y',alpha=0.4)plt.xticks(a,('1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月'))plt.show()根据2015年第四季度的数据,用户对CitiBike的使用受季节因素的影响,第一季度气温最低,CitiBike使用量也较低。夏秋交替,第二季度和第三季度使用量最高。12346791111211415#季度计数自行车数据cb_quarterly=cb.resample('Q',how=len)#bikeid字段group按季度总结提取_cb_quarterly=cb_quarterly['bikeid']#按季度总结的骑行次数绘制柱状图plt.rc('font',family='STXihei',size=15)a=np.array(1,2,3,4)plt.bar(1,2,3,4),group_cb_quarterly,color='#39A2E1',alpha=0.8,align='center',edgecolor='white')plt.xlabel('季度')plt.ylabel('租赁骑行次数')plt.title('2015年,CitiBike每季度骑行次数')plt.legend(['次数'],loc='upperright')plt.grid(color='#95a5a6',linestyle='--',linewidth=1,axis='y',alpha=0.4)plt.xticks(a,('一季度','二季度','三季度','四季度'))plt.show()谁在使用CitiBike?我们很好奇993万次骑行的巨大数据背后是谁在使用CitiBike。由于获得的数据只包括用户性别、出生日期和会员类别的数据,我们只从这三个维度简要描述CitiBike用户。由于获得的数据只包括用户性别、出生日期和会员类别的数据,我们只从这三个维度简要描述Citibike用户。2015年,66%的男性用户使用Citibike服务,66%是男性用户,女性用户占20%,13%的用户性别未知。这让我想起了北京自重25公斤的自行车共享。以下是计算用户性别比例和绘制饼图的代码。12345678910#根据用户性别总结并计算不同性别的user_gender=cb.groupby('gender')['bikeid'].agg(len)/cb["bikeid"].count()*100#总结用户性别比例饼图pltt.rc('font',family='STXihei',size=15)colors=["#052B6C","#39A2E1","#EA1F29"]name=['未知','男性','女性']plt.pie(user_gender,labels=name,colors=colors,explode=(0,0,0),startangle=60,autopct='%1.1f%%')plt.title('Citibike用户性别比例')plt.legend(['未知','男性','女性'],loc='upperleft')plt.show()30-50岁的用户热衷于骑自行车。我们将Citibike的用户年龄分为四组,0-18岁为青年组,18-30岁为青年组,30-50岁为中年组,50岁以上为老年组。其中,青年组的租赁和骑行次数最少,中年组的租赁和骑行次数最多,其次是青年组。其中,青年组的租赁和骑行次数最少,中年组的租赁和骑行次数最多,其次是青年组。50岁以上的老年组也有相当多的记录。以下是用户年龄分组和汇总柱状图的代码。用户年龄由出生日期和当前年份计算,包括一些极端值。123#查看出生日期的cb['birthyear'].min(),cb['birthyear'].max()(1885.0,199.0)这里1885年很奇怪,根据这个出生日期,2016年用户的年龄已经达到了131岁。具体原因我们不知道,但由于CitiBike的整体数据比较规范,不需要清洗,所以我们选择保留这个值。2015年和用户出生日期计算年龄cb[#;age']=2015-cb['birthyear']#最小年龄为17岁,最大年龄为131岁cb['age'].min(),cb['age'].max(17.0,131.0)#用户年龄分组bins=[0,18,30,50,131]group_age=['少年','青年','中年','老年']cb['group_age']=pd.cut(cb['age'],bins,labels=group_age)#数据按年龄分组汇总user_age=cb.groupby('group_age')['group_age'].agg(len)#生成用户年龄分布柱状图pltt.rc('font',family='STXihei'
推荐阅读
- 推广文案怎么写吸引人 文案写作技巧
现在做品牌也好,推广运营也好,文案算是这些工作的基础,一份漂亮的文案绝对能传播得很厉害,下面万商云集*就给大家来介绍下推广文案怎么写吸引人 文案写作技巧 一.人物状态+情感宣泄=情感共鸣 想要自己的视频上热门,一定要和粉丝产生情感共…查看详情
- 盘点一下最安全的浏览器都有哪些?
无论在生活中还是在生活中,浏览器可以帮助我们的事情非常多,比如我们要查找资料的时候就需要浏览器的存在,通过浏览器我们可以找到我们最想要的正确答案,那今天我们就来盘点一下最安全的浏览器都有哪些? 1、搜狗浏览器 这是一款由搜…查看详情
- 网站收录信息查询的三种方法
网站收录指的是搜索引擎对某个网站的文章或页面进行索引,以便在搜索结果页面上展示。对于网站管理员和SEO从业者来说,了解自己网站的收录情况非常重要。以下是三种查询网站收录信息的方法。 1.搜索引擎查询 搜索引擎查询是最常用的查询网站收…查看详情
- crm业务管理软件,帮助企业快速发展
不可否认,互联网的快速发展、互联网软件的出现,都在帮助着各类企业向前发展。尤其是crm业务管理软件的出现,帮助企业在客户、销售业务等方面进行了高效、流程化的管理。那么接下来,小万将为大家介绍一下关于crm业务管理软件是如何推动企业发展的。 …查看详情
- 电脑如何打开dos命令窗口
windows中进入msdos的方式有几种?1.若电脑虽然有问题但还能进入Windows,请依次点击“开始→程序→MS-DOS方式”,你还可以点击“开始→运行”,在打开的对话框里输入“command”(不带引号,下同)。若你的系统是Wind…查看详情
- 3个方面带你认识什么是CRM?
想要获取到更多客户资源,想要与已有客户建立持续的合作关系,是时候了解什么是CRM了!关于什么是CRM,小万认为,我们可以从以下3个方面来详细解读,一起来看看吧! (图片来源:网络)CRM是获取客户信息的有效途径什么是CRM?首先CRM是企业…查看详情
- 监控七大品牌,2021监控系统排行
随着科技的发展,社会的进步,监控系统由原来的类型单一,种类缺乏到现在的多种多样,一个好的监控系统可以减轻工作压力,提高工作效率,下面我来介绍一下监控七大品牌,以及2021监控系统排行。 1.Infinova英飞拓监控系统 Infinova是…查看详情
- 域名注册工具丨解决域名查询难、配置难、选择难问题
域名是由互联网名称与数字地址分配机构分发给各个国家的互联网信息中心自行管理,然后互联网信息中心再将域名授权给一级域名注册机构,注册机构再给很多代理机构,所以市场上大多数的域名注册都找的是域名代理商。找到代理商之后,第一步不就是进行域名查询,…查看详情
- length函数用法
length函数高斯怎么使用?C语言中,没有length,可以自己编写 代码示例: intlength(char*s){ inti; for(i=0;s[i]!='\0';i++);//注意不等号 …查看详情
- switch case判断成绩等级
输入一个字符,用switch语句判断它是大写小写还是别的?每一个字符都有自己的ASCII值根据这个值的分布不同就可以区分大小写 65-90大写A-Z 97-122小写a-z其他数值则是其他字符 你需要把这个字符设置为char类型 然…查看详情
- 美容院99元拓客方案
美容院是一个以美容护肤为主的综合性服务业,为了吸引更多的客人、提高客流量并增加收益,美容院需要进行有效的拓客。针对美容院中普遍存在的客流量不足的问题,我们提出了99元拓客方案。 1、方案目标: 1.1提高美容院的客流量 1.2增加…查看详情
- 2021哪个记手账APP软件好用?这5款非常适合女生!
相信大部分女生都有记手账的习惯,市面上的手账APP也非常的多,有没有专门针对女生设计的手账APP呢?小万针对这个问题进行了大量的信息收集和使用体验测评,终于找到5款比较适合女生的手账软件,依次为各位介绍。 第一款、時间手帐本设计风格:清爽简…查看详情
- 顺风车长途拼车软件哪个好?这几款比较可靠
随着各种应用技术不断的提升,大家日常出行,不仅可以选择出租车和公交车,也可以拼车,尤其是长途选择拼车,能够节省费用,也可以减少等待的时间,那么顺风车长途拼车软件哪个好呢?这几款比较可靠,值得大家选择。 1、滴滴出行 滴滴出…查看详情
- 计算机网络的发展过程大致可以分为几个阶段
计算机网络的发展过程大致可以分为三个阶段?应该说是四个阶段 第一阶段为面向终端的计算机网络,特点是由单个具有自主处理功能的计算机和多个没有自主处理功能的终端组成网络. 第二阶段为计算机-计算机网络,特点是由具有自主处理功能的多个计算…查看详情
- 中小企业网站建设与管理重点在哪里
受疫情影响,很多中小企业的线下业务受到了冲击,于是辗转线上成了很多企业的选择。那么当我们拥有了自己的网站,应该怎样去进行网站建设与管理,网站工作的重点又是什么?中小企业网站建设与管理的重点是什么?1、做好市场网站分析中小企业建站之初尽量不要…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



