基于数据挖掘的共享单车经济的探究

    杨文寿 陈洪

    

    

    

    摘要:中国大陆如火如荼的发展共享单车经济,本文以OFO为例,基于所得数据,先运用统计学方法中的散点图对数据进行初步分析,再建立一元线性回归模型和一元非线性回归模型,旨在检验共享单车投放量是否对打车人次产生影响,模型的检验结果都说明了共享单车投放量对打车人次均产生了不同程度上的影响。

    关键词:OFO;sPss; 一元线性回归模型;一元非线性回归模型

    0 引言

    在共享经济背景下,共享单车很好地体现了党的十八届五中全会提出的“创新、协调、绿色、开放、共享”五大发展理念,符合供给侧结构性改革要求,有助于发扬创新精神、缓解环境污染和交通拥堵等难题。2017年5月9日,中国电子商务研究中心发表的《2016年度中国“共享经济”发展报告》文章指出,2016年中国“共享经济”市场规模达39450亿元,增长率为76.4%,其中,2016年,共享单车呈现近10倍规模发展[1]。以OFO为例,2016年度共享单车领域单就OFO就完成了五次融资。2017年3月l号更是完成了高达4.5亿美元的D轮融资。

    1 共享单车的现状

    2016年共享单车的发展异常火热,可以说是共享单车的发展元年。据中国电子商务研究中心监测数据显示,共享单车领域异常火热。截止2016年年底,共享单车用户规模达1886.4万人,相比于2015年245万人,呈7倍的爆发式增长。预计2017年用户规模将达到4965万人,以OFO和摩拜呈现双雄争霸模式,共享单车行业格局将定。据第三方数据分析机构艾媒咨询权威发布的《2017年7月中国APP活跃用户排行榜》最新数据显示,OF07月的活跃用户规模占比为4.47%,排名总榜单的第70名,位居共享单车行业第一。

    2 模型的建立与求解

    如下表3.1所示,这是某地区OFO共享单车投放量与打车人次数据,可设该地区投入共享单车的数量为xi,打车人次为yi。为了大致分析出xi和yi的函数图像关系,首先利用表3.1的数据作yi对xi函数关系的散点图。

    共享单车投放量和打车人数大致呈现负相关的函数关系,随着共享单车投入量的增加,打车人次逐渐减少,而且两者在x=4000之前存在较强的线性关系,而在x=4000之后呈现非线性关系。因此,需要分俩段建立模型,分别建立一元线性回归模型和一元非线性回归模型来探究共享单车投放量对打车人次的影响进行分析[2]。

    2.1 一元线性回归模型

    (一)模型的建立

    设一元线性回归模型为:

    y=β0+β1x+ε

    上式中,β0和β1为回归系数,占为随机误差项,假设ε~N(O,σ2),则随机变量y~ (β0+β1x,σ2)。

    若对y和x分别进行了n次独立观测,得到以下n对观测值

    (yi,xi),i=1,2,3,…,n

    上述,xi是自变量在第i次观测时的取值,它是一个非随机变量,并且没有测量误差。对应于xi,yi则是一个随机变量,它的随机性是由εi造成的。ε~N(O,σ2),对于不同的观测,当i≠j时,εi与εi是相互独立的。用最

    由F检验可知,F =772.164,F>Fa(1,n-2),接受原假设H0:β1=0,拒绝备择假设H0:β1≠0,即可以用x的线性关系来解释y。

    (五)模型的结论

    从上述的一元线性回归模型可知,在共享单车投放量小于4000辆时,打车人次与共享单车投放量呈现显著的线性关系,并且是负相关。即共享单车投放量越大,打车人次就越少,从而使打车市场的收益减小。

    2.2 一元非线性回归模型

    (一)模型的求解

    由图3.1我们可以观察得到,在共享单车投放量大于4000辆时,共享单车投放量和打车人次并没有呈现很显著函数关系,所以我们利用共享单车投放量大于3000辆的之后的数据建立一元非线性回归模型来分析二者之间的关系。

    用SPSS分别对数据进行幂函数拟合、多项式函数拟合以及对数函数拟合.拟合好的函数结果分别为:

    幂函数:y= 4.855×l05X-0'4623

    多项式函数:

    y= -1.501x10-9X4+ 2.422 x10-5 x3—0.144x2+

    372.8x - 3.421x l05

    对数函数:y= -1.116×l04 lg(x)+ 5.075×l04

    (二)模型的参数对比

    為了方便更好地识别哪一个函数能更好地拟合,我们将用SPSS输出的拟合优度制作成表格来进行对比。从表3.1中可以看出,拟合优度从优到差排序为多项式函数优于幂函数优于对数函数。所以我们选择多项式函数来表示乘出租车人数与共享单车投入量之间的关系。

    (三)模型的结论

    通过分析多项式函数的图像,可以看出,该地区在共享单车投放量大于4000辆时,将投放量再增加1000辆对打车人次无明显影响。如果该地区在共享单车投放量大于5500辆,则会使打车人次大幅减小,从而使打车市场的收益大幅减小。

    3 结语

    从上述一元线性回归模型和一元非线性回归模型对数据的检验结果来看,共享单车投放量对打车人次均产生了影响,尤其是一元线性回归模型对打车人次产生了显著性影响。可以大致认为,共享单车投放量越大,打车人次就越少,从而使打车市场的收益减小,换句说,会使得共享单车经济规模不断扩大。与此同时,随着共享经济的发展,甚至受到全球关注。2017年4月18日,南京举行的2017全球未来网络发展峰会上,中国国家信息中心副主任马忠玉表示,“预计到2020年,共享经济规模占到GDP比重的10%,2025年达到20%。”

    参考文献:

    [1]中国电子商务研究中心.2016年度中国“共享经济”发展报告[R ].2017

    [2]周龙雨基于BP神经网络的共享单车调度优化[J]中国战略新兴产业,2017,(24)

    [3]许振宇,宋新欣,乔彬计量经济学原理与应用[M]北京:清华大学出版社,2016