出版社棋类图书销量影响因素实证研究

    郑亮

    摘要 X出版社是隶属于中国社会科学院的中央级出版社,以出版经济管理类学术专著为主,少量出版棋类书籍。本文以X出版社为例,以其销售数据为基础,选取大样本进行实证研究,从数据、模型、决策角度分析棋类图书销售过程中需要重点考虑的影响因素,并提出具体的解决方案。

    关键词

    棋类图书;出版社;图书销量;实证研究

    出版社发展棋类图书的意义

    出版社的单位性质与一般营利性企业不同,作为精神文化产品传播的重要平台,必须坚持正确的出版导向,把社会效益放在首位。随着出版行业市场化程度的加深,出版社需要在保证社会效益的同时兼顾经济效益。棋类图书,尤其是象棋图书,对传承我国优秀文化意义重大,象棋的群众基础较好,有广泛的读者,能够实现社会效益和经济效益的双丰收。

    X出版社以出版学术专著为主,学术专著的“高效率”,大部分建立在“短、平、快”的基础上[1],鉴于出版社每年可以利用的出版资源是有限的,棋类图书的销售周期长,因此,需要经过多年积累才能获得盈利。而且,作者大部分是全国棋类冠军级别,前期稿酬投入较大,如何增加棋类图书的销量,给出版社出了一道难题。本文以发行部提供的实际销售数据为基础,进行实证研究,客观分析了棋类图书销售过程中需要重点考虑的影响因素,并提出具体的解决方案。

    单自变量的简单回归

    棋类图书的销量受到多种因素的影响,弄清这些因素的影响力强弱,以便棋类图书实施有效的销售对策。本部分将通过建立回归模型,对这些因素分别进行研究。回归分析(Regression Analysis)是研究一个变量如何随其他变量的变化而变化,发现它们之间的某种规律[2]。下面以总销售量为因变量,以每种棋类图书的价格、销售时长、作者知名度为自变量,建立回归模型。

    1. 价格与总销售量的关系

    人们通常会认为“图书价格越便宜,卖得越好”,下面把棋类图书价格代入自变量X,销售量代入因变量Y,拟销售量与价格的回归方程。数据方面,以发行部提供的实际销售数据为基础,在分析之前对样本进行审核,检查是否有异常数据(极大值或极小值),尽管这些销售数据是真实的,反映了棋迷对这几种棋类图书的接纳程度,但极值会影响整体样本的分析结果,最终选取115种图书为数据样本。

    第一,通过计算回归结果,可以得出回归方程:

    Y= 11921 – 141X

    其中,–141表示棋类图书价格每增加1元,总销售册数可能减少141册。

    第二,计算得出相关系数为0.45,弱相关经验值的分界线为0.3,中等相关经验值的分界线为0.5,表明销售量和价格的相关性中等偏弱,也就是棋类图书的总销售量与价格关系并不是很大。

    第三,计算得出样本判定系数为0.19,表示在总销售量的变化中,仅有19%可以归因于棋类图书价格的影响因素。

    第四,价格因素P值= 3.68E-07,表示在1%的显著水平上,价格的显著性得到接受,所以价格与销售量在总体上存在回归关系。

    综上所述,在115个样本中,虽然P值在1%的显著水平上通过单检验,但是,相关系数和样本判定系数均表明,销售量和价格的相关性不是很强,回归结论与人们通常认为的“图书价格越便宜,卖得越好”不一致。

    2. 销售时长与总销售量的关系

    人们通常认为“销售时间越长,销量越好”,但棋类图书自身的生命周期又决定其不可能持续销售。以棋类图书销售时长为自变量X,总销售量为因变量Y进行回归分析。数据方面,自变量X以月为单位,已下架棋类图书的销售时长为一个完整时间周期,数值为上架月份与下架月份之差,正在销售的棋书销售时长为上架月份与样本采集截止日期之差;因变量Y(总销售量)为每种棋类图书对应销售时长内的总销售量。同理,在分析之前的样本审核中剔除异常数据。

    第一,通过计算回归结果,可以得出回归方程:

    Y = – 850 + 157X

    其中,157表示棋类图书销售时长每多1个月,总销售量可望增加157册,二者有正相关关系。

    第二,计算得出相关系数为0.87,强相关经验值的分界线为0.8,表明总销售量和销售时长的相关性很强。

    第三,计算得出样本判定系数为0.76,表示在总销售量的变化中,有76%可以归因于销售时长的影响,相比较前一部分价格影响因素的占比,可以看出销售时长因素起绝对作用。

    第四,价格因素的P值为1.55E-37,表示在1%的顯著水平上,销售时长的显著性得到接受,所以销售时长与总销售量在总体上存在显著的回归关系。

    综上所述,在115个样本中,P值在1%的显著水平上通过单检验,相关系数表明总销售量和销售时长的相关性强,样本判定系数表明销售时长有76%的可能性提高销售量。回归结论与人们通常认为的“销售时间越长,销量越好”相一致。

    3. 作者知名度与销售量的关系

    因为作者知名度是定秩数据,不能单独作为自变量,需要转换成一组0-1变量,记为D,进行哑变量分析,求相关系数矩阵。在这里我们假设“0”代表普通作者,“1”代表全国冠军及以上级别的大师级作者。

    样本数据仍然选择剔除异常值后的115个样本值。作者知名度D与总销售量Y的相关系数为0.33,无相关性与弱相关性的经验值分界线是0.3,所以,表明作者知名度与总销售量仅有弱相关性。这个结论似乎有悖于常理,大师级作者与普通作者在棋力、阅历、写作水平方面都有较大差距,但反映在销售量上为何没有明显区别?

    再分析作者知名度与年均销售量的相关系数,经计算得出结果为0.71,中等相关性与强相关性的经验值分界线是0.8,所以,表明作者知名度与年均销售量相关性中等偏强。这就解释了上述疑问,大师级作者对棋类图书年均销售量的影响还是比较明显的,之所以对总销售量的影响不明显,主要是由于销售时长的影响。

    为进一步分析大师级作者的年均销量是否显著大于普通作者,需要采用假设检验,判断两个总体的平均值关系。

    H0:大师级作者的年均销量≤普通作者的年均销量

    H1:大师级作者的年均销量>普通作者的年均销量

    此假设为大样本平均数差量的右尾检验,由显著水平0.05,可知判定法则为:Z*= 1.65,若Z>Z*,就拒绝零假设。通过“Z-检验: 双样本均值分析”,可以得出检验结果Z值为7.16,远大于单位临界值1.65,拒绝零假设。可以得出结论,大师级作者的年均销量显著大于普通作者的年均销量。

    因此,如果想提高棋类图书的销售量,最好的情况是作者知名度高且保证图书长时间不下架,从而促进总销量的提升。

    多自变量的多元回归

    1. 相关系数矩阵

    棋类图书价格、销售时长2个定标自变量之间是否相互独立,需要通过相关系数矩阵判断,如果自变量之间相关性过强,则在建立多元回归模型时进行取舍。通过计算价格、销售时长之间的相关系数矩阵,可得相关系数绝对值为0.57。根据相关性经验值分界线,相关系数0.5~0.8之间为中等相关,因此,我们可以得出如下结论,在2个定标自变量中,价格与销售时长的相关性中等,可以考虑建立多元回归模型。

    2. 综合模型

    在检验了自变量之间的相关性后,将他们进行组合,建立多元回归模型,检验是否具有总体显著性,加入价格、销售时长等因素,对销售量变化的解释能力是否增强,通过取舍确定综合模型。多元样本回归方程为:

    Y = a + b1X1 + b2X2

    第一,选取销售时长和作者知名度为自变量。在前面的简单回归中,以销售时长为自变量,对销售量的解释能力比以价格为自变量更强,因此,优先选取销售时长。同时,引入作者知名度作为哑变量D,经计算多元回归方程为:

    Y = – 921 + 157X1 + 353D

    当D=0时,Y = – 921 + 157X1;当D=1时,Y = – 921 + 157X1 + 353。其意义解释为,大师级作者的销售量可能增加353本。

    经计算,总体检验的P值为3.18E-36,销售时长变量的P值为2.74E-37,在1%的显著水平上可以证明有显著的回归;作者知名度哑变量的P值为0.56,在1%的显著水平上不能通过检验,即在引入作者知名度哑变量后,破坏了整个模型的显著性。样本判定系数为0.76,对比单纯用销售时长作为自变量的76%没有变化。因此,增加作者知名度的哑变量后,反而破坏了整个模型的显著性,不适宜同时选取销售时长和作者知名度为自变量。

    第二,以棋书价格为第一自变量,引入作者知名度作为哑变量,多元回归方程为:

    Y = 11963 – 141X1 – 228D

    当D=0时,Y = 11963 – 141X1;当D=1时,Y = 11963 – 141X1 – 228 。其意义解释为,大师级作者的销售量可能减少228本。

    加入作者知名度变量后,得出有悖于常理的结论,即大师级作者的棋类图书销量比普通作者少。再观察假设检验的P值,总检验的P值为2.52E-06,显著性没有受到影响;作者知名度哑变量的P值为0.84,在1%的显著水平上不能通过检验,即在引入作者知名度哑变量后,破坏了整个模型的显著性。判定系数为0.19,对比单纯用价格作为自变量的判定系数没有变化。因此得出结论,不宜同时引入价格和作者知名度为自变量。

    第三,以出版时间为第一自变量,价格为第二自变量,此时多元回归方程为:

    Y = –2074 + 165X1 + 23X2

    总体检验的P值为1.49E-36,显著性没有受到影响;但价格变量的P值为0.17,表明在1%的显著水平上不能通过检验,即出版时间和价格同时作为自变量时,破坏了整个模型的显著性。因此得出结论,不宜同时使用出版时间和价格作为自变量。

    结束语

    本文选取了棋类图书价格、销售时长和作者知名度作为棋类图书销售量的影响因素进行分析,分别建立了单自变量的简单回归模型和多自变量的多元回歸模型,得出如下结论。

    第一,棋类图书价格和销售量的相关性不是很强,价格便宜不一定卖得越好。这也为棋类图书未来发展敲响了警钟,不要试图以低价格抢占市场。

    第二,销售时长与销售量的相关性强,销售时间越久,销售量越高。棋类图书有其浓厚的文化背景[3],尤其是中国象棋类,与学术专著不同,受政策改变和宏观经济环境影响较小,畅销且常销,读者需求稳定,销售时间越久,累计销量越高。

    第三,作者知名度与年均销售量的相关性很强。经过假设检验,大师级作者的棋类图书年均销售量显著大于普通作者。因此,棋类图书在选择作者时,应着重考虑作者是否为大师级,象棋作者尽量选择棋协大师或特级大师。当然,有些作者本人并未取得大师称号,这与国内目前大师资格的评定制度有关,但他们写作能力很强,培训班的教学效果好,直接销售给学员的数量可观,这些额外因素需要编辑仔细甄别,不能仅凭借定量分析。

    参考文献

    [1]李景瑞. 编辑发稿量猛增的隐忧[J]. 编辑学刊, 2011(4):21-22.

    [2]贾怀勤. 数据、模型与决策(第三版)[M].北京:对外经济贸易大学出版社,2012.

    [3]郭莉萍.象棋运动的文化流变[D].北京:北京体育大学,2014.