随着大数据、人工智能等技术的广泛运用,服务方式创新、商业模式创新、管理创新等的对传统服务业的改造,大量新型的服务业态不断涌现,服务业升级趋势愈发明显。对于创业者而言,看清方向,把握机会,走对走准,无疑至关紧要。因此,2019北京大学海峡两岸现代服务业高峰论坛特别请来海峡两岸的一线专家和行业先行者论道研讨,为两岸创业小伙伴提供一个学习充电、寻师访友、对接资源的平台。

在本次论坛上,中国人民大学教授、中国农业经济学学会青年委员会秘书长刘晓鸥女士表示,对自己的数据有一个监控,这样才能帮助你做出比较好的判断。

刘.jpg

以下为中国人民大学教授、中国农业经济学学会青年委员会秘书长刘晓鸥女士在“2019北京大学海峡两岸现代服务业高峰论坛”的精彩演讲实录,由云现场整理。


    前面这几位老师演讲让我感受很深,我平时做的东西确实比较少,积累跟前面两位老师也没有办法比较。我跟大家分享一下我这么多年在学习经济学一些心得。经济学大家比较熟悉,经济学里边有很多分支,不光跟你探讨国家的货币政策,或者是国际上的大国之间的博弈,还有微观经济学的理论可以细化到个人一些消费的选择,把个人的消费和企业的行为结合起来,就是我们经济学一个重要的分支叫“产业组织理论”。我们北大张为盈老师学的产业组织,简称产组,在1990年以后随着数据可能性的增强,又分化成理论的产业组织研究和时政的组织研究。一般跟现实的结合度还是特别少的,因为企业的数据还是比较难以获得的。但是这个时政产组发展比较快的原因,消费者数据可获得性,1990年以后就慢慢增强,特别美国有一个很好的,就是有一个数据公司,它会搜集美国的各个市场区的消费者数据,在这个基础上,它还会搜集各个企业的广告数据,和电视媒体广告的覆盖数据。所以在这个数据支撑下,时政产业组织研究才会蓬勃发展起来。一直发展到现在,又跟大数据的分析相结合了。其实经济学它就是特别是时政产业组织理论这块一直专注是数据分析,现在流行大数据,是计算机科学家们一个术语,为什么叫大数据,看它单构存储单元能够存得下数据。在大数据领域,它的贡献还是跟以前差不多,只是说因为数据量比较大,经济学家们在注重我算法的提高,我怎么在数据量很大情况下快速的得出结果。
    这个经济学据数据分析的分支我们叫做剂量经济学和计算机科学家说的大数据是不同的,跟我们经济学专业纠结的点是一样,我们纠结因果关系,什么叫因果关系呢?比如说你发现这个月某种菜品或者某个商品销量增加了,想知道它的原因到时候是什么,它的原因有可能是你的竞争对手涨价了,你的原因也有可能是无码了,或者某种动物的流行病正在爆发,疫病产品的替代品所以会体现你产品的需求是上升的,这就是因果分析。因果分析为什么很重要呢?这也就是经济学家跟统计学家跟计算机科学家们一个争执,你要找到过去规律,然后找到过去发生事件的原因,才能预测未来。
    大数据计算机科学家他们会相信说只要我的预测能力比较好,比如说我计算出模型,我这个模型可以把过去的事情拟合得比较好,所以这个模型就是好的,经济学不这么认为。模型拟合得很好,找不到原因,第二天预测就会出现问题。因果关系识别会出现很多问题,比如说我们经济学研究当中就会经常出现逆向因果问题,什么叫逆向因果,比如说大家老人经常跟你说不能喝凉水,因为喝了凉水以后会胃疼,逆向的因果,喝凉水本身不是导致你胃疼原因,是因为你胃出现了问题才会感觉到胃疼。把你结果看成是你的原因,这个在预测当中是非常严重的问题。为什么我们经济学这么多经济学家,大家充分的智慧都用于关于因果关系识别上。
    关于经济学中大数据方法,几种传统方法,第一种回归法,回归来源根据之前统计学家数据来的,最早的统计学家发现所有孩子身高都会趋向于父母平均身高,称这个现象为回归现象。经济学里用的回归方法,也是把所有的随机项都给去掉,找出平均发展趋势这叫回归。大家可以看到我们回归方法在几个现实当中的应用。大家看一下这篇文章研究,是关于橙汁消费原因,发现价格下降以上,橙汁销量就会大幅度的提升。这是我们之前一篇研究,这个是关于食品包装营养信息的研究,一般的食品包装盒食品信息会印在包装正面或者测面,把食品营养信息印在包装盒前面,消费者能理解的话,对品牌的消费者选择某个品牌的行为会产生非常大的影响。比如说我们会发现健康,消费者选择健康品牌的比率增加了28%同时消费者选择他自己消费品里边的含糖反式脂肪消费也会有所降低。我们叫做随机实验。经济学里实验有两种,第一种叫自然实验,在现实当中自然而然发生的,比如说我们经济学里边关于自然实验有非常有名的研究,关于性别歧视的研究,性别歧视本身,我们之前说过逆向因果关系,因果关系是非常难以识别的。你会发现一个企业里边男性员工的工资要明显高于女性员工,这并不能表明存在性别歧视,必须控制男性员工他的干劲,他的知识水平,还有他的能力,可能他本身就比女性员工要强,工资只是反映个人能力的一个方面。并不能反映你的性别歧视,关于性别歧视在劳动经济学里面一直备受争议。社会上到底存不存在性别歧视。美国很好失败出性别歧视的效果,美国有五大乐团,五大著名交响乐团,有的招聘是双盲的,演奏者会中间跟招聘者隔了一个帘子,招聘者看不到演奏者的性别、样貌,只能听到他拉琴弹琴的水平,有一些乐团没有实行双盲的制度,还能看到演奏者的性别和样子。这个时候大家就发现当你是双盲的时候,女性演奏者被招聘进乐团显著提升的,通过自然实验大家可以发现说确实这个世界上存在着性别歧视现象。
    关于我们用到产业里边也是一样的道理,产业里边我们刚才做那篇文章也算自然实验,算产业自行的行为,它把食物营养标签,从包装盒后边挪到前面。
    第二种人为控制现象,eBay,看付费收缩能不能影响销量,所以它对美国210个指定市场区进行了实验,它关闭了65个市场区搜索广告,比较8周以后这几个区域里边企业,在eBay上企业的收入,他的结果发现,大家可以看一下底下图,黑色的线代表没有关闭付费搜索的市场区企业的收入,红色代表关闭了付费搜索市场区的收入,有很大差异,人为随机控制实验付费广告很有必要的。
    北大光华老师做的,蔡老师做的实验,眉州东坡酒楼,一组正常拿到菜单,另外一组又收到印有推荐5个菜品菜单,还有一组是随机给出5个菜品信息,一页菜品清单,可以引起推荐菜品20%的销量上升。隐性信息和显性信息两种,购买菜品的时候,菜单给消费者提供出来,对于消费者是显性价格,菜品价格菜品照片,通过菜品照片看菜品做的是不是好,把菜单显性信息提供给他了,消费者关注菜的口味,或者其他隐性信息。这个时候你可以通过提供额外隐性信息的方式,增加消费者选择你想要他选择这种商品的概率。这就是这个实验给大家的一个启示。
    还有一个方法我们叫社会网络分析法,在最近产业组织研究当中也非常流行,这个为什么流行呢,主要是微博数据特别可得,网络化的结构,这个社会网络分析法在经济学大数据研究中蓬勃发展起来,网络分析方法最早,经济学借用了流行病学的方法,流行病学这个疾病在一个社会当中的传播,它会通过强连接,网络之中强连接进行传播。网络有不同形状,可能传播到某一个点,我们叫免疫点,这个病传播到这就传播不下去了。我们这个经济学也借用了这个方法,最早的分析社会网络的一篇经济学的论文,分析了意大利文艺复兴时期佛罗伦萨家族统治几个城市,几大家族的网络图,这几大家族通过婚姻的,通过联姻方法建立他们之间社会网络,大家可以发现各大家族通过家族到达连接,网络上建立连接到另外一个家族的距离都是最短的,因为这个家族通过婚姻的方式,维持了其他几个家族的社会网络,所以使他在网络当中变成一个中心点,这个家族就能保持在这个城市几百年的统治地位。
    这个社会网络分析法最重要关于信息、搜索方面的分析,比如说他有人研究新闻网站的连接,比如说你要搜索跟加州相关的信息,以洛杉矶时报,提到加州字样建立一个连接,如果是一层网络连接可以画出第一个黄色那个图,这个网络是比较小的网络,如果你画一个二层网络图,你在洛杉矶时报新闻里边第一次提到加州的时候,你把这个连接跟洛杉矶时报产生一个网络连接,在第一层提到加州网页里边,要第二层信息又提到加州,再建立一个连接,这样网络覆盖面就会很大。
    第三个主流分析方法叫文本信息,文本信息为什么比较重要呢,它跟广告有比较大的关联,现在比较流行点评的数据有很大关联,大家都很在乎它的正面评价或者负面评价,这个时候就文本分析你比如说你用什么样的关键词组合成你的广告,你的消费者对什么样关键词最敏感。经济学关于文本分析一些研究。你可以看到纽约时报的书评。有人发现正面评价可以提高知名作家书的销量,负面评价可以使知名作家的书的销量下降,但是大家却发现一个什么样的特点,负面评价对不知名作家的书的销量有一个提高作用。
    我们电影也是一样的,为什么你会发现有的烂片反而它的票房还挺高的,因为大家看它的烂的程度有多烂,负面新闻只对不知名产品销量有促进作用,对知名产品销量还是有伤害作用的。
    相关碳酸饮料数据,现在你做一个社会网络敏感性的排序,这个你会发现,比如说我们这个研究就发现了什么,如果你推特上,全美国对含糖,就会导致可口可乐和百事可乐销量下降,可口可乐有很多口味,对其他替代品影响还没有那么大,社交媒体的评论,对销量一些影响。
    其他还是有很多关于企业和消费者方面的研究的,比如说举的第一个例子,对团购的网站,比如发团购券,有点像大众点评,美国发团购券网站很多,发现这个团购券确实对产品的,主要是提高了消费者对产品的搜索量和消费者对这个产品的了解,通过这个机制起到了增加销量的作用,主要提高了你对这种产品的曝光率。
    关于时间,经济学里有一块很大研究排队理论的,比如说你这个餐馆让很多人在外面排队比较好,还是让排队人比较少比较好。都会在我们论文当中有研究。比如说在你产品推荐时候,
    第三篇文章是讲美国大家发现是这种促销的,折上折,对你利润到底有没有影响,通常来说折上折对你收入提高很有好处,但对你利润率没有很好影响,不会提高你的利润率,这篇文章说明大家在使用折上折营销,要考虑到成本的问题。
    第四篇,是属于内部管理的,我刚才说的,你是要他预约制会对你的收入更有好处,还是你先到先吃,这两种排队的模式会不会对你收入产生一个什么样的影响。
    下一篇文章讲说消费者的真实的评价,就比如说我们会在美国的评价网站上,会有一些机制,你可以秘密评价也可以实名评价,大家发现在要求实名评价的时候,对你说的话比较留情,推动实名评价的发展。关于使用电子菜单技术的,大家会发现使用电子菜单技术让回头客概率不少。
    这是我们经济学大数据的研究方法,论文读起来的话比较难懂,大家可以看它结论,经济学家有一个问题,总是有两派,有人说降息好,有人就说降息不好,大家结合自己实际,结合自己数据分析。我这个人职业生涯都是靠数据分析的,很惭愧的是我自己没有什么实践的经验,我所有的知识都是来源于数据分析的。我会认为数据分析对每个人都很重要,我们昨天碰到很多企业家,他们自己都有很多分店,看到销量增长了,凭经验到底是哪个原因是导致销量增长,分店经验没有你的学识经验和水平,单凭自己的经验是判断错的,还是对你自己的数据有一个监控,这样才能帮助你做出比较好的判断。
    这是我今天给大家分享的内容,谢谢大家!