光辉数据中心股份有限公司首个数据中心的投入使用,标志着光辉集团对旗下校内网、美团网、土豆网、YY直播、光辉微博等公司的数据分析能力进入到一个全新的阶段。
按照江辉对光辉数据中心股份有限公司的希望,这家公司将聚焦于自建数据中心,为集团各公司提供数据存储服务。然后进行大数据的分析和研究,同时展开云计算的研发,争取在光辉手机的第二代产品中推出“光辉云”的服务,想必到时候这也会是光辉手机的一大亮点。
到底什么是大数据呢?从定义上来说大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
在江辉看来,大数据技术是具有战略意义的一项前瞻性技术。它不仅在于掌握了庞大的数据信息,同时在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业的基础是拥有庞大的数据信息,但是实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
为了掌握庞大的基础数据,除了像光辉集团这样,旗下各色各样的公司都有,自己积累一大批数据,更重要的获取渠道是通过云计算。
其实,大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心。只不过是江辉提前把这个概念推广来来,并考虑投入实际使用而已。
互联网上的信息可以说是无穷的,如果可以以云计算为代表的技术来支撑,这些原本看起来很难收集和使用的数据将慢慢的开始容易被利用起来了。通过对各行各业的数据的不断分析中,大数据会逐步为人类创造更多的价值。
和光辉集团其他公司不同,未来的光辉数据中心江辉招聘大量的数学系毕业的人员进入公司,为数据分析提供力量。
其实大数据是一直存在于人们的生活中的,只不过这个“大”字在不同的阶段、不同的场合、不同的领域代表了不同的内容。
中科大就从2004年在全国高校中首创“隐形资助”的方式,其实就是对大数据的一种确实营运。
具体操作上,中科大通过校园卡消费数据统计,对每月就餐60次以上,平均每次费用分别在4.0元和3.7元以下的男、女生,发放160元生活补助,每个月有400多名学生受助。
虽然这种数据统计分析还不是十全十美,比如说可能会出现一些女生为了减肥而降低消费金额,导致数据分析出来的部分结果出现偏差。但是,这种趋势是非常好的。
扩展到更大的领域,运用就会更广泛了。
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。啤酒+尿布的数据分析成果就是大数据技术应用的经典案例之一。
还有一个后世更知名很有趣的大数据分析案例。淘宝数据平台显示,购买最多的文胸尺码为B罩杯。B罩杯占比达41.45%,其中又以75B的销量最好。其次是A罩杯,购买占比达25.26%,C罩杯只有8.96%。在文胸颜色中,黑色最为畅销。以省市排名,胸部最大的是新疆妹子。利用这些大数据,很快的就分析出来了全国各地女性的罩杯情况。
大数据对于广告推广、舆论分析、购物、金融等的影响是非常大的。像是光辉集团这种几乎全天朝的网民都是自己旗下某公司或者几家公司的用户,如果能够充分将这些信息利用起来,那么起到的效果将是翻天覆地的。不说别的,单单是精准化的广告营销,就不是一般的竞争对手别的上的。利用大数据之后,也许光辉集团花一千万的广告费,会取得比竞争对手花一个亿还要好的效果。
“闪雨,接下来,你除了把中心放在数据中心的硬件建设上面,在软件开发、数据分析方面也要同时关注,缺了哪块也会影响公司实力的发挥”,江辉说道。
“嗯,我打算招聘自己的分析人员的基础上,同时也和京都大学、帝都理工大学等高校的数学系进行合作,利用他们充分的理论知识和大量的人力资源,实现数据分析水平的快速提升”,闪雨说道。
“你这个主意非常好,高校是一个潜力无限的聚宝盆,只不过现在他们还不知道怎么发挥自己的力量。我们帮他们一把,也是在帮我们自己,实现双方共赢”,江辉说道。
“是啊,我们提供经费,他们进行分析,商业成果和专利归我们公司,学术成就归学校,想必很多数学系的教授都会感兴趣吧”,闪雨说道。
在高校里面,数学系拿经费相对来说是比较难的,至少是没有那些工科专业那么容易。
数学系的工作,更多的是属于基础研究工作,往往不是投入了就有产出,甚至是几年都不会有产出。即使研究出了一些东西,往往也不涉及到专利,很难直接获得收益,所以对于大部分高校的数学系来说,和光辉数据中心合作研究新的数据分析理论其实是一个很不错的合作项目。
扩展开来看,这个研究项目的运用是和商业相结合,各种商业作用需要的算法是不一定相同的,在未来很长时间内,这个项目都会有需求。
“尽快去安排吧,多找几家学校一起搞,不要怕花钱。我们从多个角度一起展开研究”,江辉说道。
光辉集团现在各公司对数据分析的需求都比较高,不管是校内网还是光辉微博,都积累了海量的数据,但是怎么样把这些数据利用起来,目前做的还远远不够好。