天弘基金:余额宝情绪指数里的大数据秘密

当下热门的大数据应用是以分析场内交易数据和如何选股为主,对投资者情绪的研究不足。近期引发市场关注的是,天弘基金所编制的余额宝情绪指数,通过对余额宝资金流入股市的数据进行挖掘,能刻画出散户入市意愿,值得一提的是,该指数与官方银证转账数据相关性高达0.9。余额宝情绪指数的背后到底有着哪些秘密,可以如此高度准确地反映市场整体散户的投资情绪?
 
与银证转账相关性高达0.9
 
投资者情绪对投资决策、风险管理和市场监管等具有重要意义,场内资金的流入流出直接影响股市的流动性。
 
 然而由于散户数量多且分散,对这部分群体的行为很难做出精准判断。目前衡量市场整体散户资金流入流出量变化的官方数据是银证转账数据,由中国证券投资者保护基金每周公布一次。
 
经过测算,天弘基金编制的余额宝情绪指数与银证转账数据的相关系数高达0.9,可见该指数高度反映了全市场入市资金量变动,自然也可以在一定程度上代表整体散户参与股市的意愿。值得一提的是,天弘基金的余额宝情绪指数是日级高频指数,每个交易日更新一次,查询更加方便快捷。
 
海量靠谱数据,每秒亿级处理能力
 
余额宝情绪指数的准确性依托于天弘基金对余额宝大数据资源的深度开发和利用,整体来看,余额宝拥有五大核心资源优势,分别是用户、交易、存储、计算和挖掘。
 
截至2015年6月底,余额宝的用户人数达到2.26亿,相当于每6个中国人当中就有一个人是余额宝用户,从各个维度来看,这些用户涵盖了各种类型的投资者。余额宝用户基本覆盖了全国的各个民族、各个地域、各个职业、各年龄阶段。广泛的数据采集使其毫无疑问具有很强的代表性。2.26亿的用户,每个人的每个投资行为都会产生相应数据,这些数据正是构成余额宝情绪指数准确性的基础。
 
随着余额宝功能的日益丰富,余额宝用户已经发展到具有转账、购物,消费,信用卡还款,购买金融理财产品等各种行为,兼具电商属性、社交属性和金融属性。余额宝情绪指数的编制方法就是基于余额宝的业务场景,筛选出用户直接或间接进入股市的资金,在剥离IPO、节假日等影响后,对数据进行标准化指数构建,从而确保编制的科学性。
 
从数据的储存量和处理能力来看,余额宝累积交易金额已达到十万亿级,累积交易笔数百亿级,储存的核心交易数据超140TB。天弘基金大数据中心采用阿里云作为底层架构,使用RDS、ECS、OSS、ODPS等云产品搭建大数据架构,为海量数据高效快速的计算提供了可靠的保障。目前,天弘基金大数据中心,356秒可处理360亿条数据,平均1秒即可处理1亿条信息。这样的计算能力,在金融行业乃至互联网行业,均处于领先水平。
 
目前,天弘基金大数据分析中心团队超过10人,平均年龄只有27岁,既有来自微软、TERA DATA的IT高手,也有来自私募曾有过高频交易、量化投资的金融人才,还有通过创新渠道招到的应届精英。正是这样一支年轻的精英队伍,在为市场提供最新的前沿数据。
来源: 
天弘基金
余额宝指数类型: