创立于2015年的睿帆科技是国内领先的大数据科学平台提供商。
5位创始人,曾就职于阿里巴巴、华为、teradata等一线大数据应用企业,并在大数据领域深耕多年,在海量异构数据的采集和实时分析上有自己的独特见解。
截至目前,睿帆科技在广东、河南、四川、海南、北京、上海、福建、湖北、新疆、辽宁、黑龙江、广西均有业务,业务涉及电信、政府、旅游、安防、安全等行业。服务过的客户包括中国移动、中国联通、中国电信、甘孜旅游、民政部、中国城市规划设计院等多家企业及政府单位。
从数据预处理到模型构建与训练,睿帆科技打造大数据科学平台
睿帆科技自主研发的大数据科学平台名为“europa”,通过该平台,睿帆科技帮助客户做数据预处理(dep),数据的分析和模型构建(aps),为模型的运行提供实时计算的环境(rt),并帮助模型实现生产化,最终落到应用场景中去。
dep数据管理平台,提供数据集成、数据建模、数据质量探查以及数据下发等能力,帮助企业转换原始数据并管理转换后的数据,从而提供高质量、高价值数据。
aps是为企业客户打造的一站式数据分析平台,集数据准备、算法实现、机器学习和模型开发于一体,能够帮助企业快速构建数据分析应用。其功能模块可分为三大类:
第一,业务分析模板,支持自定义拖拽模块构建大数据分析流程。
第二,数据处理模块,预置常用数据算法和处理模块。
第三,机器学习模块,提供机器学习算法模型,帮助企业提升数据处理效率。
rt,通常情况下指实时计算,而在europa平台下,rt本质上是一个运行模型的环境,同时也为最终模型的生产化提供帮助。针对各类场景的模型通过aps完成构建,需要在一个实时计算的环境下运行。睿帆科技通过“流处理引擎 内存数据库 模型加载管理”的方式,为模型的正常运行提供了理想环境,使分析结果能在实际业务中得到运用。
产品化程度还有提升空间
如上所述,europa作为业内领先的大数据科学平台,已基本实现协助客户完成模型构建和训练的目的。而在后续的产品迭代中,产品化的提高会是发展方向之一。
目前euroa平台在模型构建方面已达到高度产品化(aps),但在前端的数据清洗、转换和加载(dep)和后端的分析结果产品化(rt)上有待提升。
由于各类客户的信息化建设进度不同,导致数据清洗、转换和加载的产品化具有一定难度,所以睿帆科技在对接客户业务系统时,需在etl等方面有更多交互。
分析结果产品化有待提升是因为模型在实时计算环境下完成训练、评估后,如何在实时计算环境下,将分析结果(模型)运用在实际业务中,这部分所需的工作量是比较重的。
两者相较,分析结果产品化的产品化提升难度相对较低,因为业务系统总体来说,是一个有着特定步骤或处理办法的流程,训练模型得出更匹配客户需求的参数,更多的是通过输入尽量多的高质量训练数据来达到。随着睿帆科技对客户业务的理解不断加深,这部分的产品化程度会不断提高。
而在数据清洗、转换和加载方面,实现高度产品化或自动化,还是有着较大难度,目前更多还是通过构建者数据湖的方式提供可供分析人员使用的高质量数据。
着重布局通领域,加强标杆客户获取是未来方向
在客群定位上,睿帆科技倾向于大客户。在重点布局的通信领域,其对大客户的定义主要是三大运营商,至于其他通信企业则属于长尾客户。
由于睿帆科技所提供的europa大数据科学平台,主要是在数采、模型构建和实时计算环境下的运行为客户提供帮助。因此,客户需要具备数据分析能力,只需要几个人的数据分析团队便可确保对于europa的高效运用。而目前定位的通信业大客户,通常都具备此等规模的团队。
从市场切入点来看,考虑到睿帆科技主要输出的是分析结果及其运用,与之相对的是bi和分析软件市场。根据gartner的预测,2017年全球bi和分析软件市场规模将达到183亿美元,预计到2020年,该数字将达到228亿美元。作为bi领域全球增速最快的国家之一,中国市场2017年的规模保守估计可达到20.1亿美元左右,折合人民币接近130亿元。
细数睿帆科技现有客户,运营商客户占据大多数,未来能否在其他领域占据更多的份额,还取决于能否将通信行业的口碑传向其他行业。