FreeRCH- 大数据与人工智能开发框架

        FreeRCH的介绍,如总结了30多个类、200余种算法。以及能使用FreeRCH能带来的效率提升等。(约200-300字) FreeRCH开发框架是DKH(大快Hadoop集成生态环境)的一个组成部分,采用类黑箱框架模式,由36个类共计近200种方法组成的类库,基本可以完成各类大数据和人工智能项目的开发。用户直接调用大快的相关类,即可完成过去复杂的编码工作,有效降低大数据开发难度,减少代码编写量,提高开发效率,降低代码出错率,综合降低10倍以上开发成本,让初级程序员也能开发出一流的大数据应用。FreeRCH框架,由数据源与SQL引擎、数据采集(自定义爬虫)模块、数据处理模块、机器学习算法、自然语言处理模块和搜索引擎模块六部分组成。即可单独部署,也可整体部署,灵活方便。支持JAVA、PHP和.NET三种编程语言。

FreeRCH技术优势

FreeRCH涵盖了对于Hadoop组件操作以及各类算法、服务维护的相关方法。用户不必在终端进行繁琐的命令输入即可完成复杂的操作,减少了代码编写量,带来开发效率的极大提升。
比如FreeRCH的计算中间件和SQL引擎,提供了高效的大数据编程和传统SQL的查询支持,该部分的功能体现,通过FreeRCH的部分类实现。
再比如机器学习类库已随DKH深度集成,属于FreeRCH的组成部分,用户无需再研究复杂的数学理论,有效减少编程难度和出错率。算法库包含以下9种算法类 :逻辑回归、随机森林、支持向量机(还支持矢量网络)、主成分分析、K均值、高斯混合(高斯概率密度函数)、朴素贝叶斯、FP-growth、交替最小二乘法的协同过滤算法。

FreeRCH--核心模块

面对数据库高并发读写的需求,海量数据的高校存储和访问的需求,数据库的高扩展性和高可用性的需求,大数据平台NOSQL数据库可以高效解决以上需求。将海量数据从SQL数据库导入到NOSQL数据库时,以便后期将数据进行数据检索,数据抓取,数据清洗,自然语言处理,机器学习等等。或者将NOSQL数据库里数据导出到SQL数据库时,需要用到我们的工具类DKTransformationData。