AI加持推荐系统 英特尔助力万事达卡智能服务变革(2)

2019-10-07 13:16 本站 区商

· 对于深度学习方法,基于最新的研究和行业实践,选择神经协同过滤(NCF)和宽深(WAD)模型作为推荐的两个候选模型。来自Analytics Zoo的Keras风格API也被用于用python和scala构建深度学习模型。

AI加持推荐系统 英特尔助力万事达卡智能服务变革

图为将年度学习模型与ALS模型进行比较

模型阐述:

神经协同过滤模型旨在作为开发推荐服务深度学习方法的指导,以捕捉用户和物品之间的非线性关系。由于存在大量未观察到的实例,NCF采用负抽样来减小训练数据量,显著提高了学习效率。传统的矩阵分解可以看作是NCF的一个特例。使用Analytics Zoo,用户可以轻松构建NCF模型,如图所示。

AI加持推荐系统 英特尔助力万事达卡智能服务变革

神经协同过滤(NCF)模型示例

宽深(WAD)模型中,宽分量是一个单层感知器,它是一个广义线性模型,深部分量是类似于NCF的多层感知器。

结合这两种学习技术,推荐系统可以捕获记忆和泛化。在这种情况下,Merchant ID和其他特性用于生成宽模型的交叉列。

AI加持推荐系统 英特尔助力万事达卡智能服务变革

宽深模型图

WAD模型使用Sparse Tensor,以及为稀疏数据计算明确设计的一些的层,例如Sparse Linear, Sparse Join Table等。AnalyticsZoo支持Data Frame和弹性分布式数据集(RDD)两种接口,用于数据准备和训练,为不同场景提供灵活性,允许Spark 1.5兼容到最新版本。

模型评估

利用Spark MLlib ALS的评价工具,NCF和WAD实现的推荐器用下列指标进行测量。

· ROC曲线下面积(ROC AUG)

· 精确度与召回率曲线下面积(PR AUC)

· 精准度与召回率

· 每位客户排名前20位的精准度

为了与传统的矩阵分解算法相比,在SARS2.2.0上的ALS训练采用了相同的数据和优化参数。相比之下,深度学习模型比ALS模型有显著的改进,如下表所示。

AI加持推荐系统 英特尔助力万事达卡智能服务变革

英特尔至强可扩展处理器提供强大核心

AnalyticsZoo是基于英特尔开源的一个统一Analytics+AI平台,它将Spark、TensorFlow、Keras和BigDL程序无缝集成到一个整合的流水线中,通过英特尔® 至强® 可扩展处理器集群支持,可以将这些功能扩展到大型Apache Hadoop/Spark集群中,为企业提供更加强大的深度学习能力。

作为一个在Spark上本地运行的集成分析和人工智能平台,Analytics Zoo可以满足企业深度学习应用程序的标准要求。它能够分析存储在同一大数据集群上的大量数据,并将深度学习功能添加到现有的分析应用程序和机器学习流水线中,而不是重建。

AnalyticsZoo可以帮助企业利用现有的大数据集群和基础设施,实现合理的资源分配,负载管理和企业级监控。同时,由于Analytics Zoo是作为英特尔至强处理器上的标准Spark程序运行,因此部署或操作成本为零。此外,传统的机器学习(ML)方法要严重依赖于人机学习专家来优化模型,而Analytics Zoo提供了更多选项来找到一个最佳稳健的执行配置,可以自动进行模型优化。

AnalyticsZoo平台的实力,在于英特尔至强可扩展处理器提供的强大内核。

英特尔® 至强® 可扩展处理器专为数据中心现代化革新而设计,它能提高各种基础设施、企业应用及技术性计算应用的运行效率,进而改善总体拥有成本(TCO),提升用户的生产力。与上一代相比,基于英特尔® 至强® 可扩展平台构建的系统着力打造性能更强的敏捷服务和突破性功能。

值得一提的是,在全新一代英特尔® 至强® 可扩展处理器中,针对人工智能技术,英特尔做了多方面的系统增强,为人工智能提供了更广泛的通用平台。

借助英特尔® 至强® 可扩展平台,企业在推进各自数字计划时可以得到充分的能力支持,为功能强大的数据中心平台奠定坚实的基础,共同构建数字智能的全新时代。

收藏 举报

延伸 · 阅读