其他文档

bookcrossing推荐数据集 评分:

bookcrossing网站的推荐数据集,已经经过预处理,和movielens的数据集格式一致。第一行是用户数、物品数、总打分数,之后每一行是一条打分记录。打分从0-10。可以用于推荐算法的训练。
2018-04-26 上传 大小:16.00MB
立即下载
rar文件
BookCrossing数据集(包含278858个用户对271379本书进行的评分,包括显式和隐式的评分。本数据集主要包含2中文件格式,sql和csv)

BookCrossing数据集(包含278858个用户对271379本书进行的评分,包括显式和隐式的评分。本数据集主要包含2中文件格式,sql和csv)

立即下载
zip文件
基于spark的图书推荐系统 基于大数据的图书推荐 基于模型的协同过滤图书推荐系统 矩阵分解 ALS推荐(最小二乘法) 数据源:BookCrossing (BX) 数据集由 Cai-Nicolas Z

基于spark的图书推荐系统 基于大数据的图书推荐 基于模型的协同过滤图书推荐系统 矩阵分解 ALS推荐(最小二乘法) 数据源:BookCrossing (BX) 数据集由 Cai-Nicolas Ziegler 在 Humankind Systems 首席技术官 Ron Hornbaker 的善意许可下从 Book-Crossing 社区进行为期 4 周的爬行(2004 年 8 月 9 月)收集。 它包含 278,858 名用户(匿名但具有人口统计信息),对 271,379 本书提供 1,149,780 个评分(显式 隐式)。 推荐流程: (1)数据清洗:过滤重复的数据,比如同个书编的书籍信息,评分为0分的不合理信息,将清洗后的数据保存到mysql数据库中 (2)模型训练:从mysql数据库中读取评分数据,通过spark构建模型后填充数据进行模型训练,模型训练后可以保存模型到本地,当有新数据时再重新训练,这个过程可以用采用本地启动spark进行运算也可以将任务提交到spark集群上运算(前提时已搭建好spark集群) (3)数据推荐:为每个用户推荐20本书,并将推荐结果保存到数据

立即下载
zip文件
基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解实现个性化图书推荐-使用BookCrossing数据集,基于spark的图书推荐系统 基于大数据的图书推荐 基于模型的协同过滤图书推

基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解实现个性化图书推荐——使用BookCrossing数据集,基于spark的图书推荐系统 基于大数据的图书推荐 基于模型的协同过滤图书推荐系统 矩阵分解 ALS推荐(最小二乘法) 数据源:BookCrossing (BX) 数据集由 Cai-Nicolas Ziegler 在 Humankind Systems 首席技术官 Ron Hornbaker 的善意许可下从 Book-Crossing 社区进行为期 4 周的爬行(2004 年 8 月 9 月)收集。 它包含 278,858 名用户(匿名但具有人口统计信息),对 271,379 本书提供 1,149,780 个评分(显式 隐式)。 推荐流程: (1)数据清洗:过滤重复的数据,比如同个书编的书籍信息,评分为0分的不合理信息,将清洗后的数据保存到mysql数据库中 (2)模型训练:从mysql数据库中读取评分数据,通过spark构建模型后填充数据进行模型训练,模型训练后可以保存模型到本地,当有新数据时再重新训练,这个过程可以用采用本地启动spark进行运算也可以将任

立即下载
zip文件
Book-Crossing数据集

Book-Crossing数据集是网上的Book-Crossing图书社区的278,858个用户对271,379本书进行的评分,包括显式和隐式的评分。这些用户的年龄等人口统计学属性(demographic feature)都以匿名的形式保存并供分析。这个数据集是由Cai-Nicolas Ziegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的,包含三个表。 ①用户信息数据(BX-Users.csv):用户信息数据展示了用户的基本信息,其数据格式为:"User-ID";"Location";"Age" ②书籍信息数据(BX-Books.csv):数据格式为:"ISBN";"Book-Title";"Book-Author";"Year-Of-Publication";"Publisher";"Image-URL-S";"Image-URL-M";"Image-URL-L" ③书籍评分数据(BX-Book-Ratings.csv) User-ID: 用户标识 ISBN: 书籍标识 Book-Rating: 书籍评分,评分如果是明确的,以1-10分表示。未评

立即下载
zip文件
使用Flask,mysql构建的一个基于书籍,基于协同过滤算法,基于slope one的图书推荐系统+源代码+文档说明

- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------

立即下载
zip文件
Book-Crossing Dataset-数据集

from the Book-Crossing community with kind permission from Ron Hornbaker, CTO of Humankind Systems. Contains 278,858 users (anonymized but with demographic information) providing 1,149,780 ratings (explicit / implicit) about 271,379 books.

立即下载
zip文件
基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解,基于BookCrossing数据集精准推荐,基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解,基于BookCros

基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解,基于BookCrossing数据集精准推荐,基于Spark与大数据的图书推荐系统:利用ALS协同过滤与矩阵分解,基于BookCrossing数据集实现精准推荐,基于spark的图书推荐系统 基于大数据的图书推荐 基于模型的协同过滤图书推荐系统 矩阵分解 ALS推荐(最小二乘法) 数据源:BookCrossing (BX) 数据集由 Cai-Nicolas Ziegler 在 Humankind Systems 首席技术官 Ron Hornbaker 的善意许可下从 Book-Crossing 社区进行为期 4 周的爬行(2004 年 8 月 9 月)收集。 它包含 278,858 名用户(匿名但具有人口统计信息),对 271,379 本书提供 1,149,780 个评分(显式 隐式)。 推荐流程: (1)数据清洗:过滤重复的数据,比如同个书编的书籍信息,评分为0分的不合理信息,将清洗后的数据保存到mysql数据库中 (2)模型训练:从mysql数据库中读取评分数据,通过spark构建模型后填充数据进行模型训练,模型

立即下载
zip文件
BookCrossing

这个数据集是网上的Book-Crossing图书社区的278858个用户对271379本书进行的评分,包括显式和隐式的评分。这些用户的年龄等人口统计学属性(demographic feature)都以匿名的形式保存并供分析。这个数据集是由Cai-Nicolas Ziegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的。

立即下载
7z文件
Book-Crossing 图书评分数据集.7z

Book – Crossing Dataset 是由 Book – Crossing 社区的 278858 名用户的评分组成,其包含约 271379 本书的 1149780 条评分数据,该数据集包含 3 个分类。 BX-用户 包含用户信息,其中用户 ID 已被匿名化并映射到整数,除了包含人口统计数据的部分,其余字段均包含 NULL 值。 BX-书籍 包含书本的 ISBN 标识,除此之外,还提供了作者、出版年份、出版社等基于内容的信息,在拥有多位作者的情况下,仅提供第一作者;并且该数据集提供了链接到封面图像的 URL,相关链接直接指向 Amazon 网站。 BX-书本评级 包含图书评分信息,其中评级分为明确、从 1 – 10 表示和用 0 表示的隐含值。 该数据集由德国自由堡大学于 2005 年发布,相关论文有《Improving Recommendation Lists Through Topic Diversification》。

立即下载
zip文件
PADKK1805_preprocessed.csv-数据集

2020 PADKK五月预处理数据 1805_preprocessed.csv

立即下载
rar文件
推荐系统数据集

推荐系统的常用数据集,包括eachmovie和Book Crossing

立即下载
zip文件
Book Crossing 推荐系统数据数据集

Book Crossing 是一个书籍推荐系统数据,用以向用户推荐偏好的书籍。

立即下载
zip文件
BookCrossing数据集(包含sql和csv两种格式的文件)

BookCrossing数据集包含278858个用户对271379本书进行的评分,包括显式和隐式的评分。本数据集主要包含2中文件格式,sql和csv,方便不同需求的用户使用。

立即下载
zip文件
bookcrossing

Book-Crossing数据集,包含图书社区的278858个用户对271379本书进行的评分,包括显式和隐式的评分。

立即下载
zip文件
机器学-一个基于Book-Crossing数据集的 单一过滤 方法的图书推荐系统+源代码+文档说明

机器学习[推荐系统] 基于Book-Crossing Dataset数据集 由于当中的数据集对书本的主题没有挖掘下来,所以参数特征以年龄层为特征,将来找到更好的数据将会更改特征 语言采用nodejs(javascript) 针对Andrew NG机器学习教程 lecture17推荐系统的小成品 - -------- <项目介绍> 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 -------- ---------------------------------------

立即下载
zip文件
Recommendation-System---Book-Crossing-Dataset:基于基于用户和基于项目的协作过滤方法的建书推荐系统

推荐系统-图书交叉数据集 基于基于用户和基于项目的协作筛选方法构建推荐系统。 翻书 翻书数据集是对图书的用户评分的集合。 它带有显式评分(1-10星)和隐式评分(用户与书进行了互动)。 数据由IIF的Cai-Nicolas Ziegler汇编,可在找到。 Ziegler等人提供了有关数据的更多信息: Improving Recommendation Lists Through Topic Diversification. Cai-Nicolas Ziegler, Sean M. McNee, Joseph A. Konstan, Georg Lausen; Proceedings of the 14th International World Wide Web Conference (WWW '05), May 10-14, 2005, Chiba, Japan. To appear.

立即下载
zip文件
基于Spark的大数据分析与ALS算法构建图书推荐系统全流程解析

内容概要:本文详细介绍了如何利用Spark及其MLlib库中的ALS算法构建一个高效的图书推荐系统。首先,针对BookCrossing数据集进行了全面的数据预处理,包括去除无效评分、ISBN标准化以及数据去重等步骤。接着,在清洗后的高质量数据基础上,采用ALS算法进行模型训练,优化关键参数如rank、最大迭代次数和正则化参数等,确保模型既能快速收敛又能保持良好的泛化能力。此外,为了提高用户体验,文中还探讨了如何将推荐结果高效存储于MySQL数据库中,并通过SpringBoot搭建了一个借阅管理平台,实现了用户行为触发下的增量模型更新机制。最后,作者分享了一些实践经验,如避免集群OOM错误、合理设置资源限制等。 适合人群:对大数据处理、机器学习尤其是推荐系统感兴趣的开发者和技术爱好者。 使用场景及目标:适用于希望深入了解如何运用Apache Spark处理大规模数据集并构建个性化推荐引擎的研究人员或工程师。通过学习本文,读者能够掌握从数据准备到模型部署的一系列技能,从而应用于实际项目中。 其他说明:文中提供了完整的代码片段作为参考,帮助读者更好地理解和复现实验过程。同时提醒读者关注数据质量和模型调参的重要性,这对于最终推荐效果有着至关重要的影响。

立即下载
zip文件
Book-Crossing 图书评分数据集

# README ## 关于超神经 Hyper.AI 超神经 Hyper.AI(https://hyper.ai)是科技实验媒体,专注报道人工智能与其适用场景。致力于推动中文领域对机器智能的认知与普及,探讨机器智能的对社会的影响。超神经为提高科研效率,提供大陆范围内最快最全的公开数据集下载节点、人工智能百科词条等多个产品,服务产业相关从业者和科研院所的师生。 ## 关于数据集 - 数据集名称:Book-Crossing - 发布机构:德国自由堡大学 Albert-Ludwigs-University Freiburg - 网址:http://www2.informatik.uni-freiburg.de/~cziegler/BX/ - 大小:0.0506 GB - 简介:Book-Crossing数据集是来自 Book-Crossing 社区,278,858 位用户提供的约 271,379 本书的 1,149,780 个评分组成的数据集。Book-Crossing数据集包括3个表。 BX-用户 包含用户。请注意,用户ID(User-ID)已被匿名化并映射到整数。提供人口统计数据(“位

立即下载
热门资源标签
Global site tag (gtag.js) - Google Analytics