Ruikey🥝
Yelp数据集数据分析
Yelp数据集数据分析数据说明 business_id门店ID Date 日期 Rating 评分 Content 评价内容 Review_auther 点评作者 Review_image 点评插图 Reactions 互动 Replies 回复 review_order 点评序号(针对同一家店) Eelite_status 表示点评作者是否具有elite标识 check-in_status 表示点评作者是否在门店办理了入住手续 business_name 被点评的门店名称 123456import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom wordcloud import WordCloudimport matplotlib 123# 设置matplotlib字体为SimHeimatplotlib.rcParams['font.family'] = 'Si ...
数学建模国赛赛题总结
一、近年赛题学习总结 年份 题目 模型算法 2018A 高温作业专用服装设计 单、双目标规划、偏微分方程、模拟退火算法 ==2018B== ==智能RGV的动态调度策略== ==双目标规划、0-1规划、贪心算法、动态调度模型== 2018C 大型百货商场会员画像描绘 RFMT模型、K-means聚类 2019A 高压油管的压力控制 目标规划模型、微分方程模型、差分法 2019B “同心协力”策略研究 欧拉刚体旋转定理、模拟退火算法、动力学方程、二阶微分方程 ==2019C== ==机场的出租车问题== ==目标优化,排队论,蒙特卡洛模拟== 2020A 炉温曲线 热传导方程、差分法、多目标规划、模拟退火算法 2020B 穿越沙漠 蒙特卡洛模型、动态规划、博弈论、马尔可夫链 ==2020C== ==中小微企业的信贷决策== ==Bp神经网络、主成分分析、遗传算法、多目标规划== 2021A ”FAST“主动反射面的形状调节 反射面板调节优化模型、BFGS 算法、蒙特卡洛积分算法 2021B 乙醇偶合制备C4烯烃 多元回归模型、BP神经 ...
MovieLens 1M数据集数据分析
MovieLens 1M数据集这个数据集是电影评分数据:包括电影评分,电影元数据(风格类型,年代)以及关于用户的人口统计学数据(年龄,邮编,性别,职业等)。 MovieLens 1M数据集评分,用户信息,电影信息。 1234import pandas as pdimport chardetimport matplotlib.pyplot as pltimport numpy as np 12# Make display smallerpd.options.display.max_rows = 10 123456unames = ['user_id', 'gender', 'age', 'occupation', 'zip']users = pd.read_table('C:/Users/28696/Desktop/人工智能/ml-1m/users.dat', sep='::', header=None, ...
RBM模型研读笔记
论文笔记:Restricted Boltzmann Machines for Collaborative Filtering摘要 目前存在的大多数协同过滤算法都不能解决大量数据集对应的矩阵运算,本文中展示了两层的无向图模型,即RBM,可以用来建模表格数据,比如用户评级。我们给出了高效的算法,证明了它在很大的数据集上可以运行。同时,还证明了它比SVD的性能略好。当RBM和SVD组合时,可以获得6%的性能提升。 绪论 协同过滤的一个常用方法是矩阵分解。假如用NM的矩阵来表示N名用户评价M个电影,那么NM矩阵可以写为NC的矩阵和CM的矩阵的乘积,其中前者是用户矩阵,后者是电影矩阵,C是主题的个数。 通常来说,这一过程通过奇异值分解(SVD)来完成。但大规模的数据集通常面临着矩阵过于稀疏的问题,这使得奇异值分解变得很难进行。本文中提出了RBM的解法。而且通过CD-k采样,可以使RBM算法精确又高效。 受限玻尔兹曼机(RBM) 我们要训练的是一个RBM。假如所有N个用户都评价了M个电影,那么就可以把每个用户看作一个单独的训练样本,玻尔兹曼机有M个可视节点和若干隐藏节点。现在的问题是矩阵是稀疏的, ...
NCF论文研读笔记
NCF论文研读笔记随着近些年来深度学习的发展,在推荐系统方面,越来越多的推荐模型是基于神经网络来解决推荐问题,但这些模型主要使用它来模拟辅助信息,例如项目的文本描述和音乐的声学特征。而在对协同过滤的关键因素——用户和项目特征之间的交互进行建模时,大部分工作仍然采用矩阵分解(matrix factorization),并对用户和项目的潜在特征应用内积(inner product)。 NCF模型与传统的矩阵分解的不同在于,NCF对分解之后获得的隐向量不再是简单地进行内积操作,而是考虑更为复杂的内积形式,并利用多层感知机,对用户-物品交互信息进行深入地学习,从而获取更好的结果。 1. MF模型MF模型(矩阵分解模型)的实现思路是通过对由n个用户和m个物品组成的用户-物品评分矩阵进行分解,将整体评分矩阵分解为两个矩阵的乘积,其中一个矩阵的大小为nk,另一个矩阵的大小为km,这两个矩阵中的维度k表示潜在空间维度。接着对于第i个用户对第j个物品的喜爱程度评估问题,可以利用第一个矩阵中的第i个用户的k维向量与第二个矩阵中第j个物品的k维向量进行内积,计算得到具体的喜爱程度: 其中,向量pu表示用 ...
KNN和K-means算法
KNN和K-means算法区别 KNN K-means 目标 目标是为了确定一个点的分类 目标是为了将一系列点集分成k类 算法类别 分类算法 聚类算法 学习类型 监督学习,类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类 非监督学习,事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习 训练数据集 训练数据集有label,已经是完全正确的数据 训练数据集无label,是杂乱无章的,经过聚类后才变得有点顺序,先无序,后有序 训练过程 没有明显的前期训练过程 有明显的前期训练过程 K值结果 K值确定后每次结果固定 K值确定后每次结果可能不同,从 n个数据对象任意选择 k 个对象作为初始聚类中心,随机性对结果影响较大 时间复杂度 O(n) O(nkt),t为迭代次数 K-最近邻算法(KNN)介绍K 最近邻(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓 K 最近邻,就是 K 个最近的邻居的意思,说的是每个样本都可 ...
avatar
🐟认真摸鱼中
Ruikey🥝
Welcome to my blog! 🍭🍭🍭
前往小窝🍭
公告栏
欢迎来到我的博客🥝
小站资讯
文章数目 :
7
本站总字数 :
2w
本站访客数 :
本站总访问量 :
最后更新时间 :
空降评论复制本文地址
随便逛逛昼夜切换关于博客美化设置切换全屏打印页面