
数学建模
文章平均质量分 92
一个人在码代码的章鱼
谢谢大家关注我,定期分享笔记
展开
-
机器学习2 (笔记)(朴素贝叶斯,集成学习,KNN和matlab运用)
K - Means 属于无监督学习算法,旨在将数据集中的样本划分为 K 个不同的簇,使同一簇内样本相似度高,不同簇间样本相似度低。随机选择 K 个点作为初始聚类中心,然后将每个样本分配到与其距离最近的聚类中心所在的簇。分配完成后,重新计算每个簇的中心(通常是簇内所有样本的均值)。不断重复样本分配和中心更新步骤,直到聚类中心不再变化或达到预设的迭代次数,此时认为聚类收敛。随机选择 K 个样本点作为初始聚类中心。计算每个样本到 K 个聚类中心的距离,将样本分配到距离最近的聚类中心所在的簇。原创 2025-01-23 20:53:36 · 1285 阅读 · 0 评论 -
机器学习(笔记)(决策树,SVM,随机森林)
例如,在预测一个水果是苹果还是橙子的问题上,若有 100 棵决策树,其中 60 棵树预测为苹果,40 棵树预测为橙子,那么随机森林的预测结果就是苹果。例如,在预测房价的任务中,一个基学习器可能擅长捕捉房屋面积与价格的关系,另一个可能对房屋所在区域的影响把握更准,集成学习能综合二者优势,做出更准确的预测。例如,在初始阶段,所有样本权重相同,当第一个基学习器训练完成后,将预测错误的样本权重增大,这样下一个基学习器在训练时就会更关注这些样本。此外,决策树对数据的小变动比较敏感,可能导致生成的决策树结构差异较大。原创 2025-01-23 20:53:05 · 1141 阅读 · 0 评论 -
粒子群算法 笔记 数学建模
例如,在一个二维平面上寻找函数最小值问题中,每个粒子代表一个可能的解点,粒子根据自身曾经到达过的最优位置以及整个群体目前找到的最优位置来决定下一步往哪个方向移动以及移动多远。速度和位置更新:依据特定公式,结合粒子自身的速度、当前位置与个体最优位置、全局最优位置的距离,更新粒子的速度和位置。惯性权重w体现的是粒子继承先前的速度的能力,Shi,Y最先将惯性权重w引入到粒子群算法中,并分析指出一个较大的惯性 权值有利于全局搜索,而一个较小的权值则更利于局部搜索。设置c1较大的值,会使粒子。原创 2025-01-23 16:18:17 · 1258 阅读 · 0 评论 -
符号变量,方程求导,求积分,方程组求解(matlab代码)
使用随机初始猜测可以帮助找到不同的解,特别是对于具有多个解的方程或方程组,它可以避免总是收敛到同一个解,从而找到更多可能的解。% [z1,z2] = numden(2.5) % 会报错,因为numden的输入变量不能是数值,只能是符号变量。% 在数学分析中,给定函数的定积分的计算不总是可行的,许多定积分不能用已知的积分公式得到精确值。%% 注意,如果diff函数作用的对象不是符号函数,而是矩阵,那么对应的功能是求差分。% 后一列减去前一列求一阶差分, 最后面的2表示在列上进行差分(在行的方向上进行差分)原创 2025-01-22 22:25:20 · 685 阅读 · 0 评论 -
数学规划问题2 .有代码(非线性规划模型,最大最小化模型,多目标规划模型)
例如,在两人零和博弈中,一方的收益就是另一方的损失,每个参与者都试图最大化自己在最坏情况下的收益,即最小化对手可能造成的最大伤害。reshape(x(1:12),6,2) % 将x的前12个元素变为6行2列便于观察(reshape函数是按照列的顺序进行转换的,也就是第一列读完,读第二列,即x1对应x_1,1,x2对应x_2,1)[x,fval] = fmincon(@fun5,x0,A,b,Aeq,beq,lb) % 注意没有非线性约束,所以这里可以用[]替代,或者干脆不写。% 用第一问的结果作为初始值。原创 2025-01-22 14:54:29 · 1352 阅读 · 0 评论 -
数学规划问题1.有代码(线性规划模型,整数规划模型)
它把一个复杂的问题分解为一系列相互关联的子问题,通过求解子问题的最优解来得到原问题的最优解。约束条件是 X(A->j)+X(B->j) =day j (这里的day j 表示j地的日需求量(等式约束)我们的目标函数是min Z=ΣX(i->j)* d(i->j) ,这里的i取A/B,j取[1,6]运筹学的一个重要分支,主要研究在给定的约束条件下,如何优化一个或多个目标函数的数学理论和方法。这里的X(i->j)表示从i运往j的吨数,d(i->j) 表示距离,这里明显是已知的。原创 2025-01-22 14:54:00 · 957 阅读 · 0 评论 -
蒙特卡洛模拟(详细,上手,有例题)
概述:统计模拟方法,是一种以概率统计理论为指导的数值计算方法,通过大量随机样本,去模拟和估计复杂系统或问题的行为与结果。原创 2025-01-21 22:11:24 · 1159 阅读 · 0 评论 -
RACH和GRACH
ARCH和GARCH模型自回归条件异方差,由美国经济学家罗伯特・恩格尔(Robert F. Engle)于 1982 年提出,该模型在金融时间序列分析等领域具有重要的应用,能够有效捕捉数据的异方差性。在传统的时间序列分析中,通常假定随机误差项具有恒定的方差,即同方差性。然而,在许多实际的经济与金融时间序列数据中,如股票收益率、汇率波动等,在现代高频金融时间序列中,数据经常出现波动性聚集的特点,但从长期来看数据是平稳的,即方差(无条件方差)是,但从来看方差是的,我们称这种异方差为。原创 2025-01-21 14:59:39 · 972 阅读 · 0 评论 -
lasso回归和岭回归
岭回归和lasso回归事实上回归中关于自变量的选择大有门道,变量过多时可能会导致多重共线性问题造成回归系数的不显著,甚至造成OLS估计的失效。本节介绍到的岭回归和lasso回归在OLS回归模型的损失函数上加上了不同的惩罚项,该惩罚项由回归系数的函数构成,一方面,加入的惩罚项能够识别出模型中不重要的变量,对模型起到简化作用,可以看作逐步回归法的升级版;另一方面,加入的惩罚项能够让模型变得可估计即使之前的数据不满足列满秩。原创 2025-01-21 13:21:50 · 1135 阅读 · 0 评论 -
降维算法:主成分分析
一种常用的数据分析技术,主要用于数据降维,在众多领域如统计学、机器学习、信号处理等都有广泛应用。主成分分析是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量(即主成分)的方法。这些主成分按照方差从大到小排列,方差越大,包含的原始数据信息越多。通常会选取前几个方差较大的主成分,以达到在尽量保留原始数据信息的前提下降低数据维度的目的。它通过将多个指标转换为少数几个主成分,来实现少数几个变量可以反映出原始的大部分数据的能力(这里的多个指标一般都具有不低的相关性。原创 2025-01-20 23:51:25 · 1068 阅读 · 0 评论 -
降维算法:奇异值分解和图形处理
通过保留较大的奇异值,忽略较小的奇异值,可以在损失较少信息的情况下对数据进行压缩。例如,对于一张图像,可以将其表示为矩阵形式,进行奇异值分解后,只保留前个较大的奇异值及其对应的左右奇异向量,然后重构图像,实现图像数据的压缩。:在基于用户 - 物品评分矩阵的推荐系统中,通过奇异值分解可以对评分矩阵进行分解和重构,填补缺失的评分数据,从而预测用户对物品的喜好程度,为用户提供个性化的推荐。选择部分的特征值,使得我们保留的特征比例达到一定的比例,这样就可以得到一个达到保留了一定比例的,降低了秩的一个m*n的矩阵。原创 2025-01-20 23:50:46 · 822 阅读 · 0 评论 -
聚类问题(K-means,系统聚类,SBSCAN算法)
具体来说,每次迭代时,算法会计算所有类之间的距离,将距离最近的两个类合并为一个新类,这个过程不断重复,直到所有数据点都合并到一个类中,最终形成一棵聚类树。与K-means聚类不同,系统聚类不需要事先确定要划分的类的数量,聚类结果的层次结构可以展示不同粒度下的数据分组情况,用户可以根据实际需求和聚类树的结构来选择合适的聚类数量。:如果存在一条从核心点p到点q的点链,其中链上的每个点都在其前一个点的r-邻域内,且链上的第一个点是核心点,那么称点q从核心点p密度可达。距离越小,数据点之间的相似性越高。原创 2025-01-20 00:54:19 · 1424 阅读 · 0 评论 -
分类问题(二元,多元逻辑回归,费歇尔判别分析)spss实操
分类模型:二分类和多分类:对于二分类模型,我们将介绍和两种分类算法;对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤。原创 2025-01-19 18:24:14 · 1238 阅读 · 0 评论 -
多元线性回归分析
回归分析是一种强大的统计方法,用于研究变量之间的关系,特别是一个或多个自变量与一个因变量之间的定量关系。总结就是研究X和Y之间的相关性的分析。原创 2025-01-18 23:55:52 · 1268 阅读 · 0 评论 -
正态分布检验(JB检验和威尔克检验)和斯皮尔曼相关系数(继上回)
总结:皮尔逊相关系数,首先要检验是否是线性的,然后计算皮尔逊相关系数,如果想要看皮尔逊相关系数是否是显著的,那么就要看其是不是显著的异于0,如果进行假设检验,就要正态分布的数据,那么我们就要先对其进行正态分布的检验(大样本:JB,小样本:威尔克)斯皮尔曼相关系数衡量的是单调关系,包括线性和非线性的单调关系。正常写论文就是写,我们对xxx进行了xxx检验,我们的假设H0和H1是xxxx得出的p是xxx,如果p>0.05我们不拒绝原来的假设,反之,我们拒绝原假设这里的假设是满足正态分布。原创 2025-01-18 14:59:54 · 1040 阅读 · 0 评论 -
相关系数 (带有代码)
相关性系数。原创 2025-01-17 20:39:21 · 1069 阅读 · 0 评论 -
插值算法 (含代码)
插值算法:用于在已知数据点的基础上,估算出这些数据点之间其他位置的数值。数模比赛中,常常需要根据已知的函数点进行数据、模型的处理和分析,而有时候现有的数据是极少的,不足以支撑分析的进行,这时就需要使用一些数学的方法,“模拟产生”一些新的但又比较靠谱的值来满足需求,这就是插值的作用。原创 2025-01-17 11:59:18 · 991 阅读 · 0 评论 -
灰色预测and BP神经网络 (详细上手使用)
在默认设置中,在验证数据集的MSE连续增加六次后,训练停止,最佳模型对应于的最小的MSE。(2)将数据分为训练组和试验组,尝试使用不同的模型对训练组进行建模,并利用试验组的数据判断哪种模型的预测效果最好(比如我们可以使用SSE这个指标来挑选模型,常见的模型有指数平滑、ARIMA、灰色预测、神经网络等)。GM(1,1)是使用原始的离散非负数据列,通过一次累加生成削弱随机性的较有规律的新的离散数据列,然后通过建立微分方程模型,得到在离散点处的解经过累减生成的原始数据的近似估计值,从而预测原始数据的后续发展。原创 2025-01-16 23:50:28 · 1214 阅读 · 0 评论 -
时间序列分析
(在左上角的定义日期和时间中,选择这个问题的周期)这里的是年份和季度,第一个是2014年,第1季度(1)simple模型:使用条件不含有趋势和季节的成分,这里的模型只可以预测一期关于平滑系数α的选取原则:1、如果时间序列具有不规则的起伏变化,但长期趋势接近一个稳定常数,α值一般较小(取0.05-0.02之间)2、如果时间序列具有迅速明显的变化倾向,则α应该取较大值(取0.3-0.5)3、如果时间序列变化缓慢,亦应选较小的值(一般在0.1-0.4之间)(2)霍特线性趋势模型。原创 2025-01-16 16:43:50 · 1223 阅读 · 0 评论 -
灰色关联分析法
一种多因素统计分析方法,主要用于分析系统中各因素之间的关联程度。它基于灰色系统理论,灰色系统是指部分信息已知、部分信息未知的系统。在实际问题中,很多因素之间的关系是复杂的、模糊的,难以用精确的数学模型来描述,灰色关联分析可以在这种情况下发挥作用。引入问题近年来某城市结婚率屡创新低,为了应对“不婚”问题,需要探究由于哪些原因导致年轻人不愿结婚,进而出台相关应对政策让我们从上面的3个指标中,找出最影响结婚对数的指标。原创 2025-01-15 16:44:49 · 751 阅读 · 0 评论 -
topsis(优劣解距离法)分析法
即逼近理想解排序法,一个客观的赋值法一开始我们想按照经费去打分,如果一个学校的经费越多,那么他的评分更靠前这样的结果导致大数据却更少的得分,所以我们重新定义下评分的计算方法那么会得到如下的结果这个就是运用的距离打分法如果需要这么处理,仍然需要我们去把所有的数据都转化为极大型所以topsis的处理步骤。原创 2025-01-15 12:49:27 · 500 阅读 · 0 评论 -
熵权法(变异系数法)
熵权法(变异系数法)一种赋权方法,它根据指标的变异程度来确定指标的权重,变异程度越大,说明该指标所包含的信息量越大,相应的权重也就越大。原创 2025-01-14 23:13:24 · 1410 阅读 · 0 评论 -
模糊综合评价
模糊综合评价法:是一种基于模糊数学的综合评价方法,适用于处理具有模糊性和不确定性的评价问题。比如:高与矮, 长与短,大与小,多与少,穷与富,好与差年轻与年老等。这类现象不满足“非此即彼”的排中律,而具有“亦此亦彼”的模糊性。下面根据一下例题来讲解究竟怎么样算是年轻人。原创 2025-01-14 17:44:22 · 1258 阅读 · 0 评论 -
层次分析法
层次分析法:(AHP)是一种将与决策有关的元素分解成等层次,在此基础上进行和分析的决策方法。以下面的题目为例子:唐僧师徒一行人取经结束后,打算组织一场大乘佛法全国巡回演唱会,但是对于第一场去苏杭、北戴河还是桂林,师徒四人有了分歧……一番讨论后,他们最关心的是以下问题:景色美丽,价格合适,饮食美味,男女比例适中.原创 2025-01-14 14:54:35 · 837 阅读 · 0 评论