自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2078)
  • 资源 (7)
  • 收藏
  • 关注

原创 自然语言处理初学者指南

对于初学者来说,自然语言处理的发展历史非常有必要了解,通过梳理历史发展,我们可以清楚技术脉络,从而有助于我们对于这门技术的整体有宏观认知。本文就是要梳理该技术的发展过程,呈现给初学者。

2025-03-12 18:43:48 638

原创 隐性狄利克雷分布 (LDA) 算法简述

关于主题模型中,主要的数学理论是“潜在狄利克雷分布”,那么“潜在狄利克雷分布”是如何工作的呢?本篇作为简单直观的入门教程,展示给读者。

2025-03-12 13:18:07 691

原创 深度学习的正则化深入探讨

在训练机器学习模型时,模型很容易过拟合或欠拟合。为了避免这种情况,我们在机器学习中使用正则化来使模型正确地拟合到我们的测试集。正则化技术有助于减少过拟合的可能性,并帮助我们获得最优模型。

2025-03-01 23:53:56 692

原创 均值与标准差、标准误的关系

本文介绍基本的统计学概念,标准差和标准误,此两个概念都与均值期望有一定联系,但它们之间本质上是不同的。

2025-03-01 21:44:33 1080

原创 构建一个视觉Transformer 模型

基于自我注意的 transformer 模型由 Vaswani 等人在 2017 年的论文 Attention Is All You Need 中首次提出,并已广泛用于自然语言处理。transformer 模型是 OpenAI 用于创建 ChatGPT 的模型。Transformer 不仅适用于文本,也适用于图像,基本上也适用于任何顺序数据。本文将介绍视觉transformer 模型如何构建。

2025-02-27 10:24:25 872

原创 共形预测理论解释

在这篇文章中,我们将了解共形预测的基本理论,这是一种强大的算法,允许数据科学家量化预测模型的不确定性并设置理想的误差阈值。

2025-02-17 12:43:00 741

原创 Python 中从零开始的随机梯度下降

想象一下,在一个雾蒙蒙的早晨,你试图找到山谷中的最低点——你迈出的每一步都像是在猜测地形。在机器学习的世界中,这种 “猜测” 过程正是优化算法的作用 — 它们调整模型的参数以找到最佳结果。这就是SGD。

2025-02-17 12:15:14 1103

原创 联合概率:定义、公式和示例

概率是指事件发生的可能性。但是当涉及两个变量时,您可能具有联合概率。这是一个统计度量值,可以告诉您两个独立的事件是否可能同时发生。对于使用它来确定两组变量之间关系的统计学家来说,它是一个重要的指标

2025-02-16 23:07:21 786

原创 ML 系列数学: 联合分布、 边际分布和条件分布

在深入研究协方差和相关性的复杂性之前,首先了解联合分布、边际分布和条件分布的概念很重要。这些基本概念为完全掌握多个随机变量之间的关系和交互提供了必要的背景知识。通过理解这些基本概念,我们可以更好地解释和分析机器学习和统计分析中变量之间的协方差和相关性。

2025-02-16 22:51:02 983

原创 图神经网络简介

本文介绍了GNN网络一些要素,其中与CNN进行过一些对比,并且对GNN的一些统计原理进行介绍。

2025-02-14 23:44:49 622

原创 概率问题之两个男孩问题

在概率问题中有很多有趣问题,也有些问题是很困惑无从下手的这里列出"两个男孩家庭的问题",试看如何分析和解决。

2025-02-14 21:59:58 748

原创 要避免这样的 Python 函数!!

我偶然发现了某人写的一个 Python 函数,虽然是功能实现了,但是,过上几周,即使编写者也不好回答这段代码的意义。好了,先举出“恶手”的范例,然后给出良好的修改。

2025-01-27 22:31:17 572

原创 关联传播和 Python 和 Scikit-learn 实现

假设您有一个数据集,其中各个样本之间存在关系,您的目标是识别数据集中的相关样本组。聚类是无监督机器学习算法的一部分,可能是要走的路。但是,当您并不真正知道聚类的数量时,应该应用哪种聚类算法呢?

2025-01-27 12:46:46 1484 1

原创 掌握机器学习中的优化:关键概念和技术解释

对于初学者来说,优化器是否能够构成深刻映像呢?你能否说清梯度下降对二次多项式的意义呢?本文将补充这些概念。

2025-01-12 22:46:28 885 1

原创 Magentic-One、AutoGen、LangGraph、CrewAI 或 OpenAI Swarm:哪种多 AI 代理框架最好?

生成式人工智能中的多人工智能代理主题正在升温,各大科技巨头都围绕它发布了一些框架。但是该选择哪种多人工智能代理框架呢?他们实在太多了!!随着 OpenAI 发布 Swarm 和微软的 Magentic-One,这个领域变得非常混乱。因此,为了消除任何疑问,我将尝试解释每个框架的主要功能、优缺点,让您决定哪个最适合您。我们将讨论

2025-01-07 23:25:59 1263

原创 条件期望窥探

条件期望是概率论的高级理论部分,很抽象难懂,而一旦学会使用,那么对于一些高级的贝叶斯理论模型就能够灵活实现。本篇是从诸多国外教材中整理汇编的论文。

2025-01-06 20:24:56 80

原创 在大型语言模型LLM中使用私有数据

随着 2023 年大型语言模型的大规模兴起,许多“基于对话”的服务应运而生,使用户能够通过自然对话与数据和其他产品进行交互。我们现在处于一个 LLM 改变我们与各种数据和信息交互方式的时代。筛选无尽的搜索结果或解读复杂的用户界面的日子已经一去不复返了;现在,您只需要自然语言就可以开始探索。

2025-01-05 12:24:27 1555 1

原创 使用强化学习训练神经网络玩俄罗斯方块

​在 2024 年暑假假期期间,Tim学习并应用了Q-Learning (一种强化学习形式)来训练神经网络玩简化版的俄罗斯方块游戏。在本文中,我将详细介绍我是如何做到这一点的。我希望这对任何有兴趣将强化学习应用于新领域的人有所帮助!

2025-01-05 12:17:13 1306 1

原创 两种分类代码:独热编码与标签编码

当你深入研究机器学习时,你遇到的第一个障碍就是如何处理非数字数据。这就是编码的作用所在——将分类数据转换成机器学习算法可以理解的东西。但问题是:并非所有编码都是平等的。

2025-01-01 19:52:52 1270

原创 在docker上通过几行代码可设置 Kaggle 环境

使用深度学习前,我认为最好先提一下如何正确设置一个包含我们想要的大多数库的环境。当你进入数据科学的竞争领域时,大多数人都会遇到Kaggle。

2024-12-31 15:39:11 1249

原创 回归问题的等量分层

在同一个数据集中,我们可以看成是一个抽样体。然而,我们如果将这个抽样体分成两份,每一份依然保留他们的分布(将一个抽样集合合理地分成两个抽样集合),这是我们在训练中经常需要的。在本文中,我将尝试举例说明如何在保留分布比例的情况下对回归问题进行分割。让我们从基础开始。

2024-12-31 15:26:32 955

原创 在异常检测中利用分布统计python实现

异常检测是识别数据中不符合预期行为的罕见或异常模式的过程。异常检测的应用范围涵盖各个行业,从欺诈检测到识别制造设备中的故障,甚至发现医疗保健数据中的异常情况。为了有效地检测这些异常,我们可以利用统计特征来突出显示与预期状态的偏差。

2024-12-30 20:50:22 624

原创 K-means 聚类:Python 和 Scikit-learn实现

虽然深度学习算法无疑是当今最流行的机器学习算法,但还有更多算法。聚类是一种机器学习,您不需要向模型提供训练集,而是尝试在运行时从数据集中得出特征,以便以不同的方式构造数据集。它属于无监督机器学习算法。

2024-12-30 13:21:19 1812 2

原创 C++ 与 Python(静态类型语言与动态语言)

Python和C++到底有啥区别?在使用的时候有啥特殊的益处?这种问题的意义在于:如果对语言了解越清楚,越能够更加大胆地应用哪些极限功能,从而最大限度地发挥语言优势。这不是区区几句话能说清楚的。这里将对这个问题给以澄清。

2024-12-29 16:05:15 1126

原创 关于方差分析的一览

方差分析这个方法,直接指向:多类别、多属性的表格对比问题。其中包含类间距离和类内距离的比较。本篇将叙述其中的一些概念。

2024-12-29 11:06:10 991

原创 集成技术综合指南:Bagging 和 Boosting

在机器学习中,集成技术是一种强大的方法,它可以结合多种模型的预测来提高准确性、减少方差并增强对未知数据的泛化能力。集成方法不依赖于单一模型,而是利用多种模型的综合能力来做出更稳健的预测。两种最流行的集成技术是bagging和boosting,这两种技术都被广泛用于提高模型(尤其是决策树)的性能。

2024-12-28 16:40:27 1367

原创 深度学习架构1:LeNet

这是最基本的深度学习框架,最早是对手写支票进行识别,该网络是完整的深度学习基础,对于零基础学员有很大帮助。

2024-12-28 01:50:20 426

原创 如何使用 Tweepy (Python) 从 Twitter API 访问数据

Twitter API 允许您做很多事情,包括检索推文数据。为了访问这些数据,您需要一个开发者帐户。使用 Twitter API 应该很容易,但有时图片和简单的代码可以为您省去一些麻烦。

2024-12-27 17:57:27 798

原创 理解有放回和无放回抽样 (Python)

概率的模型很重要,比如有放回抽样和无放回抽样,这两个模型都拥有很强实用型,绝不能说说就算了,而是用程序如何实现的问题。本教程将深入探讨有放回和无放回抽样,并涉及这些概念在数据科学中的一些常见应用。与往常一样,本教程中使用的代码可在我的GitHub上找到。让我们开始吧!

2024-12-27 17:32:03 1121

原创 了解反向传播算法

梯度正向和反向传播,是神经网络的重要概念。其中包含的重要技巧是:1)复函数的导数,2)矩阵导数。3)梯度传播的意义。本文将叙述相关内容。

2024-12-24 18:34:15 735

原创 关于Z检验的一切

假设检验属于推论统计。在假设检验中,我们从样本数据中得出关于总体数据的结论。

2024-12-24 16:13:07 909

原创 ML 系列:第 40 节 — 最大似然MLE 的简单问题

最大似然估计 (MLE) 是统计学和机器学习中用于估计概率模型参数的基本技术。在本文中,我们将介绍一个使用 MLE 估计正态分布参数的简单示例。我们将使用 Python 进行实现和可视化。

2024-12-21 23:25:49 457

原创 ML 系列:第 41节 - 假设检验简介

在我们这个数据驱动的世界里,决策通常基于数据。假设检验在这个过程中起着至关重要的作用,无论是在商业决策、医疗保健领域、学术界还是质量改进的背景下。如果没有明确的假设和严格的假设检验,就有可能得出错误的结论并做出次优的决策。

2024-12-21 23:20:17 966

原创 最大似然估计 (MLE) 和最大后验估计 (MAP) 背后的直觉

在数据分析中,分析师不同,给出的方案也不同,这就导致对同一事务的分析,都是“正确”的,但精致程度不同,因而导致性能上的差异。本文将对不同水平的分析(MLE和MAP)进行对照,让读者自行理解其中的奥妙。

2024-12-19 15:03:27 1474

原创 最大似然是什么?

在谈最大似然性之前,需要理解他们的应用条件,首先,人类所掌握的概率模式并不多,而在这有限个的分布模式中,选择某个可能与客观现象对应起来做为理论模型,这是第一步。第二步是实现该模型的参数设定,尽可能和客观现象吻合,这就是参数的最大似然估计。

2024-12-19 12:46:41 317

原创 复杂网络系列:第 4 部分 - 使用 NetworkX 进行网络分析

在本节中,我们将使用 NetworkX 探索基本的网络指标。这些指标有助于我们了解节点的重要性、网络的结构以及其中的各种动态。让我们深入研究中心性度量、聚类系数和平均路径长度。

2024-12-16 20:59:29 762

原创 掌握特征提取:机器学习中的 PCA、t-SNE 和 LDA模型

与 PCA(主成分分析)相比,这是一种更好的降维技术。t-SNE,即 t 分布随机邻域嵌入,是一种通过将高维数据降低到低维空间(通常是二维或三维)来实现可视化的统计方法。这使得数据的可视化和解释变得更加容易,特别是在处理机器学习和数据科学等复杂数据集时。

2024-12-16 13:25:49 1130 1

原创 预测概率解释:面向初学者的带代码示例的视觉指南(二)

分类模型不仅会告诉你它们认为的答案是什么,还会告诉你它们对答案的确定程度。这种确定性以概率分数表示。高分表示模型非常有信心,而低分表示模型对其预测不确定。本篇接续上文:

2024-12-16 12:10:54 695

原创 预测概率解释:面向初学者的带代码示例的视觉指南(一)

分类模型不仅会告诉你它们认为的答案是什么,还会告诉你它们对答案的确定程度。这种确定性以概率分数表示。高分表示模型非常有信心,而低分表示模型对其预测不确定。

2024-12-15 17:25:08 673

原创 循环调度算法

在上一篇文章中讨论了最短作业优先 (SJF) CPU 调度算法的两个版本:抢占式和非抢占式,并提供了它们在 C 语言中的实现链接。今天,我想按照通常的顺序进行,并讨论另一个非常重要且更直接的算法,该算法可以在 CPU 调度中使用并且已经使用过,有时单独使用,有时以不同程度和形式与优先级调度混合使用。

2024-12-15 15:16:53 869

【双曲几何-0加莱模型】庞加来上半平面模型的Python实现

我们知道,双曲几何的著名模型有四种:微分解析模型、庞加莱盘、庞加莱半平面、克莱因盘。庞加莱圆盘模型是表示双曲几何的一种方法,对于大多数用途来说它都非常适合几何作图。然而,另一种模型,称为上半平面模型,使一些计算变得更容易,包括三角形面积的计算。所有的依赖库: ```python import pygame import math import numpy as np import scipy from scipy.linalg import fractional_matrix_power ``` 外加两个自开发库: ```python from PoincarePlot import PoincarePlot from Line import Line ``` 因为代码数量较大,请需要的读者自行下载。

2024-05-07

OpenGL4.6的GLSL语言规格手册

本文档仅指定 OpenGL 着色语言 (GLSL) 4.60 版本。这个需要__VERSION__ 替换 460,并且要求 #version 仅接受 460。如果声明了 #version数字较小时,接受的语言是着色语言的早期版本,即是否支持取决于 API 中上下文的版本和类型。参见规范有关支持哪些语言版本的详细信息,请参阅参考资料。 以前版本的 OpenGL 着色语言以及 OpenGL ES 着色语言,不是此处指定版本的严格子集,特别是在精度、名称隐藏规则和接口变量的处理方面。参见对应的规格特定语言版本,了解特定于该语言版本的详细信息。

2024-04-19

OpenGL4.6开发手册

这是现代图形渲染技术OpenGL4.6开发手册,共有800页,包括丰富的案例和解说,是游戏开发人员的有力助手。

2024-04-19

【OpenGL高级】刚体绕任意轴旋转

解决三维坐标下的刚体旋转问题,欧拉角存在缺陷,当旋转点落在坐标轴上,旋转公式失灵。围绕任意轴旋转的点3d变换,正规公式是罗德里格斯矩阵。本篇专门介绍它的推导过程,而且提供C++的示例代码。

2024-04-19

【OpenGL实践08】现代渲染管线在GLUT和Pygame和Qt.QOpenGLWidget上各自的实现代码

该资源花了很多精力完成,主要看点是1)组件(按钮)参与渲染 2)渲染的关键步骤、关键函数。3)如何在Qt5使用着色器 4)三维视图如何调节显示 5)Qt5下较为健壮的程序布局设计 6)一些手册上不明说的隐含关键点。总之,用Qt5下的渲染管线中,这是一个成功典范。

2024-04-19

QOpenGLWidget的三维渲染

你好朋友们,我试图用 QOpenGLWidget 替换旧的 QGLWidget 来渲染我的 osg 场景很长一段时间,直到我找到这个例子帮了大忙。我们知道,QOpenGLWidget是较为推荐的OpenGL界面,我们就需要了解和使用它。目前这方面资料似乎不够多,尤其是example不多,本篇给出其中之一。以帮助大家熟悉此类编程。

2024-04-17

【OpenGL实验】在python、Qt5、pyOpenGL程序的若干要点

我们采用Qt5做OpenGL的界面,是因为在QGLWidget窗口上,既可以渲染三维动画,也能有按键,方便人机交互。学习渲染艺术的顺序是:首先要能对一些基本几何图形进行渲染。然后是二维物品渲染,最后是三维物体渲染。以下我们对这个学习过程进行系列解读。伴随的程序开发有许多注意点,稍有不慎就使程序陷入瘫痪状态,本系列针对作者的调试代码进行实况分析。

2024-04-15

强化学习的Q(λ)学习原理资料

Q(λ)-学习(Watkins,1989;Peng & Williams,1996)是一种重要的强化学习(RL)方法。它结合了 Q-learning(Watkins,1989;Watkins & Dayan,1992)和 TD(λ)(萨顿,1988;Tesauro,1992)。 Q(λ) 被广泛使用——人们普遍认为它优于简单的一步 Q 学习,因为它使用单一经验来更新评估过去发生的多个状态/动作对 (SAP)。线上与线下。我们区分在线强化学习和离线强化学习。

2024-03-27

强化学习的Q-Learn算法ppt资源

强化学习的主要算法:包括Q-learning、SARSA、DQN、A3C、TRPO、PPO和SAC等。这些算法各有特点,适用于不同的场景和任务。例如,Q-learning和SARSA是基于值函数的强化学习算法,旨在学习最优策略以最大化累积奖励;而DQN则是深度强化学习算法,使用神经网络来估计值函数,并通过反向传播算法更新网络参数。 强化学习在多个领域具有广泛应用。在自动驾驶系统中,强化学习可以帮助车辆感知周围环境并做出决策,实现自主行驶。在医疗领域,强化学习可以用于辅助医生进行病例分析、诊断和治疗方案制定,提高医疗服务的准确性和效率。此外,强化学习还在智能物流和仓储管理、金融投资决策等领域发挥着重要作用。

2024-03-27

使用 python + Qt + OpenGL 的第一步

在本教程中,我们将编写一个小型 Python 脚本,该脚本在 GUI 中呈现一个立方体,并使用滑块来控制其旋转。这将基于其他教程,即本教程,但会更详细地解释该过程和一般 OpenGL 概念。您可以在此处下载完整的脚本。

2024-03-27

使用Python动画粒子的薛定谔波函数(ψ)(完整代码)

物质的双重性质是物理学家中一个著名的概念。原子尺度的物质在某些情况下表现为粒子,而在某些情况下,它们的行为类似于波。为了解释这一点,我们引入了波函数ψ(x,t),它描述的不是粒子的实际位置,而是在给定点找到粒子的概率。波函数ψ(x,t)或概率场,满足一个也许是最重要的偏微分方程,至少对物理学家来说是这样,是薛定谔方程。

2024-03-20

glViewport - 人为干预视口改变和场景

游戏开发中,人机互动机制是必不可少的。输入装置要么操作杆、要么是键盘。视口改变是无论在3D还是2D都要出现的功能,比如,google地图就是一个显然的变视口问题,视口如同一个放大镜在地图上方移动,理论上可以看到地图上所有地方。本篇就模拟实现之。

2024-03-10

【OpenGL实现 03】纹理贴图原理和实现

一、说明 本篇叙述在画出图元的时候,如何贴图纹理图片。和纹理坐标的原理实现,以及纹理如何生成,和如何传递进入着色器。对以上进行解说,并附上源代码。

2024-03-08

12pyopenGL静态圆锥方体球体前后遮挡

一、裁剪说明 在 OpenGL 中提高渲染的一种方式。只刷新屏幕上发生变化的部分,OpenGL 允许将要进行渲染的窗口只去指定一个裁剪框。 基本原理:用于渲染时限制绘制区域,通过此技术可以在屏幕(帧缓冲)指定一个矩形区域。启用裁剪测试之后,不在此矩形区域内的片元被丢弃,只有在此矩形区域内的片元才有可能进入帧缓冲。因此实际达到的效果就是在屏幕上开辟一个小窗口,可以再其中进行指定内容的绘制。

2024-02-23

11PyopenGL如何将图片贴到表面class03

本资源实现对于openGL如何将纹理图片粘贴到对象平面中。 纹理(贴图),纹理是一张2D图片(当然也有1D和3D的纹理),用于贴在物体表面。相比于使用顶点来增添图形的细节,使用纹理能节省开销,并且能做到更多细节。 为了能够把纹理映射(Map)到物体上,我们需要指定物体的每个顶点各自对应纹理的哪个部分。这样每个顶点就会关联着一个纹理坐标(Texture Coordinate),2D的纹理坐标通常用(u,v)或是(s,t)表示,并且 u,v ∈(0, 1),使用纹理坐标获取纹理颜色叫做采样(Sampling)。纹理坐标起始于(0, 0),也就是纹理图片的左下角,终始于(1, 1),即纹理图片的右上角。 我们只需要指定每个顶点对应的纹理坐标,之后在图形的其它片段上进行片段插值(Fragment Interpolation)。

2024-02-23

大脚怪野外募集报告数据分析

大脚怪野外研究组织 (BFRO) - www.bfro.net - 是一个致力于调查大脚怪/大脚野人之谜的组织。 共有三个文件: bfro_report_locations.csv- 表格地理编码报告 bfro_reports.json- 以行分隔的 JSON 格式的全文报告。 bfro_reports_geocoded.csv- 报告位置和全文报告的合并和清理版本。 报告 数据集中最有用的文件可能是bfro_reports_geocoded.csv. 它包含与报告位置相关的完整报告中最相关的字段,现在还包含目击当天的天气状况。 天气状况是使用Dark Sky API获得的。 围绕时间戳和纬度/经度值,还对该数据集应用了一些数据清理。 并非所有全文报告都有相应的地理编码报告 - 在这种情况下,地理信息为空。 每个地理编码报告显然都包含纬度和经度值。 它还包含报告标题、报告编号和报告分类。 BFRO 网站上对报告分类进行了解释,但基本上分类决定了事件的性质 - 直接目击、噪音、踪迹等。 还有时间戳。 除了标题之外,该文件中的数据也是结构化的。

2024-02-22

1975年卡顿伍德湖研究区湿地P1数字正射校正航空

北达科他州斯图茨曼县卡顿伍德湖研究区湿地 P1 航拍照片的正射校正图像。这张照片是 1975 年至 2015 年 7 月和 8 月初拍摄的研究区域照片集的一部分。

2024-02-22

坦桑尼亚的多多马太阳能测量数据

坦桑尼亚的多多马和欣扬加截至 2021 年 12 月 31 日以及达累斯萨拉姆截至 2022 年 11 月 30 日的地面测量太阳辐射和气象数据。马昆杜奇的地面测量太阳辐射和气象数据可在桑给巴尔找到。

2024-02-22

2022年全球气候热点数据集

作为世界资源研究所全球恢复倡议绘制森林和景观恢复机会地图的一部分,潜在森林地图代表了对在当前气候条件下、没有人类影响的情况下森林生长位置的估计。定义潜在森林范围的主要数据来源是世界陆地生态区(Olson 等,2001)。每个生态区根据其描述(包括当前和潜在的植被)及其不同森林类型的比例,以及以下方面的额外输入,被归类为属于四个类别之一:茂密森林、开阔森林、林地或非森林数据集:当前森林范围;生物气候区划和原始森林覆盖范围;以及根据全球气候变量和海拔进行建模生成的森林分布图(Hansen 等人,2013 年;Zomer 等人,2007 年)。由于全球一致数据的可用性有限,该数据集基于显着简化。这些地图的比例相对较粗,只能用于估计区域或全球范围内的潜在森林覆盖率。潜在森林覆盖率的估计是基于在没有人为干扰的情况下当前的气候条件。

2024-02-22

林业类数目种类分布的数据集

仅根据制图变量预测森林覆盖类型(无遥感数据)。给定观测(30 x 30 米单元)的实际森林覆盖类型是根据美国林务局 (USFS) 第 2 区资源信息系统 (RIS) 数据确定的。自变量源自最初从美国地质调查局 (USGS) 和 USFS 数据获得的数据。数据为原始形式(未缩放),包含定性自变量(荒野地区和土壤类型)的二进制(0 或 1)数据列。 该研究区域包括位于科罗拉多州北部罗斯福国家森林的四个荒野地区。这些区域代表了人为干扰最小的森林,因此现有的森林覆盖类型更多的是生态过程而不是森林管理实践的结果。这四个荒野地区的一些背景信息: Neota(区域 2)可能具有 4 个荒野地区中最高的平均海拔值。 Rawah(区域 1)和 Comanche Peak(区域 3)的平均海拔值较低,而 Cache la Poudre(区域 4)的平均海拔值最低。 至于这些地区的主要树种,尼奥塔的主要树种是云杉/冷杉(1 型),而拉瓦和科曼奇峰的主要树种可能是黑松(2 型),其次是云杉/冷杉和白杨(5 型) )。 Cache la Poudre 往往含有黄松(3 类)、花旗松(6 类)和棉白杨/柳

2024-02-22

实木板表面纹理识别数据集

说明 我们搭建了一个用于拍摄实木板表面纹理照片的自动化传输平台,配备了 OscarF810CIRF 工业相机。拍摄的照片被裁剪为200×200像素,构成模型训练和测试的数据集。为了更好地拟合我们的模型,我们随机选择了原始数据集的80%作为训练集。然后通过四种扩展方法将原始训练集扩展至原来的六倍。第一种方法,以图像横轴为对称轴,对训练集中所有图像进行上下镜像;第二种方法,以图像纵轴为对称轴,对训练集中所有图像进行左右部分镜像;第三种方法随机提取原始训练集的二分之一,并对其进行随机亮度变换;第四种方法随机抽取一半的原始训练集,对其进行随机对比变换。剩余20%的原始数据集作为模型的测试集。

2024-02-21

Capstone-食物数据集

说明 以下是该项目的一些用例: 饮食跟踪应用程序:该模型可用于饮食和营养跟踪应用程序,帮助个人识别和记录他们每天消耗的食物。这有助于更好地跟踪他们的卡路里摄入量和其他营养信息。 自动化食品服务机器人:“Capstone-food”模型可用于自动化餐厅的食品服务机器人。机器人可以使用这个模型来识别不同类型的食物,并相应地将它们送到正确的餐桌上。 快餐行业的食品质量控制:该模型可以帮助实现快餐连锁店质量控制过程的自动化。它可以标记食物呈现中的任何不一致之处,检查是否准备了正确的食物订单,或者是否有任何异常情况(例如错误的物体)。 互动烹饪节目或教程:此模型可用于互动烹饪节目或在线教程。观众可以参与诸如成分识别或了解正在准备的特定菜肴的琐事等任务。 智能杂货购物:该模型可用于构建智能购物应用程序。这些应用程序可以帮助用户在购物时识别食品,并提供营养成分、可能的食谱或是否符合他们的饮食要求等信息。

2024-02-21

关于数据集:食物的热量

关于数据集:食物的热量 该数据集将帮助您发现常见食物的热量含量和其他事实。当您使用此数据集来了解您的身体如何从您最喜欢的膳食和零食中获取能量时,特别注意您所吃食物中的卡路里含量,您将能够做出永远不会让您感到内疚的饮食选择(或备胎)。44 个食品类别中每 100 克 2225 种食品的卡路里/KJ。

2024-02-21

坦克打飞船的完整代码(可执行)

说明 此为完整游戏完成。 这是一个完整的pygame游戏。1)有动画,有音乐,对象编程。2)事件管理:我们将首先管理事件的代码移到了一个名为check_events()的函数中,以简化run_ganme()并隔离事件管理循环。通过隔离事件循环,可将事件管理与游戏其他方面(如更新屏幕)分离。3)事件循环:这个模块中导入了事件检查循环要使用的sys和pygame。当前函数check_envents()不需要任何形参,其函数体复制了alien_invasions.py事件循环。比如:修改alien_invasion.py,使其导入模块game_functions,并将事件循环替换为对函数check_points()的调用。4)重构设计:在大型的项目中,经常需要在添加新代码前重构既有代码。重构旨在简化既有代码的结构,使其容易扩展。在本小节中,我们创建了一个名为game_functions的新模块,它将存储大量让游戏《外星人入侵》运行函数。通过创建模块game_functions,可避免alien_invasion.py太长,并使其逻辑更容易理解。

2024-02-16

坦克打飞碟的游戏基础界面实现

说明 这里是pygame游戏制作的示范,其中看点是,1)如何在时间驱动下对象移动;2)如何用键盘驱动坦克移动 3)画面重叠后如何处理遮挡。总之,这是一个简短的掌握pygame的高效案例。

2024-02-16

8pygame键盘动画实现

1 说明 该资源是面向游戏编程的初步阶段,是模拟游戏背景设定;游戏前景如何设定;游戏中定时器; 游戏中的键盘操控;游戏前景物体移动等. 资源内共分三段程序:1 如何显示图片;如何重叠显示图片;2 如何分配键盘和时间的关系. 3 如何使得游戏中前景移动。参照博客和示例代码,相信客户很快就能掌握相关知识。 2 资源描述 在Pygame中窗口和图片都称为Surface,所谓Surface对象在Pygame中就是用来表示图像的对象,图片是由像素组成的,Surface 对象具有固定的分辨率和像素格式。 Surface screen是绘制其他图形的主要窗口,我们设置的是一个800*600像素的窗口,默认是黑色的窗口,这个就是我们游戏的主界面。不过目前还不能随意关闭窗口,需要关闭事件。 3 具体参照博客: https://blog.csdn.net/gongdiwudu/article/details/136112471?spm=1001.2014.3001.5501

2024-02-15

双曲几何的库geometry-tools库(在python用)

说明 Geometry_tools 是一个 Python 包,旨在帮助您处理和可视化双曲空间和射影空间上的群动作。 该包主要构建在 numpy、matplotlib 和 scipy 之上。或者,该包可以使用 Sage 提供的工具来执行(缓慢的)精确计算。 几何工具可以帮助您: 在多个模型(即克莱因模型、双曲面模型、射影模型、庞加莱模型和半空间模型)中对双曲空间中的对象执行数值(或有时是精确)计算 在双曲平面、实射影平面、复射影线上画出漂亮的图画 使用 Coxeter 群的表示进行实际计算双曲距离。 使用有限状态自动机在字双曲群中进行一些简单的计算在双曲平面、实射影平面、复射影线上画出漂亮的图画 还提供了对 3D 图形的一些有限支持(通过 matplotlib)。 参考文章: https://yamagota.blog.csdn.net/article/details/136091083

2024-02-10

C++ 中的模型预测控制(012)

以下文章介绍了应用模型预测控制器的简单控制系统方法。本文讨论了这种控制的基本机制,该机制适用于各种工程领域。MPC 涉及对未来系统行为的预测(由一组方程描述的模型)。在优化过程中实现物理模型的所需位置(成本函数)。 您可以想象,具有系统动态模型(线性时不变 (LTI) 系统中的矩阵 A)的 MPC 模拟或预测模型在未来的位置或行为。然后,控制器计算一系列控制输入,以最小化预定义的成本函数,同时考虑所需的目标和约束。出于本文的目的,我在 C++ 中准备了简单的模拟。其目的是展示可以轻松复制的原理,用于更高级的模型动力学。

2024-02-09

4用C++和matplotlib实现贝塞尔曲线的库

以下文章介绍了用 C++ 计算和绘制的贝塞尔曲线(2D 和 3D)。    贝塞尔曲线具有出色的数学能力来计算路径(从起点到目的地点的曲线)。曲线的形状由“控制点”决定。所讨论的曲线最重要的特征是平滑度。    在许多应用和领域中,平滑度是不可或缺的。我们可以考虑机器人或其他机器的运动,其中运动必须是可预测的,以确保人员和硬件的安全(低磨损系数)。当机器人关节的轨迹被计算为平滑路径时,我们可以假设机器人将按照规划的路径平滑地移动,不会出现急动或意外移动。请注意,在我们考虑的机器人技术中,除了路径之外,还有速度、加速度、冲击力和电机扭矩。所有这些参数主要影响最终路径。    除了机器人技术之外,贝塞尔曲线还用于动画、游戏和设计。为了绘图的目的,我将使用我之前的文章中讨论过的 C++ 的 matplotlib 库。    头文件(用于绘图库)必须与您的 cpp 位于同一文件夹中。您的程序可以按如下方式编译。参考博文:https://yamagota.blog.csdn.net/article/details/136081941

2024-02-09

python多进程博客案例

用python实现线性方程组。线性方程组的计算机解法,如果自己写一个,不仅需要程序机巧,而且需要数字计算的理论机巧;绝对不同于《线性代数》所讲授的那样 如果您尝试自己用克莱蒙方法解线性方程组,却实现的不太理想,那就看看这个代码吧。

2024-01-27

2用python实现仿射变换的案例

用python实现线性方程组。线性方程组的计算机解法,如果自己写一个,不仅需要程序机巧,而且需要数字计算的理论机巧;绝对不同于《线性代数》所讲授的那样 如果您尝试自己用克莱蒙方法解线性方程组,却实现的不太理想,那就看看这个代码吧。

2024-01-27

基于python的线性方程数字解法

用python实现线性方程组。线性方程组的计算机解法,如果自己写一个,不仅需要程序机巧,而且需要数字计算的理论机巧;绝对不同于《线性代数》所讲授的那样如果您尝试自己用克莱蒙方法解线性方程组,却实现的不太理想,那就看看这个代码吧。

2024-01-27

pygame泡泡碰撞游戏

该项目是pygame库多泡泡碰撞游戏的项目。该项目虽简单,但是专业化作品,包括滚动的泡泡碰撞检测、场景画面,音乐伴随等。有兴趣游戏开发的读者,可以从中获得灵感感和启发。与本项目相关的博文地址是:https://yamagota.blog.csdn.net/article/details/134148849 可以参考,进行更高水平的游戏开发。

2023-11-04

python基于pygame库开发的滑雪游戏

该项目是pygame库建立滑雪游戏的项目。该项目虽简单,但是专业化作品,包括滚动的场景画面,音乐伴随等。有兴趣游戏开发的读者,可以从中获得灵感感和启发。与本项目相关的博文地址是:https://yamagota.blog.csdn.net/article/details/134148849 可以参考,进行更高水平的游戏开发。

2023-11-04

Ceras下cifar10的图像识别深度网络

一、说明 深度学习最一般的网络是lenet,和数据集minist数据集搭配;而图像的最一般数据集是cifar10,该数据集由32x32尺度的小图片构成,本项目演示,在tensorflow2.0下,如何构建一个小型感知机,去识别cifar10的图片内容,稍加改变,就可以实现客户图片的识别。

2023-10-26

小工具:移除目录内部所有空目录

一说明  此 Python 脚本搜索并删除指定目录中的空文件夹。它可以帮助您保持干净整洁的文件夹结构,尤其是在处理大型数据集时。此为整理文件小工具,实现归档目的。

2023-10-23

小工具:将目录中文件按照扩展名整齐归档

一说明 此 Python 脚本通过根据文件扩展名将文件分类到子目录中来组织目录中的文件。它标识文件扩展名并将文件移动到相应的子目录。这对于整理下载文件夹或组织特定项目的文件非常有用。此为整理文件小工具,实现归档目的。

2023-10-23

pytorch下多层感知机的实现

一、说明 用pytorch轻松实现多层感知机。本项目中两个看点:1)如何在torch实现多层感知机。2)如何调试这个程序,在调试中,作者发现了典型的系统错误,这种错误是普遍的,很值得记录之,因此,本项目附带《调试记录》以警告读者,如何避免同类问题。

2023-10-23

二项分布的字符串自动生成和统计验证

一、说明 在进行概率实验的时候,需要最基本的抽样实验,而抽样中,最简单的是抛币实验,这里我们实现了机器模拟抛硬币仿真,可以修改0-1分布的概率分布,以生成不同的符号序列。这里假定我们只有a和b两种符号的字符串。稍加修改,该项目可以实现多样本的抽样模拟。以至于数据集可以自动生成。

2023-10-22

AdaBoost 从弱分类器到强分类器的工作原理

一、说明 AdaBoost 从弱分类器到强分类器的工作原理 AdaBoost 通过一系列迭代或轮次运行来构建强大的分类器。以下是 AdaBoost 工作原理的分步概述: 初始化权重:在第一轮中,所有训练样本都被分配相同的权重。目标是对这些示例进行正确分类。 训练弱学习器: AdaBoost 选择弱学习器并根据训练数据对其进行训练,为上一轮错误分类的示例赋予更多权重。 计算误差:训练后,AdaBoost 计算弱学习器的误差。误差是错误分类示例的权重之和除以总权重。 更新权重: AdaBoost 增加了错误分类示例的权重,使它们在下一轮中更加重要。这更加强调了之前具有挑战性的数据点。 迭代:重复步骤 2 到 4 预定的轮数或直到达到一定的准确度。 组合弱学习器:最后,AdaBoost 通过根据每个学习器的表现分配权重来组合弱学习器的预测。更强的学习者会获得更高的权重,对最终预测的贡献更大。 进行预测:为了对新数据进行预测,AdaBoost 计算弱学习器预测的加权和,每个学习器的权重由其在训练期间的表现决定。

2023-10-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除