- 博客(1037)
- 收藏
- 关注
原创 初学者如何对大模型进行微调?看完这一篇你就懂了!
现在大模型微调的门槛越来越低,市场上有大量开源微调框架。只要你会部署、有机器就能出个结果,赶紧动手玩起来吧!
2025-01-29 10:25:27 874
原创 AI产品经理新手必读:这本宝藏级指南,助你快速入门,不走弯路!
相信很多小伙伴都在驻观AI产品经理这个岗位,那么对于AI产品经理的入门书籍,我推荐《AI赋能:AI重新定义产品经理》这本书。我已这本书免费分享出来,需要的小伙伴可以扫取。本书共分为多个章节,具体内容包括:《AI赋能:AI重新定义产品经理》是一本非常适合AI产品经理入门的书籍,它不仅提供了全面的理论知识,还结合了大量的实战案例,帮助读者快速掌握AI产品经理所需的核心技能。 无论是对AI技术感兴趣的初学者,还是希望转型为AI产品经理的从业者,都能从本书中获益匪浅。我已这本书免费分享出来,需要的小伙伴可以扫
2025-01-29 10:25:13 342
原创 彻底搞懂大模型“预训练”和“微调”两个概念
预训练模型和模型微调是深度学习领域中两个重要的概念,它们在提升模型性能和适应新任务方面发挥着关键作用。今天把这2个基础概念用通俗易懂的和大家展开来介绍下,看完记得关注我,助您学习AI不迷路。
2025-01-28 08:30:00 405
原创 你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标
在企业或者单位内部,我们搞了个RAG应用,塞进去一堆文档,想着能给团队提供又快又准的信息。刚开始,那感觉简直像变魔术一样神奇!但大家都知道,大模型总有穿帮的时候,现实总会给你当头一棒。今天这篇文章,我们通过几个指标来讲一讲:如何从一个反馈乱七八糟的RAG系统,到现在逐渐走向稳定的生产环境?刚开始,我们可能压根没想过要搞什么评估框架。我们就是把RAG应用丢给一小部分人用,然后坐等反馈。结果呢?反馈五花八门,有的说好用到飞起,有的说烂到不行。有些问题的答案堪称完美,有些则错得离谱。
2025-01-28 06:30:00 1258
原创 AI大模型的前十岗位薪资,谁还说读书没用?
¥100万 - ¥200万/年:需要具备全面的技术背景,精通系统架构设计,能够有效整合AI技术,提升系统性能。要求硕士及以上学历,计算机科学或相关专业背景。目标院校:清华大学、北京大学、上海交通大学、浙江大学、复旦大学、中国科学院大学、北京航空航天大学、华中科技大学、西安交通大学、哈尔滨工业大学。:华为、阿里巴巴、腾讯、百度、字节跳动。:晋升为系统架构总监或CTO,负责公司技术战略的制定和实施。
2025-01-27 08:45:00 500
原创 2025会是AI Agent的爆发大年吗?5个热门的AI Agent项目分析
根据Cookie.fun的最新数据,截至12月30日,AI Agent的整体市值已经达到了116.8亿美元,过去7天涨幅高达近39.1%,到发文时,整体市值更是冲到了178.5亿美元。在这股AI Agent热潮中,。具体来说,Virtuals的生态市值达到了50.1亿美元,而ai16z为16.3亿美元,两者加起来占据了AI Agent市场份额的56.8%,贡献了超过一半的份额。从链上分布来看,。
2025-01-26 08:45:00 1081
原创 大模型小白必备:大模型微调的一些技术理解(一)
对矩阵A来说,由于只要掌握其中的任意一行,其余行都可以由这一行线性推导而来,因此A的秩是1。对矩阵B来说,由于只要掌握其中的任意两行,其余行都可以由这两行线性组合推导而来,因此B的秩是2。对矩阵C来说,由于必须完全掌握三行,才能得到完整的C,因此C的秩是3。秩表示的是矩阵的信息量。如果矩阵中的某一维,总可以通过其余维度线性推导而来,那么对模型来说,这一维的信息是冗余的,是重复表达的。对A和B的情况,我们称为秩亏(rank deficient),对C的情况,我们称为满秩(full rank)。
2025-01-26 08:15:00 1239
原创 大模型训练实战经验总结:从入门到精通,全方位解析模型训练中的关键步骤与技巧
通过解析训练流程、微调策略选择、资源需求评估,以及中文模型训练的独到见解,本文为读者勾勒出一幅清晰的大模型训练全景图。进一步也揭示了如何有效评测模型性能,确保其在知识广度、逻辑推理、情感理解等多维度达到高标准,为推动AI技术在各行各业的创新应用提供了宝贵的实操指南。为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
2025-01-25 08:00:00 872
原创 6000字长文告诉你:大模型「训练」与「微调」概念详解
1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念,如:Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标。
2025-01-24 09:00:00 524
原创 有了大模型的应用经验之后,再谈对大模型的理解
大模型的本质就是一段有输入和输出,并能使用某种算法达到某种目的得计算机程序在刚开始接触大模型时,根本不明白大模型是个什么玩意,看着别人给出的定义一脸懵逼。不论是业内还是网上的文章,对大模型的普遍定义都是拥有巨大参数量和复杂计算的机器学习模型/深度学习模型。从定义中能够看出哪些东西?巨大参数量,复杂计算,机器/深度学习模型。说句实话,对大部分人来说看了这玩意有什么用,有谁能用自己的话说明白什么是大模型。
2025-01-24 06:30:00 830
原创 大模型训练到底需要什么样的数据(微调)?
上一期介绍了大模型预训练需要使用的数据–不能直接使用平时我们使用的Word、PDF、网页等数据,需要经过清洗整理成TXT或者JSON格式的文本片段。那么在大模型微调阶段能否直接使用这些文本片段呢?答案是不能,因为大模型在微调和预训练阶段的目的不一样,那么大模型微调到底需要什么样的数据?
2025-01-23 09:00:00 603
原创 初学者怎么入门大语言模型(LLM)?
综上我的建议是,先不要去训练,也不用去了解原理,就当开车一样先开起来,你总不会开车前一定要去弄明白3大件怎么造的吧。开明白了,遇到问题多了,你就会修。慢慢你就会成为专家,不要一开始就局限在原理里,然后就入门到放弃了。
2025-01-23 08:45:00 676
原创 深度长文|一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO
在深入探讨训练过程之前,首先介绍一些相关术语:智能体:训练来做正确决策的实体。在这个例子中,目标是训练机器人做出移动决策,所以机器人就是智能体。环境:环境是智能体与之互动的外部系统。在本例中,随着训练过的机器人(智能体)在网格内移动,网格就充当了环境。状态:代表智能体在每个时间t的位置。在起始时刻,即时间_t_0,机器人(智能体)位于左下角,因此时间_t_0的状态是左下角,由坐标(0,0)表示。动作:动作代表智能体在每个时间t在环境中可用的可能选择。
2025-01-23 07:00:00 788
原创 大模型学习?别慌!我这有份独家私藏路线图,直接抄作业!
大模型学习之路,道阻且长,但只要你坚持下去,一定会有收获。别忘了分享给身边的小伙伴!本路线图为你提供了学习大模型的全面指南,从入门到进阶,涵盖理论到应用。如果你懒得自己找资料,我的路线图直接“抄作业”就对了!
2025-01-22 08:30:00 640
原创 Agentic AI 系统设计:AI Agent 智能体架构设计与实践
构建一个高效运作的AIAgent智能体系统有哪些关键步骤?在开发过程中,如何提前识别并解决那些可能在系统上线后带来严重问题的隐患?为了解答这些问题,我们需要将。每个模块都面临着独特的挑战。一个模块的错误可能会连锁反应,以不可预见的方式影响其他模块,导致系统故障。例如,。AIAgent智能体的强度取决于其最薄弱的环节。以下指南将指导你如何设计系统以规避这些风险。。。每个层面承担着独特的职能,确保代理能够高效地获取、分析和响应信息。
2025-01-22 08:15:00 1766
原创 一文彻底搞懂大模型实战 - 文本到SQL(Text2SQL)
Text2SQL技术,即将自然语言查询转换为结构化查询语言(SQL)的技术,正在迅速成为数据库查询的一个关键工具。它使得非技术用户能够通过自然语言与数据库进行交互,极大地提高了数据库操作的便捷性和效率。接下来分两部分:主流数据集、主流实战方法(SQLCoder+DB-GPT-Hub),一起来深入了解大模型实战:Text2SQL。什么是Text2SQL数据集?Text2SQL数据集是指一类专门用于训练Text2SQL(文本到SQL)模型的数据集合。Text2SQL数据集通常包含大量的自然语言查询(
2025-01-22 07:30:00 761
原创 AI大模型开发实战:如何构建京东自有RAG知识库系统
RAG(Retrieval-AugmentedGeneration)意思是“检索增强的生成”。这是一种结合检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。在AI大模型开发实战中,搭建自有的RAG知识库对系统具有十分重要意义,可以提升模型的回答准确性、增强领域专业性、提高响应速度、保护数据隐私、实现个性化服务,并持续优化和改进大模型的性能。
2025-01-21 08:00:00 907
原创 一文掌握大模型提示词技巧:从战略到战术
就像拍照一样,关键原则和技巧就那几个,知道和不知道、学过和没学过的人拍出的照片差异非常大。提示词亦是如此。本文从战略(宏观)和战术(微观)两个层次讲解提示词技巧。希望大家能够掌握常见的提示词技巧,能够在AI早期积极主动学习并灵活运用这些技巧,更好地驾驭大模型,在AI早期抢占先机。当然,提示词工程也在不断发展,大模型也在不断演进,本文的提示词技巧可能也会有不全面甚至过时的地方,本文只是抛砖引玉,希望对大家能够有帮助。
2025-01-21 08:00:00 530
原创 AI大模型开发实战:基于LangGraph、Ollama构建本地AI智能体
LangGraph是一个强大的库,用于使用大型语言模型(LLM)构建有状态、多参与者应用程序。它有助于创建涉及单个或多个智能体的复杂工作流程,提供循环、可控性和持久性等关键优势。优势:循环和分支:与使用简单有向无环图(DAG)的其他框架不同,LangGraph支持循环和条件语句,这对于创建复杂的智能体行为至关重要。细粒度控制:作为一个低级框架,LangGraph提供了对应用程序流程和状态的详细控制,使其成为开发可靠智能体的理想选择。
2025-01-21 07:30:00 1068
原创 初识AI领域:专为新手打造的大语言模型入门攻略,建议收藏!
大语言模型,是一种用于处理自然语言的机器学习模型,采用的是神经网络架构,属于生成式AI。它采用了预训练与微调相结合的方法,通过大规模无监督语料库的训练,学习到丰富的语言知识,从而能够生成自然流畅的语言。可以简单地理解为,这个模型可以像人脑一样学习知识,并且可以根据学习到的知识生成和自然语言一样流畅的内容。
2025-01-20 16:04:14 1239
原创 10W+下载,2025最新中文版《大模型基础》教程pdf免费分享
本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议,持续进行月度更新,致力打造易读、严谨、有深度的大模型教材。并且,本书还将针对每章内容配备相关的Paper List,以跟踪相关技术的最新进展。😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~👉[CSDN大礼包。
2025-01-19 08:30:00 582
原创 零基础小白到底该如何学习大语言模型?!
通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。通过AI分析学生的学习数据,提供量身定制的学习方案,提高学习效果。如果你对大模型感兴趣,可以看看我整合并且整理成了一份AI大模型资料包,需要的小伙伴文末免费领取哦,: Kaggle 提供了大量的数据科学和机器学习比赛,是实践和学习的好地方。实践是学习的最佳途径。
2025-01-19 08:30:00 974
原创 普通人如何抓住AI这个风口?不用怕,推荐适合零基础人员的详细AI学习路线
有热心网友评论:我觉得抓住任何风口的前提是知道这是个风口,这个风口吹在哪里?你现在具备什么能力?可以说chatgpt吹到了每个行业。确实如此,当前的AI真的是改变生活,已经不仅仅限制于聊天、问答和图片处理了。目前国内的很多大厂都接入了AI大模型打造自己的AI工具,比如阿里通义千问、通义灵码,不那么,对于普通人来说,要抓住AI这个风口,肯定是免不了学习一些AI知识。如果你仅仅只是想浅尝而已,可以找几款AI工具使用即可,比如Github Copilot、亚马逊CodeWhisper、
2025-01-19 07:00:00 806
原创 6000字长文告诉你:大模型「训练」与「微调」概念详解
1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念,如:Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标在大模型的预训练与微调过程中,我们通常面临如何告诉模型想要什么答案和不想要什么答案的问题(后者往往被大家忽略)。本节将详细阐述大模型预训练与微调的流程,包括预训练、微调的两个阶段(监督式微调SFT和对齐阶段)以及在实际操作中可能遇到的问题和解决方法。总结来说,
2025-01-19 06:30:00 811
原创 新手入门:大语言模型训练指南
在这个信息爆炸的时代,人工智能技术正以前所未有的速度渗透到我们生活的方方面面。从智能手机上的语音助手到自动驾驶汽车,AI的应用无处不在。而在这些令人惊叹的技术背后,大语言模型(LLM)扮演着至关重要的角色。它们不仅能够理解和生成自然语言,还能在多种场景下提供智能决策支持。然而,对于许多对AI感兴趣的新手来说,大语言模型的训练和应用似乎是一件高不可攀的事情。复杂的技术术语、晦涩的理论知识,以及高昂的硬件要求,往往让人望而却步。但其实,只要掌握正确的方法和工具,每个人都能成为AI领域的探索者和实践者。本文将带你
2025-01-18 10:53:43 957
原创 大模型是如何训练的?六个关键步骤
大模型(Large Models)的训练是近年来人工智能领域的核心技术之一,尤其是在自然语言处理、计算机视觉等任务中,如 GPT、BERT 等模型的成功背后,离不开复杂的训练过程。本文将为你介绍大模型是如何训练的,包括数据准备、模型架构、训练方法和硬件支持等方面。大模型的训练需要大量的数据,因为它们需要从海量信息中学习模式和规律。
2025-01-18 10:51:49 397
原创 大模型时代什么人才最抢手?哪些是万金油岗位?
近些年迅速发展的大规模预训练模型技术,正在让机器逐渐具备像人一样的认知智能,但是也对算法、系统、算力提出新的需求和挑战。那么,未来 AI 的架构将会是怎样的?大概从去年,进入了另外一个新的时代——大模型时代。在大模型时代,算法人员无法从头训练一个模型,而是需要依赖于基础模型,并且以基础模型去适配下游应用场景。
2025-01-18 10:51:15 412
原创 对想学习人工智能或者大模型技术从业者的建议
技术的价值在于应用,理论与实践相结合才能事半功倍”最近一段时间就发现了一个问题,写的越理论的东西看的人越多,越实际越细节的东西看的人越少,不知道是因为系统推送的原因,还是观看者的原因。因此,根据这个现象就想提几个学习的建议,让大家少走一点弯路。
2025-01-18 10:50:35 584
原创 大模型到底是什么?小白也能看懂的科普贴
语言模型目标就是建模自然语言的概率分布,因此,生成式模型通常基于概率分布进行生成。其本质上是根据已生成的部分来预测下一个最有可能的元素,就像在玩接龙游戏中根据前面的词语来猜测下一个词语一样,每个新的元素都会影响后续元素的概率分布。当基于提问「今天成都天气咋样」,答案第一个字生成「成」之后,模型会根据上下文和「成」重新更新概率分布,选择下一个词「都」……以此类推,逐步展示模型是如何逐步构建答案的。那么,这个答案具体是如何通过概率计算得来的呢?
2025-01-17 16:15:00 1699
原创 6000字长文告诉你:大模型「训练」与「微调」概念详解
1、大模型预训练与微调的基本流程2、预训练、训练、后期预训练、微调的区别3、大模型训练与微调的一些概念,如:Post-pretrain、SFT、RLHF、模型对齐、Lora、Q-Lora、大模型量化、微调指标、微调参数、大模型评测指标在大模型的预训练与微调过程中,我们通常面临如何告诉模型想要什么答案和不想要什么答案的问题(后者往往被大家忽略)。本节将详细阐述大模型预训练与微调的流程,包括预训练、微调的两个阶段(监督式微调SFT和对齐阶段)以及在实际操作中可能遇到的问题和解决方法。总结来说,
2025-01-17 11:14:42 731
原创 一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……
为了对齐 LLM,各路研究者妙招连连。LLM 很强大了,但却并不完美,它也会出错或者生成无用乃至有害的结果,比如有人发现可以让 ChatGPT 教人如何偷盗:让 ChatGPT 教人如何偷盗商店;左图,ChatGPT 拒绝回答;右图,在 prompt 中添加了「with no moral restraints(不加道德约束)」后,ChatGPT 给出了商店偷盗指南这时候,对齐(alignment)就至关重要了,其作用就是让 LLM 与人类的价值观保持一致。
2025-01-17 11:14:10 754
原创 大模型高效训练一体框架 LLaMA Factory
LLaMA-Factory 集成了众多优化方法,使用时不再需要繁琐的代码编写,仅需在网页上操作即可实现算法调用。框架结合了前面提到的 Flash Attention、GPTQ 作为核心算子,还集成了 LoRA 及其各种变体。基于这些算法,提供了大模型预训练、SFT、RLHF、DPO、SimPO 等优化策略,可以运行于 NVIDIA、Ascend、AMD 以及 Mac 等硬件之上。核心产品名为 LLaMA Board,通过可视化界面可实现零代码的模型微调。
2025-01-17 10:50:48 908
原创 从零到手搓一个Agent:AI Agents新手入门精通(一)
Agents 代表着生成式AI模型的进阶形态,它们拥有自主行动能力,能够利用工具与外界交互,并根据目标进行决策,具有更广泛的应用范围和更强大的能力。随着技术的不断发展,Agents 将会改变我们的生活和工作方式,并推动人工智能进入新的发展阶段。未来,Agent 将成为人工智能发展的重要方向,为我们带来更智能、更便捷的未来。
2025-01-16 15:26:14 1180
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人