- 博客(998)
- 收藏
- 关注

原创 DeepSeek 入门到精通!(清华大学版)
今天给大家推荐一份清华 DeepSeek 使用手册,真的好好用~~清华大学团队出品的 DeepSeek 学习手册,深入解析国产开源 AI DeepSeek 的强大功能,让你从入门到精通,轻松掌握 AI 高效玩法!真的太强了!完整报告104页,文章长度有限无法完整展示,完整资料已经打包放到了网盘,需要的同学自取我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?
2025-02-10 16:27:46
3159

原创 保姆级实战教程:安装部署私有化大模型,并投喂数据
想要部署属于自己的大模型,会不会很困难?其实不是的,现在是越来越简单。潘哥今天就做一个简单的示范,让大家都能轻松搞定在自己的电脑哦上,本地化部署并运行私有化大模型,并且为我们自己的大模型投喂数据。这样,就可以建立自己的数据仓库,没错,就可以定制垂直行业或细分领域的私有化大模型了。酷~~~首先,我们会用到Ollama,功能是运行大模型。Ollama是一款LLM也就是大型语言模型服务工具,可以极大简化在本地运行大语言模型,极大降低了使用大语言模型的门槛,而且是开源的哦。
2025-01-28 07:00:00
5379

原创 国产AI大模型「医疗十大应用场景」案例盘点,推动医疗健康领域智能升级
人工智能技术的浪潮正席卷全球,AI大模型以其卓越的数据处理能力和深度学习能力,正在成为医疗健康领域变革的关键力量。本文将深入探讨AI大模型在医疗十大场景中的创新实践,展示其提升医疗服务效率、赋能临床决策、推动行业智能化转型的广阔前景。基于海量医疗数据,辅助临床诊断决策AI大模型通过分析海量医疗数据,能够辅助医生进行更准确的诊断。例如,百度灵医大模型利用其强大的数据处理能力,通过API或插件嵌入的方式,在200多家医疗机构中展开应用,显著提升了诊断的准确性和效率。
2024-12-27 11:24:15
6160

原创 七款国产AI大模型:Kimi,智谱清言,通义千问,文心一言,豆包,天工AI,讯飞,各自的优缺点是什么?
优点:Kimi这货,免费还能多平台支持,不光能实时联网,处理长文本也不带喘的,简直就是程序员的贴心小棉袄啊。缺点:不过呢,这家伙在特定领域翻译上就有点儿不太行,有时候还会抽风宕机,咱也不知道它为啥这么脆弱。优点:智谱清言是清华系的,不光会码代码,还能画图表,简直就是学霸中的学霸。尤其是它的多模态处理和图片理解能力,真心厉害。缺点:不过,别太指望它啥都懂,遇到特别复杂或者前沿的东西,它有时候也会掉链子。优点:阿里云的招牌产品,超大规模,能聊会说,还能处理多语言,厉害得不得了。
2024-12-12 16:24:48
5838

原创 什么是算法工程师?算法工程师有前景吗?
什么是算法工程师?算法工程师说目前最炙手可热的岗位。虽然算法工程师一直被频频提及,但是许多人对这个岗位的了解还知之甚少。那么算法工程师究竟是做什么的?前景怎么样呢?下面我们来一起解开这个高薪技术岗位的神秘面纱!
2023-10-02 08:15:00
2959
原创 AI大模型·白皮书 | 阿里云:2025年人人懂AI之从机器学习到大模型报告.pdf
报告由刘军民编写,旨在为 AI 技术爱好者提供启蒙,详细介绍了 AI 从基础到前沿应用的知识,涵盖机器学习、深度学习、神经网络、AIGC 及大模型等方面,探讨了 AI 技术在实际应用中的问题与挑战,并提供了实践指导。
2025-03-22 16:51:10
276
原创 AI大模型·白皮书 | 2025年DeepSeek:AI赛道的超级引擎报告(160页)
R1模型更是通过纯强化学习实现了复杂推理能力,训练过程分为三个阶段,包括R1 Zero的强化学习训练、冷启动数据与推理能力增强以及最终的R1模型训练,还通过蒸馏技术提升了其他开源模型的性能。秉持“求是创新”精神,平衡创新与商业化,既注重技术研发,又关注市场需求。《DeepSeek:AI赛道的超级引擎》由InfoQ极客传媒与极客时间联合出品,多位专家从多维度深入剖析了DeepSeek,涵盖技术突破、组织文化、开源策略、人才竞争、商业化等关键领域,展示其在AI领域的卓越影响力与发展潜力。
2025-03-22 16:23:25
220
原创 大模型如何如何赋能军事演训?具备哪些关键优势?【大模型国防应用】
舰船知识”形成了“以为使命,业务、技术聚变演进,三位一体”的发展格局。“理论创新研究部”是“舰船知识”孵化出的,系统而全面地研究“形成了以“根源动因、决策中心、穿透层垒、数理建模”为特色的宏观形势研判、重大事件预测、战略策略制定、战争筹划设计、战略规划评估、体系评估设计、装备概念创新等方面的独创理论方法和技术体系。我们坚持“超前发布预测、敢于迎接检验”,并且实现了“”的傲人成绩。2016年中期,预判特朗普当选美国总统,通过“对美国军工利益集团对其政治决策影响的建模研究”。2022年,
2025-03-22 15:49:02
714
原创 李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家
3 月 20 日,零一万物 CEO、创新工场董事长李开复博士接受了彭博社的专访。在访谈中他表示,DeepSeek 爆红出圈给整个中国大模型行业完成了实质意义上的市场认知教育,随着模型性能的提升与推理成本的下降,2025 年 AI-First B 端、C 端应用都将迎来爆发。另一方面,各地政府也对大模型展现出浓厚的兴趣,都在积极探索如何将 AI 应用到当地优势传统产业中,用产业大模型打造“新质生产力”,进而促进实体经济的增长。
2025-03-22 14:31:28
821
原创 从直觉到深思:推理大语言模型综述
在人工智能领域,模拟人类的思维方式一直是研究的核心目标之一。人类的思维可以分为两种模式:快速、直觉的“系统1”和缓慢、深思的“系统2”。近年来,大型语言模型(LLMs)在“系统1”式的快速决策中表现出色,但在需要复杂推理的“系统2”任务中却显得力不从心。然而,随着OpenAI的o1/o3和DeepSeek的R1等推理型LLMs的出现,这一局面正在发生改变。这些模型不仅在数学和编程等领域展现了专家级的表现,还展示了类似人类的认知能力。
2025-03-22 11:53:09
569
原创 DeepSeek系列大模型:各版本区别详解
DeepSeek,作为人工智能领域备受瞩目的语言模型,自发布以来,凭借其强大的自然语言处理和编码能力,吸引了众多AI技术爱好者和开发者的关注。从V1到R1,DeepSeek系列不断迭代优化,逐步增强了对不同任务的处理能力。今天,我们就来详细解析DeepSeek各个版本的区别,为您呈现其技术演进的精彩历程。
2025-03-22 11:45:30
529
原创 三次字节面试,都折在RAG上了
RAG(Retrieval Augmented Generation,检索增强生成 )方法是指结合了基于检索的模型和生成模型的能力,以提高生成文本的质量和相关性。该方法是Meta在2020年发表的文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出的,该方法让LM(Language Model,语言模型)能够获取内化知识之外的信息,并允许LM在专业知识库的基础上,以更准确的方式回答问题。
2025-03-21 14:04:59
953
原创 DeepSeek 部署指南:公网还是本地?哪个版本合适?费用?一文搞懂!
最近,DeepSeek 超火,好多企业都忙着给它做私有化部署呢,但还有些企业在那儿犹豫不决,不知道咋选。今天咱就好好唠唠这个事儿,帮大家做出最适合自己的选择!
2025-03-21 10:18:32
652
原创 当AI成为标配后,新时代的产品经理需要具备哪些能力?
因为产品跟业务是密不可分的,产品经理在某一个行业里的积累越深厚,也就印证着他的业务认知,业务的 know how 会越精准,这也是很多公司选择候选人的一个方式,会以这种方式来产出JD,找到相应的行业经验丰富的产品经理。PC时代,比如说像宝洁的产品经理,主要承担的角色是需求分析师,包括后期的像IBM、 Oracle 的软件类产品经理,也是把销售拿到的客户需求,拿到团队内部进行分析,然后转化成研发可以落地的产品语言,所以这个阶段的产品经理,更像是一个项目协调者的角色,思考和行动的占比,行动会多于思考。
2025-03-20 14:29:17
606
原创 23张PPT搞懂DeepSeek核心技术!
在人工智能领域,DeepSeek模型以其卓越的性能和创新的技术架构,成为2025年备受瞩目的焦点。DeepSeek不仅在自然语言处理(NLP)任务中表现出色,还在多个行业实现了落地应用,推动了智能大数据技术的发展。本文将详细解析DeepSeek模型的训练优化及数据处理的技术精髓。腾讯公司通过发布23张精心制作的PPT,向公众全面揭秘其旗下AI大模型DeepSeek的核心技术。这一举措旨在让技术爱好者、专业人士和从业者更深入地了解DeepSeek的技术精髓,并启发更多关于人工智能创新发展的思考与探索。
2025-03-20 14:24:45
528
原创 从模型到应用:大语言模型生态系统完全指南
模型运行层是大模型应用生态中的关键基础设施,负责将庞大的语言模型高效部署到实际生产环境中。随着大模型参数规模的不断扩大(从数十亿到数千亿不等),如何高效运行这些模型成为一个巨大挑战。模型运行层通过创新的系统设计和优化技术,解决了推理延迟、吞吐量、内存占用和成本效益等核心问题,使大模型能够实际服务于各类应用场景。
2025-03-19 13:52:31
640
原创 DeepSeek+dify 本地知识库:高级应用Agent+工作流
工作流通过将复杂的任务分解成较小的步骤(节点)降低系统复杂度,减少了对提示词技术和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,提升了系统的可解释性、稳定性和容错性。一个完整的工作流,必须具备开始和结束两个节点。Chatflow:面向对话类情景,包括客户服务、语义搜索、以及其他需要在构建响应时进行多步逻辑的对话式应用程序。Workflow:面向自动化和批处理情景,适合高质量翻译、数据分析、内容生成、电子邮件自动化等应用程序。变量。
2025-03-19 13:00:29
959
原创 DeepSeek应用最佳实践之蒸馏模型
经过蒸馏的模型在推理基准测试中取得了令人印象深刻的结果,部分结果优于GPT-4o和Claude-3.5-Sonnet等较大的模型, 比如 DeepSeek-R1-Distill-Qwen-32B在AIME 2024上达到72.6%的Pass@1, 在MATH-500上达到94.3%的Pass@1,表现明显优于其他开源模型。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。老师,这个地方我不会啊。
2025-03-18 14:55:25
772
原创 大语言模型学了个寂寞?工作依旧举步维艰!
别再让大语言模型的潜力白白浪费,现在就抓住机会,开启你的高效学习之旅,用知识武装自己,在职场和学术的赛道上实现弯道超车!最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。我们这套大模型资料呢,会从。
2025-03-18 14:45:13
739
原创 一文读懂:医疗场景下各版本DeepSeek部署&应用攻略
自2025年春节以来,DeepSeek已经在超过100家医院落地,大模型技术在提升医疗质量和效率方面发挥了关键作用。然而,目前大多数医院对大模型仍存在疑惑,对其不同算力版本、智能体应用、硬件支持等缺乏足够的了解。为此,CDSreport围绕医疗场景下的大模型部署、应用等话题,开展系列分析报道。本期将围绕DeepSeek不同版本在院内的选择,从技术特征、场景匹配、部署方案等方面展开分析。
2025-03-17 16:17:59
986
原创 【AI+旅游】论AI大模型在旅游中的八大应用
当前技术迭代方向已延伸至多模态数据处理领域,Airbnb最新研发的跨文化推荐系统通过解析用户上传的旅行影像元数据,结合图神经网络技术,在东京奥运会期间为83%的国际游客智能匹配了符合其母国文化特征的在地体验项目,标志着个性化推荐正从精准营销工具进化为跨文化旅行体验的智能设计中枢。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。在体验提升维度,基于情感分析技术解析评价数据,针对性改进服务触点。
2025-03-17 16:13:41
848
原创 LangGraph Swarm (Python):构建蜂群式多智能体系统
默认情况下,期望各个智能体通过所有智能体和整个多智能体蜂群图共享的单个消息键进行通信。这意味着来自所有智能体的所有消息将合并到单个共享消息列表中。如果你不希望公开智能体的内部消息历史记录,这可能不是理想的选择。要更改此设置,你可以通过执行以下步骤来自定义智能体:• 使用自定义状态模式,其中消息使用不同的键,例如 alice_messages• 编写一个包装器,用于将父图状态转换为子智能体状态,然后再转换回来。
2025-03-14 15:21:12
1011
原创 人人都懂的大模型知识:RAG(检索增强生成),大模型的开卷考试
通过对全网数据的学习和压缩,大模型具备了信息记忆和知识理解的能力。但是,这位博学的学者有时候也免不了“信口开河”,产生幻觉。为了提升大模型输出内容的可信度,我们不妨要求它在作答的过程中“引经据典”,给出答案的同时也给出信息的出处。这种结合信息检索与大语言模型的技术框架,就是RAG(Retrieval-Augmented Generation,检索增强生成)。RAG通过从外部知识库中检索相关信息,并将其作为提示的一部分(Prompt)输入给大型语言模型(LLMs)从而增强模型处理知识密集型任务的能力。
2025-03-14 15:15:50
759
原创 本地部署DeepSeek R1 + Ollama + XRAG:三步搭建RAG系统,并解锁全流自动化评测
具体来说,XRAG支持全面的RAG测评Benchmark与Toolkit,涵盖了50+以上的测试指标与RAG的全面评测与失败点优化,支持4类Advanced RAG模块( 查询重构, 先进检索, 问答模型, 后处理) 的对比, 并集成模块内的多种具体实现,支持OpenAI大模型 API。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。如何科学的评估RAG系统,对于RAG系统的性能优化至关重要。
2025-03-13 10:54:26
723
原创 AI Agent与智能工作流
科技企业竞相追逐全能AI助手之际,部分先行者已将目光转向更具实用价值的智能工作流。这标志着AI技术应用领域的一场深刻变革。
2025-03-13 10:51:25
800
原创 专业解读:AI、ANI、AGI、ASI 的概念与区别
人工智能(AI)是一个动态发展的概念,指机器具备执行原本需人类智能才能完成任务的能力。自 20 世纪 50 年代萌芽以来,其定义随研究与技术进步不断演变。如今,AI 广泛应用于自动驾驶汽车、笔记本电脑、聊天机器人(如 ChatGPT)、图像生成器等诸多领域。那么,AI 究竟是什么,又如何运作?“人工智能”源于这样一种观点:智能若为生物有机体固有,在其他领域的呈现便意味着人造。计算机科学家艾伦·图灵是探索机器能否像人类一样基于信息和逻辑决策的先驱之一。
2025-03-12 14:43:49
978
原创 2025年值得关注的21个RAG开源项目
检索增强生成(RAG)框架通过将检索机制与生成模型相结合,彻底改变了大型语言模型(LLM)的使用方式。随着人工智能解决方案需求的不断上升,GitHub 上陆续出现了多个开源的 RAG 框架,每个框架都提供了独特的功能和特性。这些框架通过将大型语言模型与外部知识库相结合,提高了生成内容的准确性和可靠性,在医疗、金融、客户服务及教育等领域具有重要价值。••:侧重于高效的检索机制和生成过程。•:需要快速、准确地完成文本检索和响应生成的开发者及组织。•:支持多种检索策略和嵌入模型。•。
2025-03-12 14:38:23
786
原创 开发者必备!2025 年 AI 工具大盘点~
在 2025 年的 AI 浪潮中,众多强大的 AI 工具如繁星般涌现,为各大开发者带来了前所未有的便利和效率提升。接下来,我带大家一起深入了解这些备受瞩目的 AI 编程工具。各位技术大佬务必拿小本本记录好噢~
2025-03-11 13:48:35
621
原创 用最通俗易懂的方式解释到底什么是Agent/智能体/代理
由于刚发布的Manus这款号称“全球首款通用智能体平台”的刷屏式传播,很多人找我问起到底大模型领域的”agent”(中文被翻译为“代理”或者“智能体”)是什么?在本文中,我将使用”智能体”这一翻译,并尝试用最通俗易懂的方式来解释它的概念和意义。简单来说,。
2025-03-11 13:45:50
847
原创 写给大模型新人的经验,刷到少走三年弯路!
最后,给准备入场大模型的新人几点建议:不要只关心 finetune,SFT,RLHF,作为系统性学习是 OK 的,切忌花太多精力。想做应用的,建议 focus 到某个垂直领域,比如对话机器人,问答系统,金融/医疗/教育方向,找一个具体的场景,把它做好,做深。多关心数据,data pipeline,高质量训练/测试集的构建经验,对数据的sense,是最直接,也是最适合用到未来工作当中的。大模型不只有算法,也可以有工程。
2025-03-10 11:42:09
775
原创 大模型 vs 搜广推?算法工程师们应该如何选择职业方向?
其实类似大模型这样的行业趋势,每隔两三年就会出现一次。11年之前的CTR预估,推荐模型主要是以传统的算法为主,协同过滤,朴素贝叶斯等,但12年之后各大公司都迁移到机器学习模型和infra上,于是有了LR,实时的FTRL,再复杂一点的FM这些广告推荐模型,一下子广告推荐效果有了一个质的提升。第二个方向的工作也有不少,这里仅以Amazon的PALR为例,大致意思是把用户的行为、画像、以及候选物品的信息转换成文本prompt,让大模型直接给出推荐结果,用户也可以进一步输入自己的推荐需求,形成交互式推荐的过程。
2025-03-10 11:40:21
256
原创 OpenAI开源:20分钟构建多Agent语音系统!
嘿,大家好!这里是一个专注于AI智能体的频道~让你开发一个语音智能体应用原型大概需要多久?3天?5天?今天OpenAI给出了一个答案:20分钟!没错,就在昨天,OpenAI官方发布了一个基于Realtime API开发的多层级高级AI Agent参考实现。这个项目一经发布就引起了很多开发者的关注,在Github上已经突破2000+星。
2025-03-08 13:42:14
561
原创 2025年AI应用爆发Agent爆火!普通人如何玩转AI?手把手教你用Coze打造自己的“数字员工”
Agent并非聊天机器人的升级版。它不仅会告诉你“如何做”,还会“帮你做”。2025年,AI Agent(智能体)已成为企业降本增效的“数字劳动力”,它们不仅能理解指令,更能像人类一样规划任务、调用工具、记忆交互,完成从“分析竞品报告”到“自动发送邮件”这样的全流程操作。中国大模型的横空出世,以1/70的训练成本、3%的定价颠覆行业,让AI开发从“高门槛”走向“平民化”。这意味着:无需天价算力,用Coze这类低代码平台+开源模型,小白也能快速搭建智能体。
2025-03-08 11:45:40
593
原创 Manus 为何刷屏科技圈?互联网人与 AI 产品经理必知的产品变革!
在科技狂飙突进的年代,创新的浪潮不断拍打着岸边,新的产品如雨后春笋般涌现。而今天,我们要聚焦的主角是 Manus,一款正以迅猛之势席卷互联网领域的颠覆性产品。
2025-03-07 14:53:00
636
原创 国产AI智能体Manus一夜爆火
最近,一支来自中国的团队正式对外发布通用型AI Agent产品Manus。这款AI Agent产品,以其强大的功能和惊人的市场反应,瞬间点燃了整个科技界。那么,Manus究竟是如何一夜爆火的呢?Manus的爆火,首先离不开其“全流程执行”的能力。传统的AI助手,大多只能给出建议或答案,而Manus却能更进一步,直接完成任务并交付成果。比如,用户只需告诉Manus“筛选本月程序员简历”,它就能自动解压文件、分析资质,甚至生成Excel排名表。
2025-03-07 14:35:50
1047
原创 人工智能行业:2025年人工智能十大发展趋势(附AI实战教程下载)
大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、AI4Science、端侧创新、自动驾驶、人工智能+、能源需求十个方面的重要发展趋势。
2025-03-06 16:19:29
222
原创 AI大模型·白皮书 | 2025年Agents 与基础应用白皮书
由谷歌发布,白皮书详细阐述了生成式人工智能智能体(Agents)的定义、核心组件、工作原理、工具类型、应用案例、模型性能提升方法以及在生产环境中的应用等内容。代理的定义与核心组件报告定义了代理的基本结构,包括模型、工具和编排层。报告展望了代理的未来发展,强调协作型代理和混合架构的潜力。同时,随着计算能力提升和推理技术进步,代理的适应性和复杂问题解决能力将进一步增强,为各行业带来革命性变革。在自动化客服、个性化推荐和流程优化等领域,代理展示了卓越的应用潜力。报告定义了代理的基本结构,包括模型、工具和编排层。
2025-03-06 14:00:49
186
原创 别再自己造轮子了!企业自建RAG系统的“坑”比你想象的多
自建RAG系统就像在2025年自建电子邮件服务器——技术上可行,但真的没必要。与其把时间和金钱浪费在重新发明轮子上,不如专注于解决实际问题,快速响应市场需求。五年后,没人会关心你是自建还是购买了RAG系统。他们只关心你的产品是否解决了他们的痛点。所以,别再纠结了,明智选择,轻装上阵吧!
2025-03-06 11:20:18
875
原创 信通院-高质量大模型基础设施研究报告(2024年)
随着模型参数量的不断增长,大模型展现出强大的理解能力和复杂数据处理能力,在金融、医疗、政务等多个领域展现出巨大的应用潜力。大模型基础设施作为支持大规模人工智能模型训练、部署和应用的硬件和软件资源的集合,是AI技术发展的基石。它涵盖了高性能计算、海量数据存储、高速网络连接资源,以及相应的软件框架和工具链,旨在为大模型的开发、训练和推理提供高效、可靠和可扩展的支撑环境。随着大模型技术的快速发展,对基础设施的要求也越来越高,如何构建高质量的大模型基础设施,成为当前AI领域亟待解决的问题。
2025-03-06 11:19:48
284
原创 深度解读DeepSeek:原理与效应(43页 PPT)(附相关资料教程)
在报告分享的第二部分,熊德意教授深入解读了DeepSeek的技术迭代路线、原理和创新,指出DeepSeek系列模型围绕模型架构和推理模型,通过算法和技术创新,以极低的训练成本实现与全球顶尖模型的性能对齐,其开源生态与推理能力为科研智能化提供了坚实基础;在分析DeepSeek技术创新程度时,熊德意教授指出,DeepSeek在模型架构方面围绕降本增效大胆魔改模型底层架构和训练算法,在第三部分解读DeepSeek效应时,熊德意教授进一步探讨了DeepSeek技术创新背后的深层原因,指出。
2025-03-05 18:08:02
448
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人