- 博客(515)
- 收藏
- 关注

原创 盘点国产十大最实用的AI大模型!(深度解析)
在这个由数据驱动的时代,人工智能(AI)已经成为推动世界进步的超级引擎。从日常的语音助手到复杂的医疗诊断,AI的应用无处不在,它的影响力正以前所未有的速度扩展。今天我们来聊聊那些国产的AI大模型,深度盘点一下国产最实用的十大AI大模型百度文心大模型包含NLP(自然语言处理)、CV(计算机视觉)和跨模态大模型。在自然语言处理领域,文心ERNIE系列模型具有强大的小样本学习能力和基本推理能力。在计算机视觉领域,百度提出了基于视觉掩码技术的文心VIMER-CAE,具有强大的图像分割能力。
2024-12-10 14:08:23
6820

原创 我们为什么要用本地大模型?——坤叔的本地大模型入门指南
大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。
2024-05-23 10:52:45
7979

原创 值得收藏!十大中国流行的AI大模型企业及平台汇总
在当今这个信息化迅速发展的时代,人工智能技术已经成为推动社会进步的重要力量。特别是在我国,AI大模型技术的发展速度令人瞩目,各种平台纷纷涌现,表现出强大的技术实力和广泛的应用前景。
2024-05-16 13:37:12
8650

原创 一文读懂 LLM 训练:从预训练到微调【大模型行业应用入门系列】
LLM Training 是指大型语言模型(LLM)的训练过程。作为一种采用超大规模数据进行预训练的深度学习模型,LLM 训练目标是培养出一个能够理解和生成自然语言文本的模型。在这个过程中,LLM 通过处理海量文本数据来学习语言的规律、语义和上下文关系等训练方式,可以获得丰富的语言知识和智能,从而使得能够自动理解和生成人类语言。通常而言,这种训练过程通常需要大量的计算资源和时间,以便模型能够充分地学习语言的各个方面。
2024-04-16 15:39:20
6402

原创 全民AI时代:手把手教你用Ollama & AnythingLLM搭建AI知识库,无需编程,跟着做就行!
本地运行大模型耗资源,需要选择较小的模型作为基础模型。在终端中运行时可能会出现 CUDA 错误,表示显存不足,导致提供的端口失效。中文支持不够完善。3. 文中提到的技术软件工具有:Ollama、Chatbox、Open WebUI、向量数据库、嵌入模型、本地模型 Gemma、AnythingLLM。
2024-04-10 11:10:50
8886

原创 一文吃透多模态:多模态大模型的探索 五大研究方向与十大应用领域!
理想中的多模态大模型具备跨模态的泛化理解和生成能力,其更符合人类感知世界的方式,其或能进一步打开AI能力的上限。产业界也在积极探索多模态大模型可行的技术路径,在多模态领域“复刻”大语言模型的成功。但目前多模态大模型的技术栈也尚未收敛,多模态学习和跨模态对齐仍为技术难点,未来产业发展仍有无限可能。在大模型兴起之后,产业也试图在图像、视频、音频等更多模态领域复现“Scaling Law”的成功,继续实现大模型的“智能涌现”。• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
2024-04-07 18:30:11
6843
原创 如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?
结构化输出就是大模型在生成响应时,以一种有结构的规范化形式呈现,而不是自由文本。这种结构化的输出通常包括预定义的字段、标签、列表、表格、或者其他形式的组织化数据,而最常见也是最灵活的一种表达形式就是JSON。
2025-03-14 13:48:43
736
原创 训练私有化AI大模型,你一定要会用RAG
RAG检索增强生成(Retrieval-Augmented Generation )是一种结合大语言模型(LLM)与外部知识库的技术,通过动态检索相关外部信息辅助模型生成更准确、可解释的答案。其核心目标是解决LLM(大语言模型)的三大局限:RAG通过“检索-增强-生成”三阶段实现:检索:从知识库中提取与用户问题相关的信息片段(如通过向量相似性搜索)。增强:将检索结果与用户问题结合形成上下文。生成:LLM基于上下文生成最终答案。RAG的架构分为 离线阶段(索引构建) 和 在线阶段(检索生成) 两部分
2025-03-14 11:59:18
624
原创 Manus来了,AI大模型跨入应用时代,企业如何真正落地?
随着Manus AI等通用人工智能体(AI Agent)的发布,AI大模型的产业化应用正加速落地。从智能内容生成到精准营销推荐,AI正在深度赋能千行百业。然而,企业如何真正用好大模型?如何降低训练成本?如何结合自身业务场景高效应用AI?这一切的关键,在于私有化部署与行业数据积累。
2025-03-14 11:48:26
429
原创 DeepSeek-V3 高效训练关键技术分析
今年春节 DeepSeek-V3&R1 对国内外 AI 圈产生了巨大的影响,其本质在于开拓了一条不同于 OpenAI 训练方法的道路,证明了通过模型架构和训练方法的极致优化,能够基于更少的算力资源训练出同等能力水平的大模型,这不仅让人们对 OpenAI 等厂商的高算力投入产生质疑,更通过将先进模型开源的策略对 OpenAI 等闭源模型的商业模式形成了巨大冲击。本文试图探究 DeepSeek 为什么能够利用5%的算力训练出对标 GPT-4o 的先进模型,由于 DeepSeek-R1 源于 DeepSeek-V
2025-03-14 11:43:23
460
原创 企业AI大模型混合引入:选型与测评
在科技飞速发展的当下,人工智能已成为驱动各行业变革的核心力量,而大模型则是这股力量的关键引擎。大模型依托庞大的参数规模与强大的学习能力,在自然语言处理、计算机视觉、智能推荐等多元领域展现出巨大潜能,为各行业的创新发展注入新的活力。然而,随着大模型技术的百花齐放以及应用场景的持续拓展,如何精准地从众多模型中挑选出契合自身需求的大模型,成为研究人员、企业与开发者亟待解决的关键问题。在此背景下,大模型选型评估作为破题的关键手段,其重要性日益凸显。从研究视角看,大模型选型评估为学术探索筑牢根基。在人工智能研究范畴内
2025-03-13 14:05:17
357
原创 使用LangChain建立检索增强生成(RAG)系统
RAG是一种通过附加数据增强 LLM 知识的技术。LLM 可以推理广泛的主题,但它们的知识仅限于在训练它们的特定时间点之前的公共数据。如果你想构建能够推理私有数据或模型截止日期后引入的数据的 AI 应用程序,则需要使用模型所需的特定信息来增强模型的知识。将适当的信息引入和插入模型提示的过程称为检索增强生成(Retrieval Augmented Generation)。LangChain 有许多组件旨在帮助构建问答应用程序,以及更普遍的 RAG 应用程序。注意:这里我们专注于非结构化数据的问答。
2025-03-13 11:56:46
569
原创 Deepseek+科研工具,“王炸组合”来了!(附完整版指南)
虽然Deepseek强大的信息检索、分析及整合能力,使得复杂的数据处理变得轻而易举。然而,单一工具的应用往往难以满足科研的多元化需求。
2025-03-12 10:45:34
1099
原创 最新扣子(Coze)免费教程指南:工作流实现文章读取提炼
首先,创建一个工作流。在个人空间,资源库右侧选择 “+资源”中的 “工作流”,创建工作流。如图所示:填写工作流名称以及用途参数如下,用于用户输入网站。
2025-03-12 10:41:03
197
原创 厦门大学:DeepSeek大模型及其企业应用实践(全文150页)
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。
2025-03-11 10:25:43
286
原创 Manus启示录:2025,AI Agent即将引爆
Manus 之所以能在竞争激烈的 AI 市场中脱颖而出,主要凭借以下独特优势。其强大的功能集成和任务执行能力是一大亮点。它打破了传统 AI 智能体功能单一、任务处理局限的局面,实现了多领域、多任务的协同处理,真正做到将用户的想法转化为实际行动。无论是复杂的工作任务还是生活中的各种需求,Manus 都能应对自如,为用户提供一站式的解决方案。领先的技术架构也是其核心竞争力之一。
2025-03-11 10:24:10
947
原创 Ai抢饭碗了:DeepSeek一键生成图表,高效又美观~
在当今信息爆炸的时代,数据可视化变得尤为重要。无论是为了展示研究成果、商业数据报告还是个人项目,一个清晰且专业的图表能够极大地增强信息的传递效果。你还在用Excel制作图表吗?想不想体验一下DeepSeek智能生成图表?不仅外观好看,而且还有许多Excel中没有的图表样式。今天,易老师就带大家一起来看看DeepSeek是如何生成图表的!
2025-03-10 10:24:33
1077
原创 不再混淆了!一文揭秘MCP Server、Function Call与Agent的核心区别
MCP Server、Function Call和Agent在AI生态中扮演着不同角色,分别对应“工具箱”、“瑞士军刀”和“智能工人”。三者各有优劣,开发者应根据任务复杂度、团队协作需求和安全隔离性综合选择。通过合理搭配,可以构建出高效、灵活的AI系统,释放大模型的最大潜力。
2025-03-08 10:37:45
949
原创 中国造出世界首个通用型Agent
Manus发布当日,A股AI智能体指数暴涨6%,边缘计算设备销量激增230%。麦肯锡测算其可将咨询报告成本降低80%,预计到2028年,15%的日常决策将由Agent接管。母公司Monica.im估值突破45亿美元,背后资本矩阵涵盖软银、红杉等巨头,印证了“应用层创新”的商业化潜力。
2025-03-08 10:17:38
739
原创 AI大模型就业指南:大模型热门就业方向有哪些?
随着人工智能技术的飞速发展,大模型(Large Models)已成为推动行业革新的关键力量。这些模型在自然语言处理、计算机视觉、推荐系统等领域展现出卓越的性能,为求职者开辟了新的职业道路。本文将深入探讨AI大模型时代下的热门就业方向。
2025-03-07 10:11:07
561
原创 全网炸了!Manus到底是什么神仙AI?
最近,互联网被一个名字刷屏——Manus。各路大V狂推,朋友圈铺天盖地,甚至有人直呼:“谁还在手动做PPT?Manus已经帮我搞定一切!那么,这个火到出圈的Manus到底是什么?它凭什么成为爆款?
2025-03-07 10:06:40
655
原创 DeepSeek行业应用案例集:解锁智能变革密码-浙江大学(153页)(附DeepSeek自学手册)
在数字化浪潮汹涌澎湃的当下,DeepSeek以其强大的技术实力,如同一股创新的洪流,席卷众多行业,为各领域带来了前所未有的变革与突破。本案例集初步收录了40多个来自农业、制造业、汽车行业、手机行业、智能家居、物流、云服务、办公网络安全、金融、医疗、教育等多个关键行业的应用案例。这些案例多方位多角度展示DeepSeek在不同行业的落地实践与显著成效,为各行业从业者提供了宝贵的参考与借鉴,引领大家一同探索智能时代的无限可能,见证DeepSeek如何成为推动各行业迈向智能未来的核心驱动力。
2025-03-06 16:17:52
333
原创 2024年中国AI大模型产业发展与应用研究报告(PPT 可编辑)
2024年以来,我国AI大模型的产业应用已经迅速展开,本报告通过调研中国AI大模型产业发展和市场应用,梳理AI大模型的发展历程、产业生态、商业模式、行业应用、市场规模、发展趋势等,并对典型垂类行业和场景应用案例进行剖析。
2025-03-06 11:18:11
121
原创 探索 DeepSeek:改变生活,引发对AI未来的思考
DeepSeek 的 AI 工具在近期悄然间收获了大量关注。它展现出极为丰富的功能,既能创作诗歌、编写代码、生成各类文章,又能够与使用者进行交流对话、解答多样的问题,还可辅助规划旅行安排、起草求职相关文书等。如此强大的功能,让众多接触过它的人不禁感叹,它似乎拥有应对众多不同类型任务的能力。DeepSeek 的出现,使得人工智能再度成为众人讨论的焦点。在相关探讨中,一部分人认为它堪称 AI 时代的 “新宠儿”,极有可能极大程度地变革人们的生活方式;
2025-03-06 10:23:13
558
原创 2025年如何快速掌握AI Agent?揭秘学习路径
2025年的AI Agent学习不再只是技术人员的专利,而是每个希望利用技术提升业务效率的人的必修课。选择合适的AI Agent,不仅需要技术的洞察力,更需要对自己业务需求的深刻理解。在这个过程中,不妨尝试一些实践平台,比如morebots,它可能就是你探索AI Agent世界的敲门砖。
2025-03-06 10:20:27
778
原创 A I技术全景入门分享(78页 PPT)
从 AI 的基础概念、核心算法,到机器学习、深度学习等热门领域,都将深入浅出地讲解。无论你是对 AI 感兴趣的小白,还是想进一步夯实基础的爱好者,都能在分享中收获满满。专业人士将结合实际案例,为你剖析 AI 在各行业的应用,带你探索 AI 的无限可能,开启这场精彩的 AI 学习之旅,一同迈向智能时代。
2025-03-05 18:07:01
213
原创 北京大学DeepSeek内部研讨系列—DeepSeek与AIGC应用+提示词工程和落地场景(PPT)
手册不仅帮助读者掌握 DeepSeek 的基本使用方法,还提供了关于如何科学选择与高效使用 AI 工具的指导,确保每一位读者都能在实际应用中获得真正的价值。我们通过简明易懂的步骤与案例,带你探索如何将 DeepSeek 与 AIGC 应用场景结合,提升工作效率,并解决工作中的复杂问题。我们还将深入探讨大模型和 AIGC 的底层工作机制,帮助大家突破单纯的工具应用层面,理解其深层次的价值。希望通过这本手册,能够帮助大家突破这些局限,理解 AI 工具的真正潜力,将其融入日常工作,推动职场中的智能化变革。
2025-03-05 17:56:39
134
原创 DeepSeek发布R1模型,好好恶补文章中提到的“蒸馏技术”
知识蒸馏(Knowledge Distillation,简称KD)是由AI领域的三位大佬Geoffrey Hinton、Oriol Vinyals和Jeff Dean在2015年提出的技术,旨在通过将复杂教师模型的知识迁移到较简单的学生模型中,使学生模型在保持高性能的同时,能够实现更小的模型规模和更快的推理速度。比喻:学生向老师学习简单来说,蒸馏技术就像是学校里的学习过程:老师拥有丰富的知识和经验,学生通过学习老师的知识逐渐成长。
2025-03-05 10:48:37
851
原创 从AI Agent到Agentic Workflow:技术焦点的转变与未来发展
企业必须将焦点从专注于某些特定工具或趋势——例如曾经自称为 RAG 公司、Prompt Engineering 实验场等,转移到解决现实世界的商业挑战上。世界正以前所未有的速度向前发展,几乎每天都有新技术涌现,每一项都承诺能够颠覆各个行业。然而,
2025-03-05 10:32:54
743
原创 复旦大学-大语言模型赋能自动化测试实践、挑战与展望(附PDF下载)
报告通过案例分析,展示了LLM在等价类划分测试技术、测试输入增强、场景测试用例生成和跨APP测试用例迁移等方面的应用。同时,指出了LLM在自动化测试中可能遇到的问题,如幻觉、边界条件测试的矛盾、复杂输入结构的测试用例生成困难,以及文档缺失对预期结果生成的影响。太侠今天分享的是《大语言模型赋能自动化测试实践、挑战与展望》,来源:董震,复旦大学计算机学院。本文探讨了大语言模型(LLM)在自动化测试领域的应用,包括实践案例、面临的挑战和未来展望。基于大语言模型的等价类划分测试技术。基于大语言模型的测试输入增强。
2025-03-04 12:01:35
205
原创 DeepSeek技术全景解析(一):一场效率革命的技术解密
DeepSeek的崛起不仅代表了国产AI技术的一次重大突破,也为全球AI领域注入了新的活力。通过一系列算法创新,DeepSeek打破了传统计算架构的限制,在效率和性能上达到了新的高度。其在MoE架构、注意力机制、推理能力等方面的创新,解决了算力瓶颈问题,并通过开源生态的力量推动了技术的普惠和发展。DeepSeek不仅展示了中国团队在AI领域的创新能力,还为全球AI产业格局的重塑提供了新的视角。从短期来看,DeepSeek的V3和R1系列将在多个行业场景中大放异彩,推动人工智能技术在更多领域的落地应用;
2025-03-04 10:46:24
985
原创 金融银行系统接入Deepseek-R1模型做蒸馏&微调&RAG技术对比与选型
Deepseek-R1大模型是一款基于Transformer架构的先进预训练语言模型,具备强大的语义理解和生成能力。该模型能够高效处理银行系统内的复杂任务,如客户服务、风险控制、合规审查等。其核心优势在于其高度定制化和适应性,能够通过多种技术手段(如蒸馏、微调、RAG)进行优化,以满足不同应用场景的需求。首先,Deepseek-R1大模型的结构采用了多层级注意力机制,能够捕捉文本中的细粒度信息。其预训练阶段使用了超过100亿个金融领域的Token,涵盖了银行报告、合同文本、客户对话等多样化的数据源。
2025-03-04 10:09:04
753
原创 DeepSeek-R1大战豆包、Kimi,国产AI大模型第一花落谁家?
日活用户突破2000万,与中国移动、华为、金山办公、吉利汽车等企业相继达成合作,DeepSeek迎来了高光时刻。在互联网巨头争相进入AI行业的今天,企业为实现技术领先,纷纷斥巨资买数据和算力芯片,打造万卡集群。然而DeepSeek却选择了与众不同的以“花小钱办大事”路线,推出的V3模型训练成本仅557.6万美元,最新的R1模型,则以V3模型为基座,号称能力不输OpenAI开发的o1大模型。
2025-03-03 17:20:29
940
原创 字节跳动 HLLM:革新推荐系统的分层 LLM 方案
HLLM 通过创新的分层架构,有效利用 LLM 的强大能力,成功解决了推荐系统面临的诸多问题。它将 LLM 的预训练知识融入推荐模型,在 Item 特征提取和用户兴趣建模方面表现出色,同时证明了推荐目标微调的重要性。HLLM 具有良好的 Scaling Law,随着模型参数和数据量的增加,性能不断提升。在与其他模型的对比中,HLLM 展现出显著优势,并且在训练和 Serving 效率上也能满足实际应用的需求。线上 AB 测试更是验证了其在真实场景中的有效性,为推荐系统的发展开辟了新的道路。
2025-03-03 15:27:46
996
原创 一步步教你如何构建一个通用的大模型智能体(LLM Agent)
LLM 与 Agent 之间的主要区别在于系统提示(system prompt)。在 LLM 的上下文中,系统提示是一组指令和上下文信息,在模型处理用户查询之前提供给它。Agent 预期的行为可以在系统提示中进行编码,从而定义其 Agentic 行为模式。工具调用(Tool Use)Agent 决定何时将查询传递给合适的工具,或直接依赖自身知识回答。自反思(Reflection)Agent 在回应用户之前,会先检查并修正自己的回答。大多数 LLM 系统都可以加入一个反思步骤。
2025-03-03 15:23:02
1015
原创 “AI+医疗”深度融合,江苏加速医疗大模型落地应用
近年来,医疗大模型技术凭借强大的自然语言理解、推理能力及多模态处理性能,正逐步成为医疗行业智能化转型的核心驱动力。其中,DeepSeek以其强大的性能和广泛的应用前景,为医疗行业的智能化升级带来了新的机遇。在国家大力推动“AI+医疗”深度融合的宏观背景下,江苏积极探索,试点DeepSeek等医疗大模型的本地化部署和深度应用。从“互联网+”到“AI+”,数智升级,为“健康江苏”建设注入了新活力。
2025-03-02 14:00:00
1316
原创 2025年大模型辅助编程行业深度分析:技术革新与应用前景
本次,我将为大家剖析由华泰证券大模型辅助编程手册》。该报告共_页,涵盖了众多重要信息和核心论点。若您希望深入了解,请参阅原报告,获取方法已在文档的最后部分提供。
2025-03-02 08:15:00
1549
原创 你想在本地部署大模型吗?本地部署大模型的三种工具
人工智能的发展如火如荼,也让越来越多的人了解到人工智能;而对大部分人来说使用的都是第三方提供的客户端,不论是网页版,还是PC端或移动端。那么,我们怎么在本地部署一款大模型呢?下面就来介绍三种工具。01本地部署大模型的三种工具_gpt4all是一款可以本地部署大模型的客户端工具,其支持window,macOS和ubuntu(一款linux桌面系统)系列。其官网地址:https://gpt4all.io/index.html。
2025-03-01 14:45:00
944
原创 今日两巨头AI大模型将发布!
近期AI风暴热潮仍在继续。除了DeepSeek已飞速接入多个行业外,全球各类大模型仍在不断发布或升级。近日,华为数据储存公众号发布信息称,将发布基于华为DCS AI解决方案打造的瑞金病理模型。据介绍,该模型将于2月18日举办的“2025医疗人工智能与精准诊疗发展论坛”上发布。DCS AI是“Data-Centric Smart AI”的缩写,意为“以数据为中心的智能AI”。这是华为在人工智能领域的一种解决方案,强调以数据为核心,结合云计算、大数据和AI技术,为行业提供智能化服务。
2025-02-28 22:03:00
646
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人