宠物社区网站开发设计文档200平米火锅店装修费用-贵港市网站建设公司-Seo优化

宠物社区网站开发设计文档,200平米火锅店装修费用,wordpress 加统计代码,免费做ppt网站【前言】生活中 AI 用得已经越来越多#xff0c;一直想要了解其大概原理#xff0c;这样才能知道 AI 能做什么#xff0c;不能做什么。恰逢最近看了OpenAI 联合创始人安德烈卡帕西一个长达 3 小时的视频#xff0c;用非常通俗易懂的方式讲解了像 chatGPT 这样的大语言模型…【前言】生活中 AI 用得已经越来越多一直想要了解其大概原理这样才能知道 AI 能做什么不能做什么。恰逢最近看了OpenAI 联合创始人安德烈·卡帕西一个长达 3 小时的视频用非常通俗易懂的方式讲解了像 chatGPT 这样的大语言模型是怎么一步步训练出来的像我这样一个基本没有技术背景的人也能看懂是非常优秀的科普视频。大家可以前往 B 站搜索“安德烈·卡帕西深入探索像ChatGPT这样的大语言模型”即可观看全文都有字幕不用担心听不懂。本文也从 3 小时的视频中提炼出最核心的内容希望能帮助你“不求甚解”地大概了解AI 大语言模型的基本训练原理。总览对大语言模型的训练跟我们人类学习知识的逻辑是一脉相承的视频中最让我印象深刻的一点是安德烈·卡帕西把大语言模型的训练逻辑类比成我们上学读书学习知识的过程竟然是出奇的一致。回想我们小时候的课本每个知识点的章节讲解都包含三个步骤第一步、学习知识点单纯地通过阅读了解相关知识。完成这一步我们只掌握了知识的表层却不知道如何使用。第二步、查看经典题目与解法通过查看经典题目了解知识点如何运用来解决实际问题。完成这一步我们能模仿这些经典解法去解决类似的问题。第三步、课后习题这个环节里面课本只会提供问题与答案需要我们自己研究如何解题。每个人的脑回路都不一样适合的解法也都不一样我们需要自己摸索各种可能的解法并找到最适合自己的解法。这个过程中甚至会激发出比经典解法更高效的方法。完成这一步我们就真正做到了对知识点的融会贯通。大语言模型训练的三个步骤也正正对应着这三步即接下来逐一介绍每个步骤。第一步、预训练【核心流程】1、学习信息搜集要学习知识自然要先获取信息而最丰富而免费的信息自然是来自互联网。因此最初的模型训练内容主要来自对互联网信息的爬取。当然这里要做的不是简单的爬取而是包含了过滤劣质网站、文本提取、信息去重等一系列数据加工的过程。2、信息的编码与压缩生成“token”爬取到的信息都是文字人类能通过文字理解其所表达的内容但计算机是不能的。那计算机能理解什么呢是数字与计算。因此要让计算机能学习这些信息首先要把文字转化为数字。这里也可以分为两小步第一步对文字的基本单元做编码例如英文而言自然是每个字母对应一个数字 ID中文则是每个汉字对应一个数字 ID第二步进一步压缩信息把信息中高频出现的“单元序列组合”编码出一个新的数字ID这样就可以用更短的 ID 序列更高效地表达一句话计算机需要理解的成本就会更低。例如在下图这个案例中既有“你”、“的”这样的独立汉字用一个数字ID来表示也有“你好”、“今天”这样的日常短语用一个数字 ID 来表示。而这里代表一个文字或短语的数字 ID就是所谓的大语言模型的“token”是计算机理解与输出信息的最小“信息单元”。3、信息学习神经网络“预测”模型的训练完成前面两步后我们已经有了用于学习的原材料数据接下来便可用于模型学习。那么什么是所谓的学习回到我们期望模型的效果是可以像人类一样根据上文内容输出适合的下文内容。也就是说根据上文“预测”下文的内容。因此这一步我们使用统计学中最前沿的“预测”模型神经网络模型再基于我们搜集到的原材料数据训练出一个基于上文输出下文的预测模型。浅显地介绍下这个神经网络模型的训练方法所谓的神经网络模型其实就是一个巨大的包含大量参数计算的数学方程式但其核心目标跟我们小学学的一元一次方程是类似的也是根据输入的“x”上文跟模型的参数“w”一系列计算输出一个结果“y”下文。但也有两个区别一个是我们之前定义的 token 并不是一个具有数值计算意义的数字而只是一个代表对应文字的“标识符”ID一个是这里输出的结果代表的是下文出现各个 token 的分别的概率值。参数训练一开始参数都是随机的数据输出的结果也是随机的。我们把从互联网上搜集到的学习材料都喂给模型进行训练。模型以提升学习材料中“正确”的下文 token 的概率为计算目标不断地调整参数。【得到的成果】当我们把全部互联网搜集到的知识都喂给这个拥有数十亿级参数的超大模型完成参数的训练后。我们就得到了一个可以根据“上文”预测下文的预测模型。而在预测时1、每一次预测都根据上文输入的全部内容只输出一个下文“token”2、根据上文输入的全部内容本质输出的结果是各个 token 出现的“概率”然后基于这个概率进行一次抽样输出一个下文“token”。正因为存在这个抽样而不是直接就只取概率最大的 token因此即使一样的上文每一次得到的下文都是不完全一样的。我们得到的只是一个根据上文不断预测下文 token的预测器且是随机的每次的预测结果都不一样还并不是一个能回答问题的助理assistant。我们把这一步得到的模型叫做 base model。案例下图这个例子很有意思。模型之所以能回答这个问题并不是因为它理解了这个问题以及会进行计算而是大概率 22 这样的问题在喂给模型的训练数据中出现过模型能够回忆出来。而如果放任模型不断地输出下文它就开始走向了跟问题完全没关系的哲学领域的内容当中…此时的模型还不知道应该如何正确地回答问题。【这个预测模型的本质】base model 的本质是互联网内容的模拟器。相当于把整个互联网的内容都压缩成一堆参数。而且这些内容是模糊的/有损的、概率性的/统计性的。特性它是一个token级别的互联网内容模拟器具有随机性/概率性——每次运行都会得到不同的结果它能凭借记忆逐字复述一些训练文档模型的参数有点像互联网的一个有损压缩文件大量有用的世界知识存储在模型的参数中通过巧妙设计提示词你可以激活其记忆输出与提示词相关的内容但我们还能让模型变得更好于是咱们来到了模型训练的第二步。第二步、后训练之“监督微调”【背景】完成预训练后我们已经得到了一个可以根据“上文”预测“下文”的预测模型了唯一的问题是它还不大会处理“问答”这种场景中的下文预测。要解决这个问题很容易想到那就是增加“问答类内容”的样本量再训练一下模型对这方面“上文”的处理能力。这就是”监督微调“的核心原理。这个阶段的模型训练方法与预训练阶段是相同的唯一改变的是数据集的类型变成了一系列“对话问答”类的内容。【核心流程】1、构建对话问答类 token 序列我们构建了|im_start|、|im_sep|、|im_end|等在预训练时没有的全新人为定义的特殊token用于把对话内容结构化变成一种对话内容特有的 token 序列。这些特殊 token 就像对话的‘分隔符’明确告诉模型‘|im_start|user’后面是用户的问题‘|im_start|assistant’后面是正确回答帮助模型学会‘问答对应’”。2、构造海量的对话问答类内容用于模型训练接下来我们构建海量的涉及各个领域的对话问答内容供给模型进行训练。这一步需要耗费非常非常大的人力投入。所谓没有“人工”何来“智能”。而随着现在大语言模型的不断进步也会通过大语言模型来生成这些数据用于新的模型训练。【得到的成果】完成训练后我们就得到了一个能够回答问题的模型我们称之为SFTsupervise fine tuning 监督微调 model。这个模型的本质是结合了预训练知识以及从后训练数据集中习得的模仿人类回答问题方式的一个预测模型。听起来是不是很像我们在学习完课本的经典题目的解法后依样画葫芦地解决类似的问题案例完成这一步模型已经能很标准地回答一些常见问题了。【关于幻觉产生的原因以及其缓解方法】幻觉产生的原因如上文描述模型的本质是一个概率预测模型回答会基于统计学从概率中抽样给出一个答案即使答案的概率本身在模型计算结果中非常低也有出现的可能。案例下图这个例子中后训练数据集曾经出现过”who is“这样的问题案例。在模型完成训练后回答类似问题时即使向模型提问一个完全不存在的人orson kovacs模型也会模仿后训练中这类问题的回答方式基于预训练的知识模拟出一个答案即使这个答案在模型计算结果中概率是非常低的模型也会选择进行输出因此就会出现胡编乱造的回答。缓解方法1、让模型学会说不知道丰富后训练数据集添加会回答”不知道“的案例2、让模型学会借助工具对于模型不懂的内容让模型使用包括联网搜索、计算工具等能力让搜索结果、计算结果成为模型的信息源也就是成为输入进模型的“上文”的一部分再输出答案要缓解幻觉问题可以引入以下几类训练数据第三步、后训练之“强化学习”【背景】在监督微调的过程中后训练数据集的提供者教会了模型按他们的方式去回答问题模型是他们的模仿者。但对于一个问题是有多种解法的。而我们作为人类其实并不了解模型我们并不知道哪个解法是更能帮助模型获得正确答案的。就像小时候做数学题每道题都有几种解法而我们每个人的脑回路是不一样的并不是书本给的经典解法就最适合自己最终需要我们自己摸索出最适合自己的最舒适的解法可以帮助我们自己获得最高的准确率这个摸索过程中甚至能迸发出比经典解法更优的全新解法。而这就是我们这一步需要做的事情。我们只给到题目与答案然后让模型自己摸索出最适合自己的解法。【核心流程】1、我们提供问题然后让模型自己去生成一系列的解法2、这些解法中只有一部分是正确的3、我们再从这些解法中找到最优秀的解法既准确又精简高效的4、把这个优秀解法作为训练数据集去用于模型训练5、如此往复重复很多很多次…【得到的成果】通过强化学习我们得到了两个喜人的效果1、模型产生了思维链chains of thought。这就是我们使用 DeepSeek 等最前沿的大模型的时候看到的思考过程。因此我们把他们称之为推理模型reasoning model。思维链的一个很重要的特点在于让模型有了思考的过程而不是一上来就回答问题。而这个思考的过程都会成为“上文”的一部分还记得大模型的预测原理是基于全部的上文推测出下一个 token因此上文的内容越长越完整预测出来的“下文”质量自然也会越高。2、模型能产生超越人类已有知识的全新解法。强化学习第一次出圈就是击败人类最强围棋手的 alpha go。它正是通过强化学习人类只告诉了它围棋的规则跟目标然后它通过自己不断的训练最终训练出了人类围棋历史上从来未有过的落子方法最终超越了人类。如果它只是限制在模仿学习人类围棋手的历史案例那它是不可能超越人类的。当然大语言模型的训练要比 alpha go难得多。因为围棋只是一个闭合领域问题规则有限而大语言模型要面对的是一个开放领域问题要解决各种各样的问题。因此需要找多足够多的练习题给到模型进行训练。总结最后再回顾一下模型训练的三个环节1、预训练获取基本知识2、监督微调查看大量实例模仿专家回答问题的方式3、强化学习提供习题让模型自己不断训练、试验、纠错直到找到正确的解法在上述训练方法的基础上模型不断进化并发展到现在支持多模态、多流程任务的模型。反思预测就等于逻辑吗了解完大语言模型的训练原理后最让我惊讶的是我们现在使用的可以解决这么多复杂问题甚至连高深数学题目都能解答的AI本质上只是一个统计学的“预测模型”吗我们人类独有的所谓“逻辑”能力就这么简单被一个“预测”模型所战胜了但转念一想会不会是我把“逻辑”想的太高深了。会不会是我们所拥有的“逻辑”本质上也是一种我们基于过去经验而对当前事情的一种“预测”当我们面对一个问题时所想到的解题路径也是我们基于自己过往经历类似事情时的成功或失败的反馈而得到的属于自己的一个解法。恰逢最近听了孟岩《无尽的探索》那期播客里面提到了美国计算机科学家、神经科学家杰夫·霍金斯的一本书《千脑智能》里面对大脑机制的阐述正是类似的或许我们人类自诩独有的“逻辑”与“智慧”就真的只是一种“预测模型”而已……或许硅基生命已然诞生正在以一种独特的方式重走着碳基智能的进化之路……想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”

宠物社区网站开发设计文档200平米火锅店装修费用

广州企业自助建站玉溪网络推广网站建设

电子政务公开网站建设做的最好的手机网站

网页设计和网站建设毕业设计赣州章贡区人口

网站模板样式修改沧州到黄骅

建设工程网站建筑工程预算好看的wordpress模板

用visual做网站怎么用群晖做网站

宠物社区网站开发设计文档200平米火锅店装修费用

广州企业自助建站玉溪网络推广 网站建设

电子政务公开 网站建设做的最好的手机网站

网页设计和网站建设毕业设计赣州章贡区人口

网站模板样式修改沧州到黄骅

建设工程网站建筑工程预算好看的wordpress模板

用visual做网站怎么用群晖做网站

广州企业自助建站玉溪网络推广网站建设

电子政务公开网站建设做的最好的手机网站