About 50 results
Open links in new tab
  1. 一文了解Transformer全貌(图解Transformer)

    Sep 26, 2025 · 网上有关Transformer原理的介绍很多,在本文中我们将尽量模型简化,让普通读者也能轻松理解。 1. Transformer整体结构 在机器翻译中,Transformer可以将一种语言翻译成另一种语言, …

  2. 如何最简单、通俗地理解Transformer? - 知乎

    Transformer最开始应用于NLP领域的机器翻译任务,但是它的通用性很好,除了NLP领域的其他任务,经过变体,还可以用于视觉领域,如ViT(Vision Transformer)。 这些特点让Transformer自2017 …

  3. 如何从浅入深理解 Transformer? - 知乎

    Transformer升级之路:1、Sinusoidal位置编码追根溯源 Transformer升级之路:2、博采众长的旋转式位置编码 猛猿:Transformer学习笔记一:Positional Encoding(位置编码) 解密旋转位置编码 解密 …

  4. 如何从浅入深理解 Transformer? - 知乎

    Transformer 全貌:一个纯注意力驱动的编解码架构 Transformer 的整体框架,依然遵循了序列建模经典的编码器 - 解码器(Encoder-Decoder)结构,但把里面的所有核心组件,都换成了注意力机制。 简 …

  5. Transformer模型详解(图解最完整版) - 知乎

    May 8, 2024 · Transformer 的整体结构,左图Encoder和右图Decoder 可以看到 Transformer 由 Encoder 和 Decoder 两个部分组成,Encoder 和 Decoder 都包含 6 个 block。Transformer 的工作流程大体 …

  6. 有没有比较详细通俗易懂的 Transformer 教程? - 知乎

    Transformer目前没有官方中文译名,暂时就叫Transformer吧。 在该论文中,作者主要将Transformer用于机器翻译 [2] 任务,后来研究者们发现Transformer在自然语言处理的很多任务上都展现出了优越 …

  7. 如何最简单、通俗地理解Transformer? - 知乎

    考虑到Transformer直接建模全局信息的魅力,许多研究尝试对其进行改造,以适应视觉数据分析任务。 自2020年10月,谷歌提出ViT模型开始,Transformer在计算机视觉领域展现出了强大的潜力。 在接 …

  8. MoE和transformer有什么区别和联系? - 知乎

    01. Transformer:像“万能翻译官”的神经网络 Transformer 是当今AI大模型(如ChatGPT)的核心架构,最初用于机器翻译,核心是自注意力机制(Self-Attention),能同时分析句子中所有词的关系,而 …

  9. Transformer两大变种:GPT和BERT的差别(易懂版)-2更

    Dec 16, 2025 · Transformer是GPT和BERT的前身。谷歌和OpenAI在自然语言处理技术上的优化,都是基于这个模型。 更多关于的Transformer可以看文章: ChatGPT与Transformer(无公式版) 而在目 …

  10. 如何评价NeurIPS 2025论文Credal Transformer 对幻觉 ... - 知乎

    如何评价NeurIPS 2025论文Credal Transformer 对幻觉问题的解决思路? 话题收录 NIPS2025 该论文针对现有 Transformer 架构可能导致LLM幻觉的问题提出了新的解决思路 [图片] 显示全部 关注者 134 …