当前位置：首页|资讯

Transformer怎样使用beam search 附代码

作者：任永旺发布时间：2024-10-15

感觉很简单的一件事，花费了三天多的时间才搞定，Transformers有相应的类，但是传递参数后的返回值，怎么处理一直没搞明白，找别人的代码调通之后，发现得到的结果不好，那么一定是代码有问题，最后找到他的代码：ChineseNMT/README.md at master · hemingkx/ChineseNMT (github.com)，他写的长，就拿来试试。

但是呢，他使用的是哈弗公布的Transformer的代码，我用的不是那个版本，贴出来我的一段代码，如果你的和我的一样，你就明白了

下面是我在他beam search的基础上修改后的代码

标注日期的1015或者带2014的部分是我做了修改的地方，可以参考原始文件。并且为了代码能正确运行，我对注意力机制的代码也做了一定的修改，这不妨碍平时使用，其中的if语句我把如果attn_mask和scores在shape[0]不一致的时候，我把attn_mask第0维进行了扩充

使用得到输出结果

我的Transformer内部是这样的关系，Decoder的输出是未经过projection的

希望对你有帮助。

推荐体验

相关资讯

使用 OpenAI API 实现 Emoji Search 的 Android APP

使用 OpenAI API 的 Embedding 模型实现 Emoji Search 的 Android APP。输入一段你对于相关 Emoji 的描述，来找到对应的 Emoji 表情

很好奇 2023-08-06

怎样使用chatGPT?

ChatGPT：开启智能交互新纪元，引领生活的变革在数字化时代的浪潮中，人工智能不断演进，为我们的生活带来了无限的可能性。其中，ChatGPT作为一款强大的语言模型，将对我们的生活产生深远的影响。它融合了创造力和智能交互，为人们的工作和生活带来了全新的体验。使用ChatGPT非常简单且直观。您可以通过以下几个步骤来使用ChatGPT：提供输入：将您想要与ChatGPT交互的问题、指令或话题输入到聊天框中。理解上下文：ChatGPT会尝试理解您的输入，并结合其训练模型中的知识和上下文来生成回复。查看回复：C

ChatGPT 人工智能

浅夏漠汐_bili 2023-07-13

新的HTML标签：

快来免费体验ChatGpt plus版本的，我们出的钱体验地址:https://chat.waixingyun.cn 可以加入网站底部技术群，一起找bug. 本文介绍了一种新的HTML元素搜索方法，

王大冶 2023-05-24

OpenAI全面放开使用 ChatGPT后会怎样？

其实不然，OpenAI开放这项应用，本身也是对CHatGPT的一种训练，接受更加海量的用户和数据的“轰炸”，本身也是对CHatGPT的一种测试，在OpenAI搭建这种使用平台的时候，就可以对CHatGPT进行…

刀马物语 2024-05-14

OpenAI官宣开源Transformer Debugger，不用写代码，人人可以破解LLM黑箱

OpenAI发布开源Transformer调试器TDB工具。

新智元 2024-03-12

近期资讯

外贸独立站搭建：开启全球化贸易新篇章

在全球化浪潮的推动下，越来越多的中国企业开始寻求外贸业务的拓展。而外贸独立站搭建，无疑成为了打开国际市场大门的关键一步。本文将为您详细介绍如何高效搭建外贸独立站，助您顺利开展国际贸易。一、理解外贸独立站的重要性外贸独立站，是指企业自主搭建的，专门用于展示产品、服务及进行在线交易的独立网站。与第三方平台相比，独立站具有更高的自主性和可控性，能够更好地展示企业形象，提升品牌知名度。 [图片] 二、搭建外贸独立站的步骤市场调研与定位：首先，了解目标市场的需求和竞争对手的情况，明确自己的产品定位和优势。域

马拉西亚的故事 14小时前

电脑技巧：推荐五款非常实用的剪切板增强工具

一、ClipXClipX是一款高效且实用的剪贴板管理工具，旨在为用户提供更加便捷和强大的剪贴板管理功能。它允许用户扩充剪贴板数量，最高可达1024个，极大地方便了文章摘抄、数据复制粘贴以及图片收集等多种场景。同时，ClipX还支持随时预览剪贴板内容，包括文本、图片和文件等，并提供了直观的内容列表界面。此外，ClipX还具备编辑剪贴板内容的功能，用户可以直接修改或删除剪贴板项，尽管这一功能可能需要额外的操作界面，但仍然为用户提供了更多的灵活性。值得一提的是，ClipX采用数据本地存储方式，即使电脑重启，剪贴

IT技术分享社区 14小时前

新能源储能设计 | 储能行业有哪些类型和发展潜力？

1. 储能产业发展背景1.1 储能概念及分类从广义上讲，储能即能量存储，是指通过一种介质或者设备，把一种能量形式用同一种或者转换成另一种能量形式存储起来，基于未来应用需要以特定能量形式释放出来的循环过程。从狭义上讲，储能特指针对电能的存储，即利用化学或者物理的方法将产生的能量存储起来并在需要时释放的一系列技术和措施。根据不同的存储介质和技术路线，储能主要分为机械储能、电化学储能、电磁储能、热储能、氢储能五大类，其中机械储能包括抽水蓄能、压缩空气储能、飞轮储能、重力储能等，电化学储能包括锂离子电池、铅蓄电

天慧光伏储能陈老师 14小时前

Thinkbook14,16,14+,16+,16p,x,SE 2024款各个型号怎么选？区别如何？买前防坑必看！

Thinkbook14,16,14+,16+,16p,x,SE 2024款各个型号怎么选？区别如何？买前防坑必看！打算入手联想ThinkBook系列笔记本的朋友们，这份双十一导购清单，选购指南，或许可以帮您少走弯路，避免入坑。一、先来看看导购清单和双十一活动售价行情：目前除了双十一优惠价格以外，该系列笔记本还支持政府补贴20%，最高可以优惠2000元，朋友购买的时候，建议先咨询客服，自己的地区是不是支持政府补贴20%，这样双十一优惠+国补20%优惠，那是省了大钱了，另外还有红包领取，朋友们叠加起来，这样入

老翟谈数码 14小时前

企业申请展会搭建资质时如何准备材料？

在展会行业中，展会搭建资质不仅是企业实力的象征，更是参与大型、高端展会项目的重要门槛。企业若想在展会搭建领域脱颖而出，获得客户的信任和认可，申请展会搭建资质是不可或缺的一步。然而，申请资质的过程往往繁琐复杂，材料准备更是其中的关键环节。本文将详细解析企业在申请展会搭建资质时如何高效、准确地准备材料，助力企业顺利通过审核，赢得更多商机。一、明确资质申请要求在准备材料之前，企业首先需要明确展会搭建资质的申请要求。这包括了解资质等级、申请条件、所需材料清单以及审核流程等。企业可以通过查阅相关法规、政策文件，或咨

中一信 14小时前

机器视觉检测技术在外观缺陷检测的创新与应用

视觉检测系统通过高精度的相机和图像传感器，能够捕捉产品的细微特征，并利用图像处理和分析技术对产品进行高精度的检测。这种技术可以实现对产品缺陷的准确识别和分类，发现微小的瑕疵或偏差。相比传统的人工检测方法，机器视觉检测可以实现自动化、连续的检测，大大提高了检测效率，减少了人力成本和时间成本。同时，机器视觉系统的检测精度可以达到微米级，远超人眼的识别能力，从而确保了产品质量的稳定性和一致性。一、机器视觉检测技术的创新性 1.高精度检测：微深机器视觉检测系统能够对产品外观、尺寸、颜色、形状等多维度信息

微深联创 14小时前

高口碑网站建设公司盘点：谁是你心中的NO.1？

随着互联网的飞速发展，网站建设已成为企业不可或缺的一部分。今天，我们就来盘点一下几家高口碑的网站建设公司，看看它们各自有何特色。蒙特网站蒙特网站，这家总部位于中国杭州的高端网站服务机构，凭借其深入的行业洞察和卓越的设计能力，赢得了众多客户的信赖。其服务范围涵盖品牌升级、数字化转型等多个领域，已成功帮助万余家企业实现网站业绩的持续增长，其中包括华为技术、字节跳动等顶尖企业。蒙特网站的优势在于其以用户为中心的设计理念和出色的用户体验优化能力。 [图片] [图片] 奥美作为全球知名的广告公司，奥美在网站建

蒙特网站 14小时前

为什么企业要用新型缓震减震材料替换传统缓震减震材料？

主要有以下原因：性能方面：减震效果更优：传统减震材料在吸收和转化冲击能量方面效果有限，对于一些高频、高强度的震动，减震效果不显著，难以满足现代设备对高精度和稳定性的要求。而新型缓震材料通过特殊的结构设计或材料配方，能够更有效地吸收、分散和转化冲击能量，大大降低振动的幅度和频率，为设备提供更稳定的运行环境。例如，ACF 人工软骨材料等新型材料可以吸收高达 90% 以上的冲击力，相比传统橡胶、EVA 等材料的减震效果有显著提升。适用范围更广：传统减震材料的性能往往受到温度、湿度、频率等因素的影响，在一些特殊环

ACF人工软骨材料 14小时前

未检法治教育基地，人民检察院未成年教育基地设计

未成年人是社会的希望和未来，他们的健康成长关系到社会的可持续发展。在这个信息爆炸、社会变迁迅速的时代，未成年人面临着前所未有的挑战与危险。为此，建立一个专门的未成年保护教育基地，不仅是一项必要的措施，更是对社会未来的战略性投资。基地的课程设置应涵盖自我保护、法律知识、心理健康、社交技能等多个方面。通过互动式教学和情景模拟，帮助未成年人识别潜在的危险，学会应对突发事件。例如，可以通过角色扮演的方式，让孩子们亲身体验不同的情景，如遭遇陌生人跟随、网络安全陷阱等，从而提高他们的警觉性和应对能力。基地还应设置专门

锐警 14小时前

多台潜水推流器同时使用的布置方式

潜水推流器主要用于水处理工程，特别是污水处理工艺中的氧化沟和缺氧池，主要作用是对水体进行搅拌、混合并推流，改变水体固、液分层的现象，形成悬浊液(即泥水混合液)后再将水体向前推流，最终实现水体紊动的流场和均势流态，有效防止污泥沉淀淤积，优化污水处理效果。潜水推流器属于24h连续不停歇运转的设备，已成为污水处理工艺不可缺少的关键设备。但是有些用户多台潜水推流器一起使用时，因为布置方式不合理而达不到预期效果。那两台潜水推流器一起使用时，应该怎样布置最合理呢？潜水推流器并列安装方式是很多用户首先想到的布置方

江苏艾文科技有限公司 14小时前

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1