当前位置：首页|资讯

【花师小哲】当代炼金术（神经网络）前沿（70）——神经网络的“大脑”结构

作者：花师小哲-中二发布时间：2024-10-30

今天稍微讲讲这篇论文，主要是看到有些文章用“大模型里面也有脑区”作为噱头，但实际上还是有些区别的。 [图片] [图片] 1.SAE 本文研究的对象是稀疏自动编码器SAE，SAE的目标是有效提取数据中的重要特征。 SAE可以被用作理解大语言模型LLM内部机制的一种工具，所以说这篇文章能说明LLM中有脑区也不能算错。之前的研究表明，SAE空间中已经有概念的点云（简单理解就是在SAE空间中很多概念都表示为一个点，这些点组成一个“云”），所以本文是来分析这些特征点云在不同空间尺度上的结构的 [图片] 2.三层结...【查看原文】

推荐体验

相关资讯

【花师小哲】当代炼金术（神经网络）前沿（36）——ChatGPT比我会砍价

写ChatGPT万字拆解的符尧大佬近期发表了一篇新的论文：这篇论文的想法真的巧妙，简单来说，论文让两个大模型进行讨价还价的对抗。1.描述如图：思想很简单，就是让两个语言模型分别充当买家和卖家。卖家的目的是提高价格，买家的目的是降低价格，就是我们熟悉的讨价还价。除此之外，还有个第三者，你可以认为是两者的智囊团。因为现在的大模型还不够智能，引入智囊团可以帮助买卖双方更好的更新自己的策略。例如一组对话可能是这样的：（有一个人前来买气球）买家：我想买一个气球卖家：好啊，16块钱一个买家：好呀好呀第三者：卖家你不能

花师小哲-中二 2023-05-18

【花师小哲】当代炼金术（神经网络）前沿（10）——Diffusion是记忆者？

AI绘画的突然爆火离不开Diffusion模型，这是近两年兴起的图像生成技术，关于Diffusion模型在之前的专栏介绍过：【花师小哲】当代炼金术（神经网络）前沿（8）——Diffusion当然，本篇专栏也会再介绍其中的一些内容，所以可以不用急着跳转。近期，一篇新论文试图证明一件事：“Diffusion模型对训练集有着很好的记忆力”。虽然单一篇论文的说服力不一定足够，但可以预想到之后会有相关研究跟进。这可能会为当今对AI绘画的讨论产生一定的积极影响，不过我个人还是不太想掺和这个话题的深入讨论。本篇还关注了

花师小哲-中二 2023-02-01

【花师小哲】当代炼金术（神经网络）前沿（16）——语言模型的其他出路

自从实验室要求变更，最近可是忙得要死，这周读了14篇论文，也爆发一波，来一波大的，谈谈语言模型（主要是大语言模型）除了走ChatGPT的老路之外，还有哪些值得研究的方向。以下提到的不少论文其实都是谷歌在GPT-3出来之后搞的，可以看出谷歌确实是想针对GPT做些不一样的，相较于专一（搞钱）的OpenAI，谷歌的路要更广。0.调教模型有一个知识点好像至今讲的不是很多。大家在读语言模型或大语言模型相关的论文时，应该经常能看到few-shot、one-shot、zero-shot、prompt这类的字眼。传统的神

ChatGPT 谷歌 OpenAI 提示词

花师小哲-中二 2023-02-26

【花师小哲】当代炼金术（神经网络）前沿（35）——ChatGPT：“狮子生活在水里”

其实日常来说，我读的比较多的一类论文是以ChatGPT为代表的大模型的能力评估论文，主要是这类论文不需要多少脑子，熟悉了套路后半小时甚至都能啃一篇，在课题组要求一周至少10篇论文的情况下很容易充几个数。毕竟这类论文基本上是选择一个主题，然后要么人工要么搞点自动化方法（大模型的输出实际上很多时候不标准，所以如何正确提取答案也是一大问题），就没了，所以没什么好讲的。不过今天这篇论文有点意思：1.评估是做选择题？这个点我好像还没在专栏中特别提过，虽然动态说了几遍了。因为大模型的输出不一定是按照我们想要的格式的，

花师小哲-中二 2023-05-17

【花师小哲】当代炼金术（神经网络）前沿（44）——语言模型战胜了Diffusion？！

小更新一篇专栏，虽然确实没有太多可写的，但这篇论文确实很有意思（这次甚至都不打草稿了）：喜大普奔没错，语言模型在图片和视频生成中打败了之前的AI明星选手、将AIGC盘活的Diffusion，这可有的说道说道了。Diffusion模型见：【花师小哲】当代炼金术（神经网络）前沿（8）——Diffusion1. 语言模型可能很多同学会疑惑，哎，不是说“语言模型”嘛，怎么能生成图像的？其实之前在某PPT已经提到过了：这些都是语言模型！没错，最原教旨的语言模型实际上就是指的是唯一目的就是根据现有输入预测下一个东西（

花师小哲-中二 2023-10-16

近期资讯

AI产品观察：以后不需要实习生做数据看板了—Graphy

AI产品观察：以后不需要实习生做数据看板了—Graphy人人都是产品经理2024-10-28 09:32发布于广东人人都是产品经理的官方账号B端产品常常需要一个数据看板来查看整个供应链的状态，但大

人人都是产品经理 2024-10-28

英特尔酷睿 Ultra 200S 处理器背面左右两侧配备额外调试焊盘

英特尔酷睿 Ultra 200S 处理器背面左右两侧配备额外调试焊盘IT之家2024-10-28 09:31发布于山东IT之家官方账号IT之家 10 月 28 日消息，英特尔本月 10 日发布了采

IT之家 2024-10-28

三星Galaxy Z Fold特别版采用新铰链，零件数量是Z Fold6的两倍

三星Galaxy Z Fold特别版采用新铰链，零件数量是Z Fold6的两倍IT之家2024-10-28 09:16发布于山东IT之家官方账号IT之家 10 月 28 日消息，据 TheElec

IT之家 2024-10-28

Instagram高管确认：视频清晰度由其受欢迎程度决定，越高越清

Instagram高管确认：视频清晰度由其受欢迎程度决定，越高越清IT之家2024-10-28 07:26发布于山东IT之家官方账号IT之家 10 月 28 日消息，北京时间今天凌晨，据 The

IT之家 2024-10-28

被曝初来美国创业时非法工作，马斯克否认

被曝初来美国创业时非法工作，马斯克否认IT之家2024-10-28 08:16发布于山东IT之家官方账号IT之家 10 月 28 日消息，马斯克否认了有关其在美国创业初期非法工作的报道。这些报道在

IT之家 2024-10-28

英伟达「向上」，苹果「向下」：AI时代的岔路与选择？

英伟达「向上」，苹果「向下」：AI时代的岔路与选择？钛媒体APP2024-10-28 08:07发布于北京钛媒体APP官方账号文新氪度近期，英伟达和苹果在市值上的竞争格外引人注目。根据 2

钛媒体APP 2024-10-28

苹果新款智能家居设备细节曝光：采用半球形底座、小尺寸屏幕

苹果新款智能家居设备细节曝光：采用半球形底座、小尺寸屏幕IT之家2024-10-28 07:26发布于山东IT之家官方账号IT之家 10 月 28 日消息，此前传闻称苹果公司正在研发多款新的智能家

IT之家 2024-10-28

轻舟智航完成数亿元C+轮融资，CEO于骞：明年初量产端到端智驾

轻舟智航完成数亿元C+轮融资，CEO于骞：明年初量产端到端智驾36氪2024-10-28 09:41发布于北京36氪官方账号全文3596字，阅读约需11分钟，帮我划重点划重点01智能驾驶公司轻舟

36氪 2024-10-28

自动驾驶企业纷纷IPO，提升“造血”能力成关键

自动驾驶企业纷纷IPO，提升“造血”能力成关键36氪2024-10-28 08:10发布于北京36氪官方账号当地时间10月25日，自动驾驶企业文远知行在纳斯达克证券交易所挂牌上市。10月24日，智

36氪 2024-10-28

OpenAI语音转录工具Whisper被曝重大缺陷：凭空生成大段虚假内容

OpenAI语音转录工具Whisper被曝重大缺陷：凭空生成大段虚假内容IT之家2024-10-28 09:01发布于山东IT之家官方账号IT之家 10 月 28 日消息，当地时间 27 日，据美

IT之家 2024-10-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1