😀 一直有音视频转文字,然后做笔记或总结的习惯,两年前写了一个字幕提取工具,破解了第三方语音转文字APP的API,用脚本批量调接口来提取。当时掏了98买了两年服务,前阵子过期了,按照我的使用频次...【查看原文】
1 whisper 简介Whisper 由 OpenAI 在2022年9月21日开源,号称其英文语音辨识能力已达到人类水准。Whisper 是一种通用的语音识别模型,它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。2 whisper 环境配置2.1 安装 whisper首先需要安装 python 环境。这里需要特别注意版本问题,Whisper 当前支持的版本范围为 python 3.8~3.10,版本过高会导致版本检测失败,过低则安装脚本执行过程各种报错
OpenAIWhisper
任侠001 2023-07-12
今天总算搞定了,用amd显卡加速openAI-whisper音视频转字幕和文字。要比用cpu快了很多很多。下面是我的电脑配制第一步:为amd显卡安装完整的rocm到amd官网下载自己对应该的显卡驱动安装脚本https://www.amd.com/zh-hans/support我的显卡是6600xt这是会跳到脚本下载页面默认保存在下载目录来到下载目录下面空白处鼠标右键选择在终端打开分别在终端输入下面的命令sudo vim /etc/os-release按i 用键盘上的上下左右移动键,移到Deepin这里,把
蜂哥笔记 2023-08-14
ChatGPT估计都不用再介绍了!就算没有听过的,都知道这是一个“很厉害”的AI当然,估摸你也用过不少换壳版的GPT,或者第三方转发的!但是天下没有免费的午餐!OpenAI对于还用API(端口)是要付费的,要么就上官方页面免费使用,要么就用国内套壳的版本!【是有些是免费的,ta们是从广告费赚钱或补成本】这是一编最简单的操作教程不过我还是喜欢独享的,半独享也是好事!所以,这应该是没有字数限制,或者没有使用限制!对了!之前想着,能不能把GPT接入到私人微信里面,然后就找呀找!结果!选定两个东西,一个是国内转发
ChatGPTOpenAI
手痕定律 2023-12-14
语音实时识别音视频秒转文字AI帮你总结速览这效率不直接倍增大家好我是与AI共生的小爱今天我们来试用一下通义听悟不仅可以通过通义千问APP和通义听悟微信小程序体验到也可以通过安装通义听悟的浏览器插件体验到开会时可以开启实时语音转文字进行记录实现同步翻译和实时要点总结观看视频网课时可以实现音视频转文字观看语音播客内容时也可以实现语音链接一键转写文字并AI智能总结我这边测试了一下自己常用的[小宇宙]的播客内容把分享链接复制给通义听悟一键解析后生成了AI智能速览和原文其中智能速览不经有全文概要还有章节速览原文部分
通义千问
爱蒲AIPU 2024-04-18
自从OpenAI发布了ChatGPT后,印象中离我们生活很远的AI一下子就来到了我们面前。各种类似的AI技术也如雨后春笋般迸发。之前小编一直在向大家讲解用于AI画图的Stable Diffusion,那么文字方面的AI该如何在本地进行部署呢?今天小编就为大家介绍一下清华大学的ChatGLM2大语言模型的本地化操作。与Stable Diffusion一样,使用ChatGLM2模型需要提前搭建好运行环境与UI界面。不过相比SD来说,大语言模型需要的依赖非常多,体积也很巨大。好在我们可以在github上下载oo
清华OpenAIChatGPTStable DiffusionGitHub
机械革命笔记本 2023-10-13
最近,一篇研究文章从数学理论上证实了AI模型可以完全模拟神经元和突触的信号,在更强算法、更大算力的加持下,可以精确模拟大脑及其功能系统,在无约束的情况下未来AI百分之一百会超越人类智能,甚至发明创造能力也是如此。
21世纪经济报道 2024-12-27
12月27日,网易云音乐2024年度听歌报告正式上线,迅速刷屏朋友圈,带领用户穿梭于过去一年的音乐记忆。今年的听歌报告以“人生是旷野,音乐也是”为主题,不仅充分延续往年的特色,更引入了双人年报、歌手手写信等创新玩法,及月份听歌偏好、年度精神状态等全新维度数据信息,为用户提供互动性更强、更细腻的报告体验。
读娱官网 2024-12-27
12月20日,据第一财经消息,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米,她或供职于小米AI实验室,领导小米大模型团队。种种迹象表明,未来一年,小米要对大模型大力投入了。2019年,因研二在NLP(自然语言处理)国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,曾登上知乎热搜。
财经天下WEEKLY 2024-12-27
北京姜庄湖智慧绿色超充港近日建成投运,站内集超充、无线充、智能机器人充电等多项先进技术于一体,日均充电可达3000车次,超级充电服务能力居全市首位。国网(北京)新能源汽车服务有限公司副总经理杭洋介绍,站内设有25台超充桩、2台直流快充桩,可以同时为57辆电动汽车充电。
光明网 2024-12-27
如何通过创新设计与智能技术提升厨房环境的健康性、环保性与人文关怀,成为现代家居生活发展的关键命题。作为高端厨电领域的引领者,方太始终站在技术创新的前沿,通过原创发明集成烹饪中心品类,聚焦空间效率、烹饪效率和空气效率,以高端全场景解决方案,推动健康厨居生活的持续创新与迭代。
WiFi新连接 2024-12-27
12月26日,一加正式推出了主打游戏体验的一加Ace5系列手机,包括一加Ace5和一加Ace5Pro两款机型,售价分别为2299元起和3399元起。此次一加Ace5系列在设计和配置上全面升级,采用全新直屏设计、同档唯一陶瓷机身,并首发1.5K第二代东方屏,搭配行业最高能量密度冰川电池,提供超长续航。
动点科技 2024-12-27
【环球网科技综合报道】随着智能硬件市场的蓬勃发展,智能音频眼镜作为新兴潮品,其热度持续高涨。12月27日消息,据洛图科技(RUNTO)最新线上监测数据显示,2024年10月和11月,智能音频眼镜在中国传统主流电商平台的销量分别达到1.4万台和1.7万台,同比分别增长23.7%和12.4%。
环球网科技 2024-12-27
另外日常办公协同需要的钉钉、飞书主要功能也适配完毕,12月23日,企业微信鸿蒙版也已上架,企业微信、钉钉和飞书等企业沟通协同系统都已上线,纯血鸿蒙HarmonyOSMEXT已经可以满足大多数人工作和生活需要。
IT观察 2024-12-27
作为天津市智能建造示范项目,12月25日,我国首个海洋油气全生命周期智能装备制造基地在滨海新区机械完工,标志着基地从现场安装调试阶段转入试生产阶段,投产后主要开展海上平台特殊螺纹油套管加工制造、设施设备一体化运维等业务。该基地由中国海油下属单位中海油能源发展股份有限公司投资建设,总占地面积约27万平方米。
金台资讯 2024-12-27
它的主攻方向是:人工智能+医疗解决方案,涵盖基层医疗服务、医院服务、患者服务等多。具体来看,按收入计算,其核心产品智医助理在中国基层医疗机构临床决策支持系统(CDSS)市场中名列第一(2023年),市场份额高达61.5%。飞的子公司。飞医疗带来竞争压力。
铅笔道pencilnews 2024-12-27
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1