复旦团队研发AI大模型，助力视障者“看见”世界

作者：天天正能量发布时间：2024-03-02

复旦 AI大模型

只需一枚摄像头和一对耳机，便能将画面转化成语言。描绘场景、提示风险。让视障者出行更安全、生活更便捷。

日前，在复旦大学自然语言处理实验室（FudanNLP）师生的努力下，基于多模态大模型“复旦·眸思”（MouSi）为视障者量身打造的“听见世界”APP上线，将成为视障人士的生活助手与智能管家。

科技普惠，AI为人

让我们一起走近“眸思”，看看它能为视障者的日常生活，带来哪些新的改变！

“复旦·眸思”（MouSi）官网链接：http://www.mousi.org/

欢迎登录试用体验

打破视觉界限，助力视障者“看见”世界

2023年上半年，由复旦自然语言处理实验室开发的MOSS被称为中国版的GPT，仅用半年时间，多模态模型“眸思”问世。

“眸思”与MOSS同音，但和基于文本的MOSS不同。

它能够理解并识别图片内容，致力于成为视障者的一双“眸”。

基于“眸思”的“听见世界”APP，为视障者日常生活需求量身打造设计以下三种模式——

街道行走模式

“眸思”如一位忠实的向导，红绿灯、十字路口、障碍物……它将细致扫描道路情况，提示潜在风险，陪伴视障者安全通行“看不见”的漫漫长路。

自由问答模式

“眸思”则是一位贴心的朋友，走进博物馆、艺术馆、公园……捕捉四周景象的每个细节，用声音构建丰富的生活场景，传递每一处日常之美。

寻物模式

“眸思”将成为一名可靠的管家，被移动的手杖、最爱口味的牛奶……日常物件的寻觅过程，变得轻松无压力。

邀请视障人士加入，研发贴合真实需求

我国盲人数量有1700多万，也就是说，每一百人中就有一位，但为什么在大多数人的认知里，我们极少在街上看到盲人？

这是因为，面对大量不安全因素，他们难以独自跨出家门。

复旦大学自然语言实验室张奇教授说：“人工智能发展日新月异，科技应该要改变更多人的生活，希望‘眸思’能够帮助视障人士走出家门，让他们可以尝试更多工作，为人生书写更多可能。”

项目落地背后，是一支年轻的团队和开放的氛围。从本科生到博士生共25名复旦学子及桂韬等多位教师、专家的加入，才有了“眸思”接续“MOSS”的成功。

张奇介绍，该项目的主导者实际上都是“初出茅庐”的学生们，在组内头脑风暴会上，年轻学子总能提出开创性想法，能够找到另辟蹊径的解决办法。

自9月以来，复旦自然语言实验室从原本基于GPT3.5的文本模型转向，围绕GPT4-v复现多模态大模型，对模型中的核心关键点开展研究。

致力于提升单项任务的准确率和大模型的强化学习，为了更好地感受视障者的难处，团队成员同样模拟真实情境，蒙眼探索视障者“黑暗”世界，并邀请视障人士加入，进一步摸清真实而具体的需求。

在基于几亿张图片训练出的“眸思”大模型基础上，针对视障者提出的各类需求，团队又用上万张图片进行特殊样本训练，使“眸思”具备能够适配更多场景的能力。

加快升级测试，更多模式值得期待

今年上半年，团队将结合AR升级APP内的定位精度细化至亚米级别。下半年团队希望将“眸思”升级到基于视频的判断。更多模式也正在开发中，比如：阅读模式——服务盲人朋友点菜、读书等场景；解说模式——承担无障碍电影解说员的工作。

在政府的支持下，团队计划与NGO组织、智算中心和硬件厂商等开展合作，致力于让视障者免费使用产品和相关服务。

预计今年3月，“听见世界”APP将完成第一轮测试，在我国一、二线城市和地区同步开启试点，根据算力部署情况进行推广。

新民晚报记者张炯强通讯员陈书灵

图片来源：复旦大学计算机科学技术学院

举报我要爆料联系电话：962555新民网新闻未经授权不得转载

相关资讯

澎湃新闻 2023-02-21

多模态模型太火了，不止AI绘画，还能让失明者「看见」世界

【头部导读】「让失明者重新“看见”世界，多模态模型立大功，浪潮信息又预判了今年最火AI技术」获取信息的能力，直接关联着生存能力。远古以来，人类就通过五感捕捉获得信息，进而及时做出正确决策应对外

AI绘画

头部科技 2023-01-13

为世界第一大癌症高效研发首创新药，AI大模型助力药物研发叩开未来之门

近日，三位高中生引爆了医药圈，他们使用人工智能（AI）引擎进行靶点发现，确定了多形性胶质母细胞瘤（GBM）的新治疗靶点，多形性胶质母细胞瘤（GBM）是最具侵袭性和最常见的恶性脑肿瘤类型，占所有原发性脑

AI大模型人工智能

生物谷 2023-05-11

近期资讯

上市新机遇，量化派深化AI技术在数字化解决方案应用

量化派，作为这一领域的先行者，凭借其深厚的AI技术底蕴和不断的创新能力，正引领着数字化解决方案的新潮流。更为难能可贵的是，量化派并未满足于传统的数字化营销和商品交易赋能业务，而是不断创新，积极探索新的业务模式。

砍柴网 2024-12-30

新年出国，跨越语言障碍！华为FreeBuds Pro 4搭配Mate 70，化身随行翻译

春节将至，许多人准备趁假期出国旅行，感受异国风情，放松身心。然而，语言障碍往往成为旅行中的一大难题。如今，随着科技的不断发展，智能设备正成为我们跨越语言鸿沟的得力助手。华为音频产品家族中的华为FreeBudsPro4，为出国旅行提供了全新的解决方案。

央广网 2024-12-30

vivo X Fold 折叠屏手机产品节奏回归一年一代

另外，博主还在微博评论区回复了部分网友的问题：针对是否会推出V4芯片，博主称“不知道会不会按规律叫V4，升级改动挺大的”；针对三月能否买到vivo新品，博主回复“应该不行”。

IT之家 2024-12-30

提供数字载体支持 2024上海“随申码”应用创新大赛落幕

中新网上海新闻12月28日电(谢梦圆)28日，2024上海“随申码”应用创新大赛暨第九届中国创新挑战赛(上海)“随申码”专场在沪落幕，经过数月比拼决出的26个奖项花落各家。

中国新闻网 2024-12-30

国际最大超导磁体动态测试设施在合肥建成

12月29日，由中国科学院合肥物质院等离子体所建设运行的国家重大科技基础设施“聚变堆主机关键系统”子系统“聚变工程堆中心螺管系统”完成首轮测试实验，最大测试电流达到稳态48kA，超过47kA的设计值。

证券时报 2024-12-30

华为开始狙击中端手机市场：畅享70X来了麒麟芯替代骁龙

快科技12月30日消息，博主数码闲聊站曝光了华为畅享70X的详细配置。据悉，畅享70X采用6.78英寸1.5K双曲面双孔屏幕，分辨率为2700×1224，前置800万像素，后置5000万RYYB主摄和200万副摄，搭载麒麟8000A处理器，支持北斗卫星消息，内置6100mAh电池，支持40W快充。

驱动之家 2024-12-30

广东漆彩嘉信科技取得一种用于油漆生产的油漆刮料装置专利，防止油漆在油漆桶内壁底部边缘处堆积难以清理

金融界2024年12月30日消息，国家知识产权局信息显示，广东漆彩嘉信科技有限公司取得一项名为“一种用于油漆生产的油漆刮料装置”的专利，授权公告号CN222220616U，申请日期为2024年4月。

金融界 2024-12-30

张朝阳官宣跨年演讲锁定量子力学

【环球网科技综合报道】12月30日，记者从官方获悉获悉，12月31日22时，张朝阳2025跨年演讲将开启。搜狐创始人、董事局主席兼首席执行官、物理学博士张朝阳将以“生活在量子力学的世界里”为题，从微观视角解析存在的世界，届时，搜狐视频“关注流”账号@张朝阳将全程直播。

环球网科技 2024-12-30

韩国济州航空失事客机“黑匣子”已开始进行数据分析

总台记者获悉，当地时间12月30日，韩国金浦机场试验分析中心对济州航空7C2216航班客机“黑匣子”开始展开数据分析。

央广网 2024-12-30

美的安睡M9Max燃气热水器：16升天然气，补贴下的静音升级

#年货节好物集市#美的作为家电行业的领军品牌，其燃气热水器产品线一直以技术创新和用户需求为导向，不断推陈出新。美的燃气热水器在市场上的表现尤为突出，根据奥维云网（AVC）数据显示，美的在热水器市场的市占率持续提升，尤其在燃气热水器领域，美的的产品以高性价比和卓越性能获得了消费者的青睐。

小米地瓜 2024-12-30

复旦团队研发AI大模型，助力视障者“看见”世界

推荐体验

相关资讯

复旦大学团队研发AI大模型，助视障者“看见”世界

中新健康|复旦大学团队研发AI大模型助视障者“看见”世界

复旦复华涨停：公司与复旦团队研发的类ChatGPT模型无关，未参与研发

多模态模型太火了，不止AI绘画，还能让失明者「看见」世界

为世界第一大癌症高效研发首创新药，AI大模型助力药物研发叩开未来之门

近期资讯

上市新机遇，量化派深化AI技术在数字化解决方案应用

新年出国，跨越语言障碍！华为FreeBuds Pro 4搭配Mate 70，化身随行翻译

vivo X Fold 折叠屏手机产品节奏回归一年一代

提供数字载体支持 2024上海“随申码”应用创新大赛落幕

国际最大超导磁体动态测试设施在合肥建成

华为开始狙击中端手机市场：畅享70X来了麒麟芯替代骁龙

广东漆彩嘉信科技取得一种用于油漆生产的油漆刮料装置专利，防止油漆在油漆桶内壁底部边缘处堆积难以清理

张朝阳官宣跨年演讲锁定量子力学

韩国济州航空失事客机“黑匣子”已开始进行数据分析

美的安睡M9Max燃气热水器：16升天然气，补贴下的静音升级

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响