来源:AI星球,文/王非
11月13日,在“数聚未来 —— 凤凰大模型数据研讨沙龙”上,磐霖资本风险合伙人、独到科技联合创始⼈兼CTO陈利人认为,“大模型整体的发展实际上差距应该会一直都会很大的,为什么?包括OpenAI、谷歌等,他们实际上也在进步,当然我们也在进步,就很难说追赶。因为我们不知道最后的天花板在哪,所以很难说我们能够追赶。但是往好处想,挑战越大,机会也就越多。”
谈及大模型在营销领域的应用,身为独到科技联合创始人兼CTO的陈利人告诉猎云网,“营销环节,确实离钱更近,也就是说,在营销方面做AI的变现,会比较容易。举个例子,比如某一家公司要做一次营销活动,它需要做大量的文案、图片、视频等工作,无论是运用数字人技术,或者是使用AI工具,都能帮他把效率提高很多。”
据陈利人介绍,“独到科技实际上是我的学弟们做的公司,公司成立于2012年左右,当时他们还在读博。后面我从美国回来,就作为天使投资人投了一点钱,当时并没有怎么介入公司的管理。直到2020年左右,我才开始参与到公司的发展中。”
作为一家AI和RPA应用解决方案服务商,独到科技专注于大数据领域与社交消费场景,主要业务是以私域流量运营自动化作为切入点,帮助企业更好管理自己的用户群,实现社群智能化、精细化的管理,提升用户购买转化率和复购率。
陈利人向猎云网透露,“目前,独到科技已经实现了大几千万的营收,接近盈亏平衡。此前,公司已经在2021年底完成了5000万元的A轮融资,现阶段,公司也在寻找新一轮融资。”
对于大模型热潮下的融资环境,陈利人以投资人身份坦言,“实际上,现在投资人没有以前那么活跃了。他会去看,但最后,基本上很难做出投资决定。”
谈及大模型训练数据的量级及重要性,陈利人认为,“对我个人来说,我不觉得中文的大模型就一定要用中文的数据。实际上,所有的语言模型到了一个高维的空间之后,看的是全世界的语料。”
提到数据的安全性和出境,特别是版权的问题时,陈利人表示,“事实上,我们已经看到有一些作家或者是图片的作者,已经向OpenAI发起诉讼了。当然,如果相关的诉讼长期推进下去,对整个大模型的发展也是很不利的。好消息就是,凤凰卫视要把他们有版权的东西直接向大众开放。”
值得一提的是,沙龙举办当天,凤凰卫视也正式推出“凤凰智媒AI数据业务”,并发布首批“中文访谈对话数据集”和“正向价值对齐数据集”。
据介绍, “中文访谈对话数据集”基于凤凰卫视访谈类节目生成,规模达百万轮次,连续对话的平均轮次超30轮次。“正向价值对齐数据集”的构建则以权威学术团队的研究成果为指导,由凤凰卫视专业内容团队人工撰写而成,规模达十万个问答对。
除上述两个数据集外,凤凰数据还有多个数据集正在加工生成中,计划在2024年分三批发布更多高质量数据集,并正式上线AI训练平台。
陈利人也对猎云网表示,“独到科技与凤凰的合作,有很多的可能性。我们可以使用凤凰的数据,我们也可以给凤凰提供一些有价值的数据。”