出品 | 搜狐科技
作者 | 梁昌均
“大模型风起云涌,现在大家关注两个问题:一个是如何打造大模型的底座能力,二是大模型将改变信息分发、内容生产,以及产业竞争格局和科研范式,但如何实现看得见和摸得着的应用。”在6月27日的发布会上,科大讯飞董事长刘庆峰表示。
他在现场正式发布星火大模型V4.0,称这是基于全国首个万卡算力集群“飞星一号”训练的大模型,该算力集群由科大讯飞和华为联合打造,实现国产算力底座自主可控。
据介绍,讯飞星火V4.0全面对标GPT-4 Turbo,在国内外中英文12项主流测试集中实现8项超越。它在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的超越,但代码能力和多模态能力还不及GPT-4 Turbo。
讯飞星火V4.0多项能力获得提升,包括图文识别能力,其在科研、金融、医疗、司法、办公等应用领域的图文识别能力评测得分超过GPT-4o。复杂指令、基于逻辑关系的多模态理解能力也有提升,长文本通用能力则可比肩GPT-4 Turbo,并首发内容溯源功能,从而更好解决幻觉功能。
底座能力全面升级的同时,科大讯飞还宣布多项应用更新。刘庆峰表示,现在越来越多的用户开始享受大模型带来的红利。星火大模型APP安卓端累计下载量大1.31亿次,星火大模型加持的智能硬件销量同步增长70%,月均使用次数超4000万。
星火APP也首批上线14个智能体,帮助用户面向特定场景打造专属助手,并实现星火大模型、讯飞办公本、讯飞听见等账号互联、数据互通和操作联动,打造更便捷的个人助手。
刘庆峰现场还宣布,星火医疗大模型、星火教育大模型、大模型语音、汽车智能座舱等迎来全新升级。
具体来看,星火医疗大模型在海量知识问答、复杂语言理解、专业文书生成、诊断治疗推荐、多轮交互、多模态交互等方面超越GPT-4 Turbo。讯飞晓医将上线个人数字健康空间,实现在用户看病前、用药时、体检后发挥更加强大的个人助手作用。
升级后的星火教育大模型,面向复杂教育场景的图文识别能力进一步提升,在语文、英语、数学、复杂公式等方面的评测得分均超过GPT-4o,并推出基于此打造的星火智能批阅机,AI学习机也新增1对1答疑辅导功能。
在大模型语音能力方面,刘庆峰表示,OpenAI的GPT-4o以及苹果在语音能力上的升级获得了非常大的关注,万物互联时代,智能语音要具备多语言多方言、远场高噪、全双工和多模态等能力,这将推动人机交互革命。
此次升级的讯飞语音可以支持74种语言能力,其中37种语种语音识别效果提升到92.3%,领先OpenAI的whisper-3,37种方言语音识别效果平均提升30%。
现场演示显示,讯飞语音在多人混叠场景下也能比较准确识别每个人说话的内容,刘庆峰表示“非常炸裂”。据介绍,讯飞语音在两人混叠场景识别准确率达到91.1%,三人混叠场景准确率达到86%,高噪场景则达到90.1%,均超越whisper-3和谷歌模型。
借助大模型语音能力的升级,讯飞星火汽车智能座舱也迎来更新,可以实现全双工语音交互、多语种多方言自由切换、多情感多模态超拟人交互、多模态感知等。刘庆峰认为,AI将助理汽车场景人机交互迎来新变革,讯飞还将通过端云一体化方案赋能家电等行业。
对于当下火热的机器人和具身智能市场,科大讯飞的机器人超脑平台也升级到2.0版本。“机器人通过大模型的加持,将加速机器人交互升级。”刘庆峰表示,目前已有超410家企业采用讯飞机器人超脑平台。
刘庆峰表示,应用是硬道理,现在已经到了用智能体去赋能企业应用的时间点,智能体将解决大模型落地最后一公里的问题。
在刘庆峰看来,大模型赋能企业有两种方式,一类是让大模型直接完成任务,另一类则是以大模型为核心,从而调度内外部工具完成任务。但无论是哪种方式,底座能力都非常重要。
“大模型底座能力决定发展高度,中国要发展大模型,必须要建立自主可控的通用大模型底座。”刘庆峰表示,还要科学的认识大模型的能力边界,现在的关键就是如何用更少的算力、更高的效率,基于通用大模型,去打造行业大模型,以及企业专属大模型。
此外,刘庆峰表示,生态依然是不可或缺的部分,面向未来,讯飞将基于软硬一体+自主可控,打造源头技术生态、智能体生态、应用生态和行业生态。
刘庆峰演讲最后还强调,不能盲目自信,要科学理性认识中美科技综合差距。“GPT-5发布后可能又会拉大与国内差距,因为它模型尺寸增大,训练时间更长,就会把这个差距拉开,甚至达到一年以上。”
不过,刘庆峰表示,有信心快速增长,通过完全的国产自主可控以及长期主义,保证不出战场,至少不会形成代际差距。
他还强调,对中国大模型发展来说,一定要考虑用最小的算力、最少的数据、最少的成本做出更优质的成果,这才是未来真正的战略,从而更好抢到这波人工智能的红利。
发表评论