摄影:匡达

科大讯飞新模型水平超越GPT-4 Turbo,还发布了一款智能批阅机

界面新闻记者 | 肖芳

界面新闻编辑 | 刘方远

6月27日,科大讯飞发布讯飞星火大模型V4.0。与此前的版本相比,新模型在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力上都有提升。

比如讯飞星火可以根据用户的语言描述,结合空间和常识推断描述对象所在的位置,这些能力的进步对于未来的机器人等具身智能产品都有意义。

在图文识别上,讯飞星火大模型V4.0能力也进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。

从国内外12项大模型主流测试集的结果来看,讯飞星火在8个测试集中排名之一,在七大核心能力上全面超越了GPT-4 Turbo。

自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。科大讯飞方面公布的数据显示,今年618期间星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万。

面向未来的人工智能新生态,科大讯飞董事长刘庆峰强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地。

基于讯飞星火大模型V4.0的能力,科大讯飞同时发布了多款应用。

在个人领域,科大讯飞推出了“个人空间”。用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。

在教育领域,科大讯飞发布了首款星火智能批阅机。这款机器能识别不限纸张大小的作业,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,为老师作业讲评和面批辅导提供了素材。

根据发布会现场的演示,15份学生作业在半分钟就能批改完成。批改还能模拟真人笔迹,和老师平时批改作业几乎一样。

此外,科大讯飞还发布了软硬件一体化的讯飞同传系统,可支持会议同传、展厅同传、旅游同传等多种场景。该同传系统突破了多人混叠场景下的复杂语音转写,即使在三人混叠说话时也能实现86%的语音识别准确率。

刘庆峰认为,只有自主可控的繁荣生态,才有中国通用人工智能的未来。“既要科学理性地认识中美在大模型上的综合差距,也要有信心快速追赶,给出从源头技术、到产业生态、再到应用落地的一整套的打法,以长期主义来打造真正自主可控的AI产业生态。”刘庆峰说。