- N +

AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo

AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo原标题:AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo

导读:

直播吧月日讯常规赛火箭战胜马刺本场比赛申京中三分中罚球中爆砍分篮板助攻抢断盖帽文班亚马出战分半投篮中三分球中拿到分篮板助攻盖帽的数据作者薛芳编辑康晓出品深网腾讯小满工作室年月日...

直播吧3月6日讯NBA常规赛,火箭114-101战胜马刺。本场比赛,申京32中19,三分3中2,罚球7中5,爆砍45分16篮板3助攻5抢断1盖帽;文班亚马出战30分半,投篮10中4,三分球5中2,拿到10分11篮板3助攻7盖帽的数据。

作者|薛芳

编辑|康晓

AI光年|商汤日日新大模型升级,官宣赶超 GPT-4 Turbo

出品|深网·腾讯小满工作室

2024年4月23日,上海商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,加速生成式AI向产业落地。

在人工智能发展的最基本法则——尺度定律(Scaling Law)的准则下,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。

本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。

本次“日日新5.0”另一大核心指标就是多模态能力,商汤多模态大模型的图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。

“日日新SenseNova5.0”在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。

商汤科技首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产此次品“商汤企业级大模型一体机”。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

此外,今天商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。在自身应用方面,商汤“日日新SenseNova5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。

返回列表
上一篇:
下一篇: