
生成、语音处理、多模态理解等多项能力,满足政务、金融、工业、医疗等场景应用需求。MoMA 平台基于国产算力部署自研推理引擎打造,结合智能路由对长尾模型资源调度,实现单位 Token 成本压降约 30%、降低资源占用率 50% 以上。还能通过智能缓存、上下文复用、Token 压缩等技术进一步降低使用成本。同时,该平台还首创智能路由引擎技术,可根据用户需求灵活切换“成本优先”“效果优先”“均衡优先”等
当前文章:http://yet7m.fenshuqi.cn/np64/w9e.html
发布时间:04:53:37

