首页 > 财经 > 经济观察

昆仑万维:“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测

2024-04-17 14:08:22

来源:中国新闻网

  4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测!一年前的今天,第一版天工大模型正式对外发布上线,一年来昆仑万维不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。

  “天工3.0”拥有4000亿参数,超越了3140亿参数的Grok-1。“天工3.0”在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。

天工3.0模型参数超越Grok-1

  强大的模型技术实力赋予“天工3.0”超强的性能表现。在MMBench等多项权威多模态测评结果中,“天工3.0”超越GPT-4V。

天工3.0多模态性能超越GPT-4V

  同时,“天工3.0”旗下的“天工SkyMusic”音乐大模型也在今日面向全社会开放公测。

天工SkyMusic综合性能超越Suno V3,取得音乐大模型SOTA。

  天工SkyMusic:成为全球AI音乐SOTA模型

  此前,大模型已经在文本、图像等多个技术领域取得突破,带来产业全面变革。然而,在AI音乐生成领域,全球迟迟等不到一款产品,开启“音乐ChatGPT时刻”。

  这是因为一直以来,AI音乐行业大量研究都集中在符号音乐生成技术路线上,并且大多只能实现无人声背景音乐(Background Music,BGM)的生成,音乐的质量、效果、审美都远远达不到可用水平,产业迟迟未能爆发。

“天工SkyMusic”自研AI音乐大模型技术架构

  与行业主流路径不同,“天工SkyMusic”采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。

  在与海外顶尖的AI音乐大模型Suno V3的横向测评中,“天工SkyMusic”在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。

  此外,“天工SkyMusic”还拥有独创的参考音乐生成与方言歌曲生成能力。

  参考音乐生成:用户可上传自有参考音乐,或选择“天工SkyMusic”资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。

  方言歌曲生成:“天工SkyMusic”生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀,更能够支持粤语、成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。

  同时,“天工SkyMusic”是首个公开可用的AI音乐生成模型。

  当前,在文本大模型领域,OpenAI吸引了全球的注意力;但是在AI搜索、AI音乐生成等细分领域,中国玩家们正在奋勇前行,不断通过自研技术取得细分领域顶尖的SOTA表现,共同建设中国大模型产业,打造自主可控的大模型产业生态。

  天工3.0:采用4000亿级参数MoE混合专家模型架构

  在上一代“天工2.0”MoE大模型的领先基础上,“天工3.0”实现了全面的性能升级,采用了4000亿级参数MoE混合专家模型架构。

  “天工3.0”的逻辑推理能力、语义理解能力、应对复杂需求能力、内容创作能力全面升级,并新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,为用户带来全新AI体验。

  多轮搜索与综合工具调用:“天工3.0”针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。

  同时,“天工3.0”能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。

Query:查询最新中国历史电影票房排行,图表展示。

  图表绘制:“天工3.0”全面提高了逻辑推理能力与用户自然语言Query的理解能力,使其能够更精准地判断用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。

Query:北京、上海、重庆哪个好玩?

  多轮搜索、综合工具调用、图表绘制等都是“天工3.0”所独有的大模型综合能力,其从底层打通了“天工3.0”的AI搜索、AI对话、AI代码生成、AI图片识别、AI图像生成等底层能力,通过语义识别能力直接触发,为用户带来更加便捷、高效的AI体验,成为真正的AI生产力工具。

  此外,“天工3.0”中还增加了研究模式、增强模式、改图扩图等多项AI能力。

  研究模式:在研究模式中,“天工3.0”能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。

  增强模式:在增强模式中,“天工3.0”能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。

Query:2024年春节档电影;“天工3.0”理解并追问用户需求。

  改图扩图:“天工3.0”多模态性能取得全面突破,超越GPT-4V。在强大的技术底座支持下,“天工3.0”的AI绘图能力新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。

“天工3.0”的AI改图、修图、扩图等功能

  • 相关阅读
  • 衣邦人2024“以城之名 星耀中华”城市代言人西安推广会顺利举行

      4月13日,第七届浙江大学校友创新创业大赛西部赛区决赛在西安成功举办。作为2018浙江大学校友创业大赛成长组季军及“最具创业精神奖”的获奖者,衣邦人创始人、董事长兼CEO方琴受邀出席,分享创业项目...

    时间:04-17
  • 西藏金融业数字化转型取得实效

      激活数字经营动能 提升金融服务质效  西藏金融业数字化转型取得实效  本报拉萨4月16日讯(记者 袁海霞)近年来,中国人民银行西藏自治区分行指导辖区金融机构积极落实金融科技发展规划,探索运用数字化手段优化...

    时间:04-17
  • 中国经济信心说丨一季度发展开局良好

      不负大好春光,农历三月耕作忙,田间地头上活跃的身影一垄垄将“绿毯”铺满大地;当下正在海南举办的第四届中国国际消费品博览会上,来自全球各地的参展品牌竞相释放魅力;五一假期火车票即将开售,人们开始盘算...

    时间:04-17
  • 新疆棉花主要质量指标达近五年来最好水平

      记者今天从市场监管总局获悉,作为国家优质棉基地,新疆的棉花产量占全国九成以上,目前,2023/2024年度新疆棉花收购加工工作已完成公证检验557.26万吨,占全国检验量的97.55%。  从检验结果来看,2023年新疆棉...

    时间:04-17
  • 山东加快工业领域新质生产力培育 向“新”要未来

      中新网济南4月17日电 (吕妍)4月17日,在位于山东省济南市莱芜区的山东晨熙智能科技有限公司的展厅内,照片书、画册、单页、纸杯、标签、手提袋等设计新颖、五彩缤纷的产品让人应接不暇。  “一件起定,一张照片...

    时间:04-17
  • 去年中关村规上企业总收入预计达8.6万亿 占全国高新区1/6

      中新网北京4月17日电(记者 陈杭)北京市委常委、教育工委书记于英杰17日在北京表示,中关村是中国创新发展的一面旗帜。经过40多年的发展,中关村已经形成了“一区多园”的发展格局,拥有国家高新技术企业1.7万余家...

    时间:04-17
  • 凤晚脐橙上市量增加 带动奉节脐橙产地收购价格上行

      随着应季水果供应量的增加,本期柑橘类水果价格整体回调。奉节脐橙市场方面,本期凤晚脐橙上市量增加,带动奉节脐橙产地收购价格上行。  随着春夏水果市场供应量的增加,水果市场竞争趋于激烈,柑橘类水果价格...

    时间:04-17
  • 度小满CEO朱光发表人民日报署名文章:以人工智能提升金融服务质效

      4月17日,《人民日报》评论版刊发度小满首席执行官朱光题为《以人工智能提升金融服务质效》的署名文章。文章认为人工智能等数字技术的广泛应用,正在加速金融与科技的深度融合。尤其是以大模型为代表的人工智能技...

    时间:04-17
  • 100余个国家和地区将参加2024中关村论坛年会

      中新社北京4月17日电 (记者 陈杭)经中国国务院批准,2024中关村论坛年会(下称论坛)将于4月25日至29日在北京举办,拟举办近120场活动,100多个国家和地区、150余家外国政府部门和国际组织机构等受邀参会。  中国...

    时间:04-17
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。