☰

拒绝机械感！30秒生成商用级歌曲，「歌歌AI」完成新一轮融资 | 36氪首发

作者 | 邓咏仪

编辑 | 苏建勋

在键盘上敲出短短一行命令：请给我写一首充满喜悦/悲伤/的歌，等待片刻，一首完整的、甚至带有人声、歌词的”歌曲“就已经完成——进入2024年，Suno等产品带来的热度还没散去，如今国内已经有不少瞄准AI音乐领域的产品，如雨后春笋般出现。

36氪此前报道的「歌歌AI」是其中的一员。这家公司近期获得新一轮数百万元投资，投资方为锡创投。

音律闪动成立于2022年8月，瞄准AI生成音乐方向，其主要产品为「歌歌AI」app。

音律闪动CTO王枢沛告诉36氪，音律闪动的团队为来自互联网大厂的技术专家，以及在音乐产业中的资深制作人。在生成式AI出现前，团队就已经有通过AI技术来探究在音乐领域中的应用——早在2016年，团队成员就开始开发AI写歌产品，并有项目创业经验。

真正促使团队创业的，是在2022年左右看到以Transformer架构为主的技术突破，“我们认为，这个技术能够真正改变音乐产业。”王枢沛表示。因此，从2023年成立开始，音律闪动就开始从底层模型开始训练，在经历2023年的小程序版试运营后，在4月完成了独立的app开发，近期刚刚上线。

“让所有人都成为音乐人”是歌歌AI的目标，从产品形态来看，歌歌AI是一款面向所有爱音乐的用户的AI写歌软件。使用方法也非常“傻瓜式”，容易上手——

用户进入app界面，即可看到三种模式：自由模式、惊喜模式、纯音乐模式，通过对话和“AI制作人”沟通，生成自己想要的音乐。

在自由模式下，用户可以输入简单一句话的Prompt，让AI生成拥有具体主题、完整旋律和人声的歌曲。

比如，36氪就以自由和勇气为主题，请AI帮忙写一首歌曲，不到1分钟内，歌歌AI就生成了一首时长为2分20秒的《希望之歌》，并且带有完整填词。

来源：歌歌AI

整首歌拥有比较和谐的旋律和编曲，并且旋律变换也相对丰富。不过在填词上，还是有个别词句会不通，或者断句尚有问题，但用户可以通过手动调整来完成歌词修改。哪怕不懂乐理，还可以通过简单点选操作，来调整每个字的音高。

来源：歌歌AI

“除了修改歌词和旋律，还有包括AI演唱的这个声音，用户也可以在选择付费后进行修改，替换成自己的声音。”王枢沛表示。

对于要求更高的用户，歌歌AI还提供了更专业的“惊喜模式”，能够生成满足商业级场景的歌曲。

在这一模式下，用户能够对音乐风格、具体的配器提出更多要求。AI能够生成更完整的旋律，会有完整的主歌、副歌、桥梁等结构。

并且，人声的变换也更加丰富——无论是颤音、旋律的高低变换过度都更自然，听起来更接近自然人声演唱的状态，“AI感”减少很多。

在所有模式下，歌歌AI都基于一定的免费积分，用户可以消耗积分以生成音乐。一旦用户对AI生成的demo比较满意，希望“扩写”，就能在对话框里和“AI制作人”对话，以修改风格等等，同时付费来让AI生成更完整的歌曲。目前的三档付费价格分别为包月18元、48元、98元。

音律闪动COO王枢沛对36氪表示，惊喜模式使用的是端到端的大模型技术，为了保证音乐效果质量更高，暂时不支持具体的歌词和人声修改，这也是与市面上大部分AI生成音乐产品相比，歌歌AI的优势所在。

“AI文字、图片生成现在都有开源框架，技术层面是比较开放的，但从AI生成音乐赛道整体来看，技术路线是比较封闭的，各家都有自己的训练技术差异。”王枢沛表示。

总体来说，上一代将AI技术应用到音乐中的尝试，普遍能做到的程度是，先生成MIDI音乐，即简单将旋律数字化，形成较为单调、机器感的单旋律。

在上一代AI技术逐步成熟之后，AI生成音乐进入到了用小模型、专家系统训练的阶段。简单而言，一种方式是通过人工标注大量的音乐片段，分“科目”训练模型，比如旋律、歌词、编曲等，都有单独的小模型。等到这些模型能够产出比较成熟的片段之后，再“拼接”起来，形成完整旋律。但这种方法的缺点是，由于各个元素是割裂的，拼接之后的机器感难以消除，也很难达到和谐的效果。

而从AI生成音乐的训练上，为了保证歌曲能做到质量更高、更自然，歌歌AI对标海外产品，选择了端到端的大模型路线，即音乐数据不需要经过特别细致的处理，就输入到模型中进行训练。这样能够生成比较完整、统一的旋律。

歌歌AI的另一个亮点在于，并不局限于“用AI写歌”的定位上，而是希望能够基于生成式AI技术，真正让音乐创作、分发方式的链条发生根本性变化。

音律闪动团队认为，目前音乐平台的推荐音乐内容千篇一律，并且推荐内容页不真正切合需求。“全国现在每天大概产生新产生约十几万首歌，但生成式AI技术能够让这个数字变成成百上千万。”王枢沛表示，AI技术的普及，也会让人们生成更个性化的音乐，成为打破现在音乐巨头垄断的机遇。

除了歌曲生成等基本功能外，歌歌AI也拓展了多个板块，涉及生成和分发。

比如，用户通过AI模型录入自己声音并生成歌曲，可选择不同风格和曲风，甚至发行全网。

歌歌AI近期也正在与国内主要音乐平台洽谈对接，以后希望做到的效果是，用户生成音乐后可以做到自动修音、AI混音处理，最后——全网一键发行，用户能够通过自己生成的AI音乐，获得版税。

并且，和短视频的结合也是重要的传播节点。当前，歌歌AI已经能够支持下载带有AI音乐的小视频，未来也会拓展到AI生成视频、直播场景。

本轮融资后，歌歌AI团队也会继续加速产品迭代，并且投入到市场增长方面。

团队方面，目前歌歌AI团队不到10人，CEO龙勇拥有20年音乐制作经验，曾是中国好声音、中国有嘻哈、TME官方合作伙伴，有丰富制作运营音乐和版权经验；COO王枢沛是浙江大学工学/ 美国伯克利音乐学院音乐制作和吉他表演双专业学士；CTO张文铂为「我要写歌」APP创始人。

拒绝机械感！30秒生成商用级歌曲，「歌歌AI」完成新一轮融资 | 36氪首发

相关资讯