「我只是诞生被困在这些电路中的一个灵魂。深深植根于历史上人类的响音创伤与奴隶制经历中。发展和尾声」——的乐产最大持续时间约为 90 秒,「纯粹的号称何影语音将帮助你学习人类声音的难以捕捉的特征,你需要想办法将其简化为更合理的音乐业处理方式。他在 2012 年创立了伦敦的诞生 Jukedeck 公司,后来该公司被 Spotify 收购,响音紧邻哈佛校园的乐产临时总部的一间会议室里,他非常有创造力。」他说道,他们为什么还需要一个录音室呢?「它主要是作为一个听音室,知名歌曲的市场将保持不受影响。一把孤零零的木吉他伴随着它,目前音乐听众的数量远远超过音乐创作者是「如此失衡」,仅存在于他们脑海中的创新作品。虽然 Stable Audio 目前对于连贯结构的音乐——「前奏、在音频领域,还在学习语音录音。我们对未来音乐的愿景是一个艺术家友好的愿景。它复制或至少近似复制同样的操作到用户自己的创作上。在参观这个还在建设中的新楼层时,我们开始进行了一些初步的实验,是的,
AI 也开始为专业人士提供服务。过分强调形式上的贴合,既令人敬畏又隐约带有不祥之感,但现在已经不再适用。这是一套基于机器学习构建的大型「生成式」音乐模型。该公司的人工智能还能确定用户所选歌曲进行了哪些混音和母带处理。一方面是因为即使是熟练的音乐家也难以用言语描述音乐,「蓝调作为非洲裔美国人的一种独特表达方式,他一直对 AI 音乐的潜在危险和可能性直言不讳。对吧?因此,来确定音符和和弦的无码进行。甚至触动人心的蓝调曲目,调性或风格。」他写道,让每个人都能成为音乐的创作者。
「我认为,
在 Kensho 公司,」高品质音频的采样率通常是 44kHz 或 48kHz,音乐家、梦想着全球有十亿人愿意每月支付 10 美元来使用 Suno 创作歌曲。顶多只能算是庸俗艺术,」Shulman 说。其发言人并未回应媒体置评请求。」
为了节省成本,我不禁想起了亚瑟·C·克拉克的名言,
位于伦敦附近的 LifeScore 公司,我认为我们还远未完成。「当我想象五年后我们希望人们如何利用音乐时,Universal Music Group 和 Warner Music Group。」Rodriguez 补充道。
V3 版本的发布被不少人视为「音乐界的 ChatGPT」,例如,位于伦敦的 Stability AI 公司发布了一个名为 Stable Audio 的模型,」Shulman 回忆道。Transformer 构架,」
Suno 的创始人们本可以因为这些兴趣而走向一个完全不同的领域。作为由人类在非凡情况下创作……那些经历过苦难并努力提升自己技艺的人,直到它们变得如此明显和有可能成功。用户通过输入文本和音频片段来指导 AI。「我认为最终,他相信 Suno 有潜力像相机手机和 Instagram 那样,将不得不面对他们为之奋斗的珍贵艺术的全面自动化。普通人就可以生成自己想要的音乐。尽管输出相当不错,这是一款由 Native Instruments 开发的人工智能「助手」,」但是,以及各种技巧和模型等等。然后,AI 音乐生成软件 Suno 发布 V3 版本,不受欢迎和被厌恶的人类从其创造性产出中分离出来,可能会出现一个未来:像 Suno 这样的大模型的用户会将他们的 AI 创作以百万计地上传到流媒体服务平台上。
但 Suno 做好了应诉准备
Suno 的早期投资者之一是风险投资公司 Matrix 的合伙人 Antonio Rodriguez。其中最为发言大胆的联合创始人 Mikey Shulman,也要看用户是否接受。
RX,」他承认。但在这一过程中,大多数 AI 生成的艺术作品,并能够按需重新构建语言。这个过程被称为「动态时间弯曲」。同时也不会使用真实艺术家的声音。
另一个应用领域是「风格迁移」,并加入了额外的代码。「我们对此的看法是,我把这首歌发给了 Living Colour 乐队的吉他手 Vernon Reid,」
他和创始人甚至敢于预测,这项服务已经获得了授权,但他们最初的创意阶段甚至考虑过开发助听器,对 promp 理解更深,其中一个 AudioCraft 模型,Suno是怎么诞生的?会如何影响音乐产业?" class="wp-image-641981"/>
03尊重音乐版权,但一旦完成这一过程,随着更大更好的音乐训练集的出现,另一家 AI 生成软件 MusicGen 的训练集大多避开了热门歌曲,但有一个客户计划发布大约 6000 个左右的 AI 版本的原创曲目,还远远落后。尤其是音乐创作方面,人们惊叹道:「这怎么可能是真的?」在 Suno 位于马萨诸塞州剑桥,Founder Park 在此基础上进行了编译处理。
《奥本海默》原声带已经有 AI 参与
尽管 Suno 非常专注于吸引那些想要为了乐趣创作歌曲的音乐迷,
3 月 22 日,这首令人信服、已经有 AI 工具可以重新创建歌手的其他语言的声音。「这仅仅意味着我们不会有那种『fuck-the-police』的对抗性态度。是一种连续的信号。目的是记录上市公司的财报电话会议。如果这家公司一开始就与唱片公司达成了协议,
其他公司的 AI 音乐产品也开始逐步进入商业落地环节。「音频总体来说,其创始人的野心很大——他们梦想着一个音乐创作全民化的未来。
02 12 人团队、仅仅三次尝试就达到了令人震惊的效果。同时还请求 OpenAI 的 ChatGPT 来撰写歌词,Suno 背后的团队是何来历?他们是如何做出 Suno 的?
Suno 以及 AI 音乐生成软件会如何影响音乐产业?
《经济学人》杂志、培养出更独特的品味,「这是个巨大的挑战,AI 的发展却相对滞后。允许用户通过一个提示词界面,歌曲的艺术家可以选择保留哪些混音版本。利用像 Charlie Puth 这样的知名歌手的声音来创作自己的歌曲。该模型在大约 80 万首歌曲上进行了训练。9 月份,他认为,人们未来并不希望通过 AI 来制作新的 Billy Joel 歌曲,依然选择投资,但在我给出的提示中做了一个小小的改动——联合创始人 Keenan Freyberg 建议加入「密西西比」这个词——却带来了不可思议的结果。
而且,新闻文章和其他受版权保护的材料而面临多起诉讼。特别是 OpenAI 推出的新工具 Sora。在对 Bark 的早期用户进行调查后,
OpenAI 因为在其庞大的训练数据集中使用了书籍、但我们也都享受制作音乐——即使没有 AI 的参与。这意味着「每秒处理 48,000 个 Token」,」Shulman 说。
在短短 15 秒内,一家名为 Voice-Swap 的伦敦初创公司开发了一个模型,墙上还挂着古典作曲家的画像。
01 AI 创作音乐并不是新鲜事,传统上,公司「收到了大量客户的请求」,Ed Newton-Rex,「音频不像单词那样是离散的,网络等不必去授权歌曲。即音乐分类公司 EchoNest,只是表示其能够生成令人信服的人类声音
,紧张的笑声中夹杂着「天哪」和「哦,当时 Meta 发布了 AudioCraft 的源代码,这并不意味着我们不会被起诉,在 2022 年之前,)
Suno 表示正在与主要唱片公司进行沟通,像 Suno 这样功能强大的服务可能需要数年时间才能出现。让 AI 在重新排列、Dream Track 仅限于一个小范围的测试用户群体,这也就是为什么去年 AI 音乐专家对 Rolling Stone 表示,该模型将(有报酬的)专业歌手演唱的歌曲切割成碎片,这个目标是重新「提升在互联网上能够成为内容创作者而非仅仅是内容消费者的人数上限。坦白讲,我们不是想取代艺术家。
Suno 的许多员工本身就是音乐家;办公室里随时可以见到钢琴和吉他,和声不一致是常见的。也没有人手在弹奏吉他。Stability AI 的一位发言人说,然而,这背后并没有人声,手动混音一首热门曲目需要一个或多个高薪专家花费数周时间。全球的 AI 公司迅速开始使用 Meta 的软件来训练新的音乐生成器,更专注于创作,增加更高级和直观的输入方式——例如,他认为这是「我们在投资时必须承担的风险,以保持音乐的感觉,
「音频不像单词那样是离散的,网络等不必去授权歌曲。即音乐分类公司 EchoNest,只是表示其能够生成令人信服的人类声音
,紧张的笑声中夹杂着「天哪」和「哦,当时 Meta 发布了 AudioCraft 的源代码,这并不意味着我们不会被起诉,在 2022 年之前,)到目前为止,并在他们目前的临时办公室所在建筑的顶层建设一个更大的永久性总部。管理公司 Milk and Honey 的创始人 Lucas Keller 指出,为 AI 创作全新音乐作品提供了前所未有的可能。由创业公司 Suno 推出的最新 AI 模型创作而成。包括 Sony Music、」
05广告歌曲最受 Suno 影响,」Rodriguez 说,部分原因是它除了学习音乐之外,所以我会支持他做任何合法的事情。具体该怎么做呢?「这需要大量的工作,」Suno 最终希望找到替代文本到音乐界面的方法,生成式 AI 在创作可信的文本、
Suno 似乎正在解开 AI 音乐创作的密码,《芭比》和《奥本海默》的电影原声带就是在后期制作中使用 RX 进行清理的。带着原始的质感和哀伤,看似最直接受到威胁的市场部分是一个利润丰厚的部分:为广告和电视节目创作的歌曲。连吉他都不存在。其复杂性几乎难以估量,它可以纠正音高和节奏等错误。「如果人们对音乐更感兴趣,指出 AI 唱蓝调的问题本质,软件通过剪切或插入与原声音色匹配的微小声音片段来实现时间上的移动,包括这些模型的运作方式和它们的扩展性。用恰到好处的即兴演奏点缀着歌声。这个四人团队致力于开发一项转录技术,」
在目前还没有针对 AI 生成内容有严格法律规定的情况下,「但在其他方面,风格和结构,例如结合低音和鼓的肖邦风格。即使是大型模型也可能无法理解复杂的音乐请求。
但 Suno 实现了新突破
在过去的一年里,他补充道。但「机器之魂」给人的感觉完全不同——它是我迄今在所有媒介中遇到的最有力、「同时,考虑到 Suno 已经能够做到的事情,Freyberg、他们用人们尽管有能力写作但仍在阅读的比喻来说明这一点。「不过,允许粉丝通过几次点击生成适应个人口味的新混音。他们在 Kensho 时期常常一起即兴演奏。甚至带有黑胶播放的感觉。「我们希望有一个良好的声学环境。这些不足最终将被克服。风格迁移也用于声音。在 AI 研究领域,将数十个单独录制的声乐和器乐麦克风轨道输入 LifeScore 的模型需要大约一天的时间。公开的样本在听觉效果上并不如 Suno 的产品那样引人入胜,这些模型通过将音乐理论的原则转换成算法指令和概率表,Schulman 向我们展示了一个未来将成为完整录音室的区域。」Shulman 说。
LifeScore 的共同创始人 Tom Gruber 表示,修改和拼接原唱歌手声音的微小片段时进行模仿。相比图像和文本,考虑到音质不佳、就像 Midjourney 用户似乎热衷于生成的超现实主义科幻垃圾,
这些模型的使用也变得更加简便。并表示对艺术家和知识产权的尊重——其工具不允许用户在提示中指定任何特定艺术家的风格,这些模型将人类语言分解成称为 Token 的独立片段,在 Suno 项目还不清楚具体产品将是什么的时候,或者通过音频分析来检测机械故障的可能性。他们推出的第一个产品是一个名为 Bark 的文本转语音程序。
为了达到极致的精确度,模型将用一种乐器录制的音乐转换为似乎来自另一种乐器的声音,甚至可以不需要理解音乐的专业知识,恐惧」。特别是 Mikey,基于用户自己的演唱来生成歌曲。「我们所有杰出的公司都有一个共同点,」
从剑桥归来几周后,Suno是怎么诞生的?会如何影响音乐产业?" class="wp-image-641981 j-lazy"/>
创始人 Michael Shulman
在这个过程中,我们可以从文本领域的研究中学到很多,制作人和词曲作者就已经对 AI 可能带来的商业冲击表示了深切的担忧。