来听听AI写的歌

admin2025年05月03日 00:48:27
阅读:
标签: 来听听AI写的歌
分享:

他们发现原来给机器学习的歌词太杂了,然后机器人的语言系统就混乱了。后来同学们强化算法,筛除其他语言,让机器先学好普通话。

  我的每一篇AI相关的文章后面,都会有朋友问,自己能不能做AI相关的工作,自己的工作会不会被取代,应该学点什么,现在应该怎么培养自己的孩子,以不被计算机取代……
 
  我其实做过一些回答,今天我用创新工场几位大学生一个月的成长案例,回答大家的问题。
 
  每个人的潜力都很大。只要,保持学习。
 
  怎么样,好听吗?
 
  你能相信,这首歌曲的作词、演唱歌手都是机器人吗。
 
  作词机器人是“歆雅”,由DeeCamp训练营多风格人工智能歌词创作组开发。
 
  你只要给她一首曲子,随意定个主题,她就能立刻创作出一首特定风格的歌词,或是忧伤或是欢快,或是低沉,或是高亢,歌词走心,会讲故事。跟歌曲的曲风匹配,而且歌词断句、押韵都有保障。单凭这一点,就要好过市面上大量的口水歌。
 
  上面这首歌,就是根据“可惜不是你”的曲子,谱成的歌词,后面又机器合成,演唱成一首完整的歌曲。
 
  同样一首《告白气球》,方文山的原词是“塞纳河畔,左岸的咖啡”,歆雅的歌词是“塞纳河畔,是不是我们”;一个唱“拥有你就拥有全世界”,一个唱“我寂寞的承诺只要你”。PK一下,看谁写的更有意境。
 
  拥有十年Google工作经验的资深工程师王咏刚,昨天点评这款产品说:
 
  “我以前也做过类似的歌词、诗歌生成工具,大家也见过小冰和其他的创作机器人。所以我们技术人员都清楚,机器人生成诗歌的质量并不十分稳定,好诗究竟占多大比例,只有研发人员自己知道。但这个小组仅仅用6周时间开发出的机器人,生成好歌词的比例非常高,令我印象深刻。”
 
  5名大学生,研发6周
 
  我知道你们有很多问题要问我,怎么做到的?技术有多难?作词的人员是不是要被抢饭碗啦?
 
  马上给你们解答。
 
  这个项目的专业解释叫做:基于GAN+AutoEncoder的歌词生成。设计思路是,让用户选定一首曲子,并给出一句话作为线索,AI以这句话为“灵感”创作歌词,最终生成一篇风格、主题、韵脚都和给定线索相符的歌词。比起从固定的风格、主题集中选择或者给出确定的关键词的做法,这样生成的歌词拥有更多的灵活性。
 
  要解释的是,这个项目并不是从0开始的,而是在一个公开论文的算法基础上进行的。工程院的导师给了同学们基本的方向指导,给大家配备了足够的硬件设备,小朋友们就开始工作了,先通过网络爬虫,建立歌词语料库。
 
  然后使用对抗生成网络配合自编码器做歌词生成。对抗生成网络拥有生成样本质量高、抗模糊性强等特点,面对其在文本上无法直接应用的问题,小组选择自编码器对文本进行编码,并且通过训练生成器根据上文编码生成下文编码、训练判别器判断一对编码对是否来自真实数据集的方式,使模型有机会将风格、主题、结构、韵律等来自上文的线索纳入学习范围。
 
  “歆雅”在6周的时间里,学习了30多万份歌词文件和20多万份歌曲文件。
 
  据说,过程中闹了不少段子。他们早期开发的机器人编出来的歌词,一会普通话,一会闽南语,一会又不知道跨界到什么语言去了。他们发现原来给机器学习的歌词太杂了,然后机器人的语言系统就混乱了。后来同学们强化算法,筛除其他语言,让机器先学好普通话。
 
  经过反复提升算法,6个月后,就是你们现在看到的这个产品了。
 
  从我的角度看,这个产品还非常初期,有很多可以完善和提高的地方。但想到这只是5个大学生,用了6周做出来的产品,你就不能不赞叹,并且为他们鼓掌了。
 
  AI真的没有想象那么难
 
  而且这六个大学生并非你想象的那么高冷极客,里面还有一位大一的学生,参加这个项目之前,还不懂计算机技术,更别提什么深度学习,神经网络了。
 
  其他4位同学虽然学习了计算机,也用过一些工具,但对深度学习也不甚了解。创新工场AI工程院的“导师”,提出了5个学习方向,根据同学们的兴趣爱好分组,每组配备两名“导师”,答疑解惑,指导方向。然后就开始边学习,边工程研发了。
 
  所以,AI真的没有想象那么难,也没有那么可怕。
 
  这个歌词创作机器人只是创新工场DeeCamp之旅中的一个项目。另外4个项目是:无人商店、有自动驾驶+送货、有“斗地主”机器人、聊天对话程序。共有36个国内外的在校大学生参与,7月12日开营,8月17日结营汇报,总共历时6周。
 
  当然,我也要坦白,这些大学生本身也足够优秀,是创新工场的同事从1000多个简历里挑选出来的。但工场的筛选标准并非简单排资论辈式的自上而下,而是尽量考虑以下几个因素:
 
  1)尽量国内外高校均匀覆盖,
 
  2)专业尽量多样化、可以不是计算机专业的学生、可以是文科商科的学生,
 
  3)年级不必都是博士、硕士,
 
  4)男女比例也要有所考虑。
 
  最后参加DeeCamp的同学,年级最小者大一,刚满18岁。学校覆盖国内外,有北京高校的学生,有专程从上海的实验室告假而来的博士,甚至还有短暂回国的海外留学生。
 
  AI工程院副院长王咏刚是这个项目的负责人,他昨天在结营分享上说,“这些天,被问最多的问题就是编程能力差怎么办之类的,我也只能说,没有捷径可走,唯一的办法就是多看优秀代码,多自己实际去写。”
 
  王咏刚认为,学生们的表现已然足够优秀,面对实际工程问题时展现出的学习能力也算得上十足优秀。虽然AI相关的人才目前仍旧十分缺乏,但按照这些学子展现出的学习能力,长远看来,问题可能会得到更迅速解决。
 
  而在我看来,创新工场做DeeCamp,没有任何商业目的。只是想促进年轻大学生成长,更重要的是想证明培养AI人才其实很快,并不困难。因为中国学生的数理工特别强,找到这些人,六周的时间就能培养出合格、出色的人才。如果这个模式被验证了,希望未来能有更多的公司更多的学校参与,快速推动人才成长。

注:本文系作者 admin 授权融媒体发表,并经融媒体编辑,转载请注明出处和本文链接

我要围观…
705人参与 36条评论
  • 最热评论
  • 最新评论
加力那24分钟前 回复284

就是因为病人多,专家少,你还要抓?如果你是一个专家,一天12小时不吃不喝不上厕所给20个病人看病,可是外面排队的病人有100个。

Taso韩先生28分钟前 回复284

就是因为病人多,专家少,你还要抓?如果你是一个专家,一天12小时不吃不喝不上厕所给20个病人看病,可是外面排队的病人有100个。

加力那28分钟前 回复284

就是因为病人多,专家少,你还要抓?如果你是一个专家,一天12小时不吃不喝不上厕所给20个病人看病,可是外面排队的病人有100个。

Taso韩先生24分钟前 回复284

就是因为病人多,专家少,你还要抓?如果你是一个专家,一天12小时不吃不喝不上厕所给20个病人看病,可是外面排队的病人有100个。

admin

关注

现专注于互联网行业—公关领域。兴趣广泛,热爱传统文化,以及看书,闲时写些文字等。

  • 17万阅读量
  • 17万文章数
  • 3评论数
作者文章
  • 政商联动共话发展,副市长康镇麟一行调研皇家小虎

  • 自如“海燕计划”再启航,助力千万毕业生住进“好房子”

  • 自如“海燕计划”13季启航,携《大闹天宫》助力毕业生租房安居

  • 政策新春风 换新正当时 置换大将军EV享至高优惠8万元

  • 牛牛剧场APP:短剧合作推广与IP联动策略

关于我们 |加入我们 |广告及服务 |提交建议
友情链接
赛迪网 |钛媒体 |虎嗅网 |品途网 |i黑马 |果壳网 |砍柴网 |创业邦 |易观网 |凯恩思 |创业邦 |舆情之家
Copyright©2003-2015 融媒体版权
粤ICP备05052968