AI唱歌不仅中英文无压力还会粤语!微软联手浙大研发出DeepSinger


听微软小冰唱粤语歌会是一种怎样的体验?

想必你一定听过最近大火的”AI女团”,7月10日,微软小冰携手小米小爱、B站冷鸢、百度小度首次集体亮相世界人工智能大会,以一首AI歌曲《智联家园》正式“出道”。

AI多语言歌声合成原理

多家信托银行踩雷!质押的83吨黄金,竟是镀金的铜!保险公司该赔吗?

中文、英文、粤语,教什么会什么的AI

徐熙表示,今年北京人社局已经提前3个月与市民政局、市农业农村局、市残联等部门,完成了困难家庭毕业生的信息比对,锁定1637名困难家庭毕业生。通过前期帮扶,已有951人实现就业。对未就业的686名困难家庭毕业生,北京将采取“一生一策”的措施,为每个人至少推荐3次就业岗位。只要你有就业意愿,就能100%实现就业。

据健康时报,巴西圣卡塔琳娜联邦大学的专家组当地时间2日宣布,他们发现巴西圣卡塔琳娜州首府弗洛里亚诺波利斯市去年11月份的下水道水样中存在新冠肺炎病毒。除此以外,全球多地也曾在废水中检测出新冠病毒。“如果研究结果没有问题,说明病毒可能早就开始流行,只是没有发现。或许当时的病毒传染性不强,随着在人群中传播,传染性增强。”北京大学第一医院呼吸内科王广发主任医师对废水中检出新冠病毒一事进行评论。

数字显示,截至8月9日,理工学院、私立培训机构、中小学、大学的留学生人数分别为7943人、9879人、9713人和17,081人。另有3191名留学生的地点不明确。

香港特区政府卫生署卫生防护中心4日介绍,截至当日下午4时,香港新增11例新冠肺炎确诊病例,全部为输入性病例。香港累计报告新冠肺炎确诊病例增至1258例。

●据e公司,3日晚,国际标准组织3GPP宣布冻结5G R16标准。3GPP RAN全会副主席、中国移动首席专家徐晓东表示,通过R15、R16两个技术版本,5G的技术能力已经相对比较全面了,可以更好地接受各种应用的挑战。从全球的5G部署来看,设备商、运营商、终端厂商或是其他应用提供商,都可以更积极的行动起来,全球将进一步掀起5G整体建设的热潮。

根据意大利民事保护部门当地时间7月4日18时公布的数据,过去24小时该国新增235例新冠肺炎确诊病例,累计确诊241419例;新增21例死亡病例,累计死亡34854例;新增治愈477例,累计治愈191944例。

●4日下午,上海市疾控中心发布消息称,截至目前,上海市流感监测中未发现G4基因型猪流感病毒。

雷锋网原创文章,。详情见转载须知。

韩国“抵制日货”一年了:优衣库“凉凉”,有日本车企撤离

从最终的测试结果可以看出,未经训练的音频和经过DeepSinger模型的音频,在音调、振幅、持续时长上基本吻合;(GT表示真实音频波形图,DeepSinger表示经过模型训练后的音频波形图)

●国务委员、公安部党委书记、部长赵克志7月4日主持召开公安部党委(扩大)会议指出,要认真学习贯彻香港国安法,全力保障法律平稳落地、有效实施,全力支持配合驻港国家安全公署各项工作,全力指导支持香港警队止暴制乱、恢复秩序,全力防范、制止和惩治极少数人危害国家安全的违法犯罪行为和活动,切实保障香港居民合法权益,坚决维护国家安全和香港长治久安,确保“一国两制”事业行稳致远。

我们知道,在机器学习中数据集的质量和数量是关键,但也正是在这两个方面往往存在难点。而在本次试验中仅使用了一个小样本即达到不错的性能表现。另外,歌曲和歌词的自动对齐模型在很大程度上也减少了数据标标注带来的失误和成本。

在机器学习领域,从文本到语音(TTS)的转换有着广泛的使用场景,一直是研究的重点领域。如上文所说,歌曲的韵律和环境比语音更具复杂性,因此,SVS相比于TTS的研究也更有挑战性。

我们知道,歌声不同于正常人的语音,高低音转换,BGM的配合,有着更复杂的模式和节奏,这对于AI来说并不是一件容易的事儿。

据海外网,美国国家过敏症与传染病研究所所长安东尼·福奇博士2日在接受《美国医学会杂志》采访时表示,一种更具传染性的新冠病毒突变体可能正在出现。据美国《纽约邮报》(NY POST)报道,福奇博士表示,研究表明,正在意大利传播的是一种新的新冠病毒毒株,在人与人之间传播更容易且更难控制。他对此说道:“似乎病毒适应得更好,可能更容易传播。”

国家卫健委专家组专家李凤琴表示,目前国内外还没有发现因吃食品而感染新冠病毒的报道,也没有这方面的证据。对于从新发地买来的这些食品,如果家里还没有吃完的话,尤其是像冷冻的水产品或者牛羊肉,如果怀疑食品的外包装受到污染,只要按照正确加工方式处理也是安全的。

具体来说,DeepSinger是一款音乐歌声合成系统(Singing voice synthesis ),该系统利用专门设计的组件可以从嘈杂的歌唱数据中捕获歌手的音色,从而生成多种语言风格的演唱声音。

AI女团的首场演唱会可谓惊艳全场。从整首歌的歌词、卡点、节奏来看,这首《智联家园》演唱得不亚于专业音乐团队。如果只听音乐,恐怕很难分辨出这是AI生成的歌声。

格力深夜紧急回应“弄虚作假”:系投标人整理材料失误,广东某某同行企业利用此事恶意攻击

●银保监会:为进一步严肃市场纪律,规范股东行为,发挥震慑作用,强化市场监督,银保监会现向社会公开银行保险机构的38名重大违法违规股东。其中包括:杭州平章工具有限公司、浙江国恒实业有限公司、包头市北奔明科机电有限责任公司、江苏名德投资集团有限公司、深圳市正莱达实业有限公司等。

●新三板首批精选层打新结果出炉,引发了市场热议,有些投资者1手就中签,但也有投资者顶格申购却一签没中。全国股转公司相关部门负责人7月4日回应,以比例配售为主的配售机制,能够充分保证配售过程的公平,同时在最大程度上扩大获配投资者的范围。但当某只股票认购异常火爆的情况下,配售机制会向中小投资者倾斜,增加中小投资者获配机会。

从国务院客户端小程序“疫情风险等级”了解到,截至7月4日15时,北京市大兴区天宫院街道、清源街道由中风险地区调整为低风险地区;北京市大兴区黄村(地区)镇由高风险降级为中风险。截至目前,本市有26个中风险地区,涉及丰台区、大兴区、海淀区、西城区、朝阳区、通州区、昌平区7个区。另有2个高风险地区,分别位于丰台区、大兴区。

不过,最近一个研究团队,却此基础上挑战了更高阶的AI技术——生成多种语言风格的AI系统。据了解,这个团队成员正是来自浙江大学和微软研究院的六名研究员,他们研发出了一款名为DeepSinger的AI模型,可以演唱中文、英文,甚至粤语歌曲。

研究人员称,对于影视从业者来说,DeepSinger会是一个非常实用的工具。当他们完成某些语音类录制工作后,如果发现录制错误,可以用AI辅助语音的合成和修复,而无需再次返工。不过,这款工具也存在一些弊端。就像换脸软件Deepfake可以合成不存在的人像一样,这款DeepSinger同样可以假冒歌手伪造音乐。

●据央视今日说法,7月3日,演员王珞丹微博称,同事的宠物鸭吉吉在河南息县被一女子拎走,鸭已死亡。律师解读:若宠物鸭价值不菲,则达到盗窃罪刑事立案标准,但是否构成盗窃罪,还涉及到该女子对鸭的价值认知;如果是一只普通鸭,该女子的行为涉嫌违法,不构成犯罪。警方已介入调查。

●7月4日,羽毛球名将林丹正式在个人微博宣布了退役消息,结束20年的中国国家队羽毛球生涯。

当地时间4日,世卫组织宣布停止在“团结试验”中使用羟氯喹和洛匹那韦/利托那韦。试验结果显示,羟氯喹和洛匹那韦/利托那韦几乎没有或未能降低新冠肺炎住院患者的死亡率。此前,世卫组织在全球层面发起“团结试验”,旨在比较几种不同药物或药物组合治疗新冠肺炎的安全性和有效性,以尽快找到有效治疗方法。

●据中国气象局统计,6月,全国气象部门通过各种渠道累计发布各类气象灾害预警信息4.3万余条。其中,暴雨、雷电的预警信息发布数量均比过去三年同期增加了43%左右。据应急管理部,截至7月3日,今年以来洪涝灾害先后造成贵州、四川等26省(区、市)1938万人次受灾,121人死亡失踪,直接经济损失416.4亿元。

伊朗总统鲁哈尼表示,自7月5日起,所有聚集性公共场所或室内场所以及提供公共服务的政府部门等,所有民众必须佩戴口罩。

研究人员介绍,此次生成多种语言风格的歌声合成系统DeepSinger,采用了一种含多个数据挖掘和数据建模步骤的研究路径,优化了现有研究的很多困境。这个路径可以分为以下五个步骤:

●近期发布的联合国《2020年全球电子废弃物监测》报告显示,2019年全球产生了创纪录的5360万吨电子废弃物,短短5年内增长21%。报告预测,到2030年全球电子废弃物将达7400万吨,16年间几乎翻一番。这使得电子废弃物成为世界上增长最快的生活垃圾,其主要原因是电气和电子设备消耗率提高、生命周期短以及维修选择少。

据环球网4日消息,特朗普竞选团队成员金伯利·吉尔福伊尔(KimberlyGuilfoyle)新冠检测呈阳性。报道称,吉尔福伊尔是特朗普大儿子的女朋友,是特朗普身边已知的第三个感染新冠病毒的人。

据日本广播协会电视台报道,日本7月4日新增274例新冠肺炎患者,连续两天单日新增患者超过200例,累计确诊19614例、死亡977例。除日本国内确诊19614例之外,“钻石公主”号邮轮累计确诊712例、死亡13例。截至7月4日,日本国内共有33名重症患者正在医院接受治疗,包括“钻石公主”号邮轮上的乘客和船员在内,日本已有17617人出院。

据新华网,欧盟委员会3日宣布,正式批准瑞德西韦作为欧盟第一种治疗新冠病毒感染的药物。6月25日,欧洲药品管理局正式推荐瑞德西韦作为欧盟第一种治疗新冠病毒感染的药物。在欧盟,一种新药从获得欧洲药品管理局推荐到被欧盟委员会批准平均需要67天,但瑞德西韦只用了一周时间。

据巴西卫生部当地时间7月4日晚公布的最新数据,该国单日新增新冠肺炎确诊病例37923例,累计确诊1577004例;新增死亡病例1091例,累计死亡病例64265例。 目前,该国确诊病例和因疫死亡人数排全球第二,仅次于美国。

●据中证网,7月3日,8只上市券商ETF集体大涨。其中,国泰中证全指证券公司ETF涨停,涨幅为10.04%;易方达中证全指证券公司ETF等6只券商类ETF涨幅超9%,鹏华国证证券龙头ETF也上涨了8.84%。基金人士指出,成交活跃的ETF套利机制较为通畅,折溢价消除速度较快,投资者在二级市场交易时,若在溢价幅度较大时买入,可能存在溢价消失带来的损失风险。

据英国卫生与社会保障部统计,截至当地时间7月4日17时40分,英国新增新冠肺炎确诊病例624例,累计确诊284900例;新增新冠患者死亡病例67例,累计死亡44198例。

另外,新西兰国外有6149人持新西兰学生签,包括3426名大学生和1362名中小学学生。(Jackie Shan)

数据检索(Data crawling)负责从音乐网站抓取顶级歌手多种语言的流行音乐;这里抓取的是中、英、粤三种语言的歌曲,时长一般为1-5分钟。此阶段,需要对数据集进行初级的过滤和清洗。 唱歌和伴奏分离(Singing and accompaniment separation):采用开源音乐分离工具Spleeter,从伴奏中提取歌声,然后将音频逐个拆分为句子; 歌词和歌唱对齐(Lyrics-to-singing alignment):自动提取歌词中每个音素的持续时间(从粗粒度的句子级别到细粒度的音素级别)。 数据筛选(Data filtration):对歌词与演唱未对齐的歌声进行再处理。 这里采用分离奖励(Splitting Reward)作为过滤标准,过滤掉分离奖励低于阈值的数据。 演唱模型(Singing modeling):通过数据爬取,分离,对齐和过滤之后,基于FastSpeech对唱歌数据进行建模。该模型将歌词,时长,音高信息以及参考音频作为输入来生成歌声。 点击链接:https://speechresearch.github.io/deepsinger/可收听不同阶段,AI生成歌声音频。

不过,研究人员表示,接下来他们计划使用基于WaveNet模型等更为复杂的AI技术,在DeepSinger中训练各种子模型,以提高语音质量。WaveNet是Googel研发的一款语音驱动模型。

●随着《海南自由贸易港建设总体方案》的发布,海南体育产业迎来全新发展机遇。海南对境外企业投资、贸易、资金流动、税收以及人员进出方面的政策倾斜,将吸引一批国际赛事和企业、机构落户。

想不通:牛市氛围之下,这只热门股竟然8连阴创5个月新低!利好挡不住机构跌停砸盘,究竟发生了什么?

当地时间7月3日,世界卫生组织举行新冠肺炎发布会。世卫组织卫生紧急项目负责人迈克尔·瑞安表示,抗体可以提供一定程度的屏障,但要想达到防火墙一般的效果,就需要比例较高的人群呈抗体阳性,就如目前而言,全球仍需加倍采取控制措施遏制病毒感染,减少死亡。

论文中,研究人员用中文、英文、粤语三种语言进行了试验,并用训练后得出的不同音色演唱了这首《Far Away Of Home》。可以先点击下方链接,听一下演唱效果:

虽然不允许入境,但移民局并未停止批准新的学生签。数据显示,移民局在6月份批准了582个新的学生签,7月批准了633个。移民局解释称,这些签证部分发给了已经在新西兰的人以及可能在新西兰求学的工签人员家属。7月份批准的633个学生签中,有272个是付费的国际学生。

北京市人力资源和社会保障局局长徐熙表示,目前一些企业,特别是中小微企业经营压力很大,为了降低企业用工成本,激励挖掘高校毕业生岗位潜力,北京加大了补贴支持力度。对招用本市年度内高校毕业生的企业,按照最低社保补贴标准给予补贴,每人每月1162元,1年近14000元。对今年招用本市高校毕业生的中小微企业,给予6个月的以工代训补贴,每人每月1760元。

●受近日降雨及上游来水影响,长江中下游及洞庭湖、鄱阳湖水位持续上涨。水利部4日将水旱灾害防御Ⅳ级应急响应提升至Ⅲ级。

针对有实验室研究发现新冠病毒D614G变异可能导致病毒加速复制和加强其传播性,世卫组织官员表示:研究显示29%的新冠病毒样本都出现了该变异;这不是新的变异,带有该变异的病毒已在欧洲及美洲传播;但目前并无证据显示其会导致更严重的病情。

自3月19日新西兰政府对公民和居民关闭边境以来,没有任何外国留学生进入新西兰,中国留学生2月初就被禁止入境。

另外,更值得注意的是,经过数据检索和初级筛选,Singing所使用数据集仅包含89位歌手演唱的92个小时的歌曲。

而且,目前关于AI音乐版权纠纷的现象已经开始出现了。两个月前,一家唱片公司Roc Nation便提出了反对AI模的版权声明。其原因是,Youtobe博主Vocal Synthesis使用AI技术复制了旗下艺人Zay-Z的两个音乐作品,最终这起案件已删除仿制作品,而道歉声明而结束。

●据上证报,7月4日,记者从全国股转公司股票公开发行并在精选层挂牌专区看到,有35家企业的审查状态为“中止”。全国股转公司对此表示,相关发行人均是因财务报告过期而按规则予以中止审查。

论文中表明,通过歌词,持续时间,音调信息、参考音频等指标的验证,DeepSinger在合成音调准确度和“声音自然度”方面表现出了不错的性能。从数据来看,中英粤语三首歌曲的音高、音准都超过了85%。而且,在一项20人的用户实验中,DeepSinger生成的歌曲与原始培训音频之间的平均差距仅为0.34-0.76。

●7月3日下午,广东珠海市人力资源和社会保障局官网发布《关于进一步放宽珠海人才引进及入户条件的通知》(征求意见稿)。据了解,珠海拟在全市范围内实施“毕业5年内”先落户后就业;满足条件的非全日制大专以上学历可落户;珠海企业新招用毕业两年内的技工(职业)院校学生可落户珠海。

●据数据宝,统计显示,不含科创板公司,下周面临解禁个股32只,以最新收盘价计算,合计解禁市值559亿元。按一季度末股东数据来看,这32股合计股东达到140万户。7股解禁市值在10亿元以上,分别是红塔证券、旭升股份、志邦家居、睿能科技、富满电子、蓝帆医疗、百达精工等。

据美国约翰斯·霍普金斯大学实时统计数据显示,截至7月5日北京时间6时,全球新冠肺炎累计确诊病例超1116万例,达到11169802例,死亡病例超52万例,达528232例。美国累计确诊病例超283万例,达2832492例,死亡病例超12万例,达129646例。

当地时间7月4日晚,埃及卫生与人口部发表声明称,埃及境内当天新增新冠肺炎确诊病例1324例,新增死亡79例,新增治愈出院413例。截至当地时间7月4日晚,埃及境内累计新冠肺炎病例升至74035例,累计死亡3280例,累计治愈升至20103例。