字节跳动火山引擎发布豆包·音乐模型、同声传译模型

在今日的2024火山引擎 AI 创新巡展上，除了视频生成模型，字节跳动还发布了豆包·音乐模型和豆包·同声传译模型，并宣布对豆包通用模型pro、文生图模型、语音合成模型等垂类模型进行了大幅升级。

豆包·音乐模型的推出，标志着火山引擎在音乐创作领域的深度布局。该模型通过强大的算法支持，实现了高品质的音乐创作自由。歌词生成方面，仅需简单几个字的输入，即可快速生成情感表达精准、意境深远的歌词内容。旋律创作上，豆包·音乐模型提供了超过10种不同的音乐风格和情绪表达选项，满足了创作者多样化的需求。

同时，借助豆包强大的语音合成技术，演唱效果逼真，几可乱真，为用户带来沉浸式的听觉享受。此外，该模型还降低了音乐创作的门槛，支持图片成曲、灵感成曲、写词成曲等多种创作方式，让更多人能够轻松参与到音乐创作中来。

另一方面，豆包·同声传译模型的发布，则为跨语言沟通带来了革命性的变化。该模型实现了实时翻译的超低延时，用户在说话的同时即可看到翻译结果，极大地提升了沟通效率。翻译质量方面，豆包·同声传译模型以流畅自然、准确率高的表现，在办公、法律、教育等多个场景中接近甚至超越了人类同传水平。尤为值得一提的是，该模型还支持音色克隆功能，能够实现跨语言同音色翻译，以更加生动、逼真的声音表现力打破沟通壁垒，让跨语言交流变得更加顺畅无阻。

体验地址:https://www.volcengine.com/product/doubao