> ## Documentation Index
> Fetch the complete documentation index at: https://veniceai-mintlify-d2fddb8a.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# 音乐与音效模型

> 用于 AI 生成歌曲、器乐曲目和音效合成的 Venice 音乐与音频模型，包含模型 ID、价格和 prompt 指引。

<div id="model-search-placeholder" data-filter="music">Loading models...</div>

## 模型类别

**歌曲生成：** 创建完整歌曲，支持可选歌词和人声

* ACE-Step 1.5、ElevenLabs Music、MiniMax Music 2.0

**音乐与音效：** 从文本 prompt 生成器乐或音效

* Stable Audio 2.5

**音效：** 从文本 prompt 合成音效和氛围音

* ElevenLabs Sound Effects、MMAudio V2

<Tip>
  ElevenLabs Music 是唯一支持 `force_instrumental` 以生成无人声音乐的模型。
</Tip>

<Note>
  音频生成使用异步队列系统。请参阅 [Audio Queue API](/api-reference/endpoint/audio/queue) 启动生成，并通过 [Audio Retrieve API](/api-reference/endpoint/audio/retrieve) 获取结果。
</Note>

## 定价

价格因模型而异：

* **按次生成：** 每段音频固定价格（MiniMax Music 2.0、Stable Audio 2.5）
* **按时长分级：** 价格随时长等级变化（ElevenLabs Music、ACE-Step 1.5）
* **按秒计费：** 基于输出时长（ElevenLabs Sound Effects、MMAudio V2）

如需在生成前获得准确报价，请使用 [Audio Quote API](/api-reference/endpoint/audio/quote)。

### 按时长分级的定价

按时长分级定价的模型可接受任何在模型 `min_duration`–`max_duration` 范围内的 `duration_seconds`。价格由所请求时长落入的等级决定。等级范围在 `/models` 响应的 `pricing.durations` 下返回，每个等级带有 `min_seconds` 和 `max_seconds`。

例如，ElevenLabs Music 接受 3–600 秒（最长 10 分钟），价格为每分钟 \$0.75，向上取整到最近的分钟：

| 时长范围     | 等级键   | 基础价格   |
| -------- | ----- | ------ |
| 3–60s    | `60`  | \$0.75 |
| 61–120s  | `120` | \$1.50 |
| 121–180s | `180` | \$2.25 |
| 181–240s | `240` | \$3.00 |
| 241–300s | `300` | \$3.75 |
| 301–360s | `360` | \$4.50 |
| 361–420s | `420` | \$5.25 |
| 421–480s | `480` | \$6.00 |
| 481–540s | `540` | \$6.75 |
| 541–600s | `600` | \$7.50 |

这些是加价前的基础价格。请使用 [Audio Quote API](/api-reference/endpoint/audio/quote) 获取您将被收取的确切价格。

## 关键参数

| 参数                   | 说明                                      |
| -------------------- | --------------------------------------- |
| `prompt`             | 要生成的音频的文本描述                             |
| `lyrics_prompt`      | 声乐模型的歌词（当模型 `lyrics_required=true` 时必填） |
| `duration_seconds`   | 输出长度（秒）                                 |
| `force_instrumental` | 生成无人声音频（在支持的模型上）                        |
