4sapi文档
  1. Google Gemini接口
4sapi文档
  • claudecode安装教程(win/mac)
    4SAPI
  • GPT-codex安装教程
    4SAPI
  • VScode安装Claudecode教程
    4SAPI
  • clawdbot 配置 Claude 配置教程
    4SAPI
  • 模型接口
    • Openai
      • 文本生成
      • 文本生成---上下文阅读
      • 图片理解
      • 图片生成(gpt-image-1)
      • 图片编辑/edits
      • 图片编辑 / 网页版
      • 函数调用 tools
      • v1/Responses / 通用
      • 创建文本嵌入
      • 批量创建嵌入
      • 文本转语音 / TTS
      • 语音转文本 / whisper-1
      • 语音转文本 / gpt-4o-transcribe
      • 音频翻译
      • Audio接口 / 输出
      • Audio接口 / 输入
      • 内容补全接口
      • 创建内容审核
      • PDF文件分析
      • deep-research / 深度研究
      • Web search / 联网搜索
      • response_format
    • Anthropic
      • 原生接口
        • 文本生成 (思考配置)
        • 图片理解
        • 文本生成
        • 文本生成 / 强制返回思考
        • 函数调用
        • Web search / 联网搜索
      • OpenAI兼容接口
        • 文本生成
        • 图片理解
        • 文本生成 / 强制返回思考
        • 函数调用
        • Web search / 联网搜索
    • Google
      • OpenAI兼容接口(推荐)
        • 文本生成
        • 文本生成 / 强制返回思考
        • 图片理解
        • 图片生成
        • 图片修改
        • 图片生成 / Imagen 4
        • 音频理解
        • 视频理解
        • 文本转语音 / TTS
        • 图片编辑(Nano-banana)
        • 图片编辑(Nano-banana) base64格式
      • Google Gemini接口
        • 文本生成
          POST
        • 文字转语音
          POST
        • 音频转文
          POST
        • 视频转文
          POST
        • 图片理解
          POST
        • 图片编辑(nanobanana)
          POST
        • 图片编辑(nanobanana pro)
          POST
    • Midjourney
      • openai兼容/chat格式
        • MJ视频 (chat格式)
      • 原生接口
        • 文生图(Imagine)
        • 图片融合(Blend)
        • 按钮点击(Action)
        • 窗口执行(Modal)
        • 生成视频(Video)
        • 图生文(Describe)
        • 编辑图片(Edit)
        • 上传(upload)
        • 换脸(FaceSwap)
        • 缩短提示词(Shorten)
        • 查询
        • 获取种子(Seed)接口
        • 批量查询
        • 文生图 / OpenAI兼容
    • FLUX
      • /fal-ai/nano-banana 文生图
      • /fal-ai/nano-banana/edit 图片编辑
    • 文生图接口
      • flux / OpenAI兼容接口
      • flux-kontext-pro / OpenAI兼容接口
      • stable-diffusion / OpenAI兼容接口
      • ideogram / OpenAI兼容接口
      • recraftv3 / OpenAI兼容接口
      • flux携带参考图 / OpenAI兼容接口
    • Suno
      • 场景一:stems声曲分离 Vocals Instrumental
      • 生成歌曲
      • 生成歌词
      • 查询任务状态(批量)
      • 查询任务状态(单个)
    • 3D模型
      • Hunyuan3D-2
    • veo
      • 图生视频
      • 文生视频
      • 查询视频生成状态
      • 图生视频(chat格式)
    • 豆包
      • doubao-seedream-4-0-250828-文生图
      • doubao-seedream-4-0-250828-图生图
      • doubao-seedream-4-0-250828-多图生图
    • sora
      • 异步格式
        • 创建视频任务
        • 获取视频任务状态
        • 转存视频
        • 创建视频(带 Character)
        • 编辑视频(remix)
        • 获取视频内容
        • 创建视频任务 Copy
        • 从已生成的任务中创建角色
        • 使用故事板创建视频
      • chat格式
        • 创建绘画
      • 创建角色接口
        • 创建角色
    • FLUX
      • Flux(Dalle3 Edits(图生图&文生图))
      • Flux 创建(OpenAI dall-e-3格式)
  • 数据模型
    • 示例数据模型
      • 未命名数据模型
      • Pet
      • Category
      • Tag
  1. Google Gemini接口

文字转语音

POST
https://4sapi.com/v1beta/models/gemini-2.5-pro-preview-tts:generateContent
仅限gemini-2.5-pro-preview-tts和gemini-2.5-flash-preview-tts模型

请求参数

Header 参数

Body 参数application/json

示例
{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "Say cheerfully: Have a wonderful day!"
                }
            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "AUDIO"
        ],
        "speechConfig": {
            "multiSpeakerVoiceConfig": {
                "speakerVoiceConfigs": [
                    {
                        "speaker": "Dr. Anya",
                        "voiceConfig": {
                            "prebuiltVoiceConfig": {
                                "voiceName": "Kore"
                            }
                        }
                    },
                    {
                        "speaker": "Liam",
                        "voiceConfig": {
                            "prebuiltVoiceConfig": {
                                "voiceName": "Puck"
                            }
                        }
                    }
                ]
            }
        }
    }
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://4sapi.com/v1beta/models/gemini-2.5-pro-preview-tts:generateContent' \
--header 'Accept: application/json' \
--header 'Authorization: sk-' \
--header 'Content-Type: application/json' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "Say cheerfully: Have a wonderful day!"
                }
            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "AUDIO"
        ],
        "speechConfig": {
            "multiSpeakerVoiceConfig": {
                "speakerVoiceConfigs": [
                    {
                        "speaker": "Dr. Anya",
                        "voiceConfig": {
                            "prebuiltVoiceConfig": {
                                "voiceName": "Kore"
                            }
                        }
                    },
                    {
                        "speaker": "Liam",
                        "voiceConfig": {
                            "prebuiltVoiceConfig": {
                                "voiceName": "Puck"
                            }
                        }
                    }
                ]
            }
        }
    }
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "inlineData": {
                            "mimeType": "audio/L16;codec=pcm;rate=24000",
                            "data": "+f/3//r/........"
                        }
                    }
                ]
            },
            "finishReason": "STOP",
            "index": 0,
            "safetyRatings": null
        }
    ],
    "promptFeedback": {
        "safetyRatings": null
    },
    "usageMetadata": {
        "promptTokenCount": 9,
        "candidatesTokenCount": 44,
        "totalTokenCount": 53,
        "thoughtsTokenCount": 0,
        "promptTokensDetails": [
            {
                "modality": "TEXT",
                "tokenCount": 9
            }
        ]
    }
}
修改于 2025-10-11 07:01:41
上一页
文本生成
下一页
音频转文
Built with