讯飞星火声音克隆怎么用？「我的声音」给孩子讲故事教程

每晚孩子睡前要听一个故事——你工作累、嗓子哑、有时还出差不在家。能不能用自己的声音录一个 AI 模型，让 AI 替你给孩子讲故事？**讯飞星火「我的声音」**就是干这个的——录 20-30 段话训练一个属于你的声音模型，之后任何文字都能用你的声音念出来。

下面这篇手把手讲清讯飞星火声音克隆的录制条件、生成流程、给孩子讲绘本的真实使用案例、5 个进阶玩法，以及录制时容易翻车的关键细节。

30 秒了解：讯飞星火声音克隆能干啥

讯飞星火「我的声音」是「个性化设置」里的声音克隆功能——录制 20-30 句标准发音样本后，讯飞星火会训练出一个专属于你的 AI 发音人，之后任何文字内容都能用你的声音 TTS（文本转语音）合成播放。

使用场景	一句话描述	适合谁
给孩子讲故事	用爸妈声音读绘本、童话、儿歌	出差爸妈、教师、爷爷奶奶
录有声书 / 播客	用自己声音批量产音频	自媒体、播客主、知识付费
录课件 / 教学	老师录一次模型，之后讲义自动配音	老师、培训师
企业内训	高管声音读公司公告	企业内容团队
纪念用途	录长辈声音保留	给家人留念

这个功能在国内 C 端 AI 工具里比较独家——豆包、通义、文心等都没有同等门槛的 C 端声音克隆入口，讯飞星火算是开了个口子。

准备工作

开始之前确认下面这些前置：

手机 App 用得最顺：网页也支持但录音通常用手机更方便
安静环境：理想是关上门的卧室或书房，避开空调 / 风扇 / 户外车声
耳机带麦更稳：手机自带麦也行，带麦耳机录出来杂音更少
预留 15-20 分钟：完整录完 20-30 段需要这个时间
声音状态好：不要感冒、不要哑嗓、不要刚醒时声音沙
完全没用过讯飞星火？先看讯飞星火是什么

详细操作步骤

第 1 步：找到「我的声音」入口

打开讯飞星火 App，点右上角头像进入「个人中心」，找「我的声音」或「声音克隆」（不同版本叫法略不同）。第一次进入会看到「立即创建我的声音」按钮。

[此处放截图：个人中心页面，红框标注「我的声音」入口]

看不到这个入口？换最新版本试试。声音克隆是讯飞星火近两年才下放给所有用户的功能，老版本可能没有。

第 2 步：朗读 20-30 段标准文本

点「开始录制」后会进入引导页——讯飞会逐句给出朗读文本，你按提示朗读。

录制时注意：

每段读 1 次：读完点确认进入下一段
录得不满意可以重录：每段右下角有重录按钮
语速保持自然：不要刻意慢或快，正常说话节奏
音量保持稳定：和手机距离 15-20 厘米最稳

[此处放截图：录制页面，红框标注朗读文本和录制按钮]

完整录完 20-30 段大概 15-20 分钟。中途累了可以暂停休息再回来——讯飞会保存进度。

第 3 步：等待模型训练

全部录完后点「提交训练」。讯飞星火会上传你的录音到服务端训练，整个训练通常 10 分钟到几小时不等——具体时长看排队情况。

训练完成后会推送通知（也可以在「我的声音」页面查状态）——「✅ 训练完成，可以使用」。

第 4 步：用自己的声音念任意文字

训练好后进入「我的声音」页面，找「试听」入口——输入任意文字，点播放，你的声音就会念出来。

进一步用法：

绘本 / 故事：把绘本文字粘贴进对话框，让讯飞星火用「我的声音」读
新闻早报：让 AI 总结今日新闻，用你声音念给孩子上学路上听
音频文章：把文章转音频，开车 / 跑步时听

第 5 步：给孩子讲故事的具体设置

最常用的「讲故事」场景，建议这样设：

语速：慢一点（孩子需要时间理解），设为 0.9x
情感：温柔 / 亲切（在 TTS 参数里选）
停顿：自然停顿（不要节奏太快）
配音乐：可以叠一层轻柔背景音乐（讯飞或第三方剪辑工具加）

[此处放截图：用「我的声音」读绘本的设置界面]

5 个高级玩法

1. 录爷爷奶奶的声音做纪念

让长辈录一次声音模型——之后任何文字都可以用他们的声音念出来。给孩子读绘本、给家人发语音、留作纪念。这是个让人会哭的用法——但确实值。

注意：录之前一定要让长辈本人同意，并讲清这个声音模型会怎么用。

2. 给绘本配音做亲子 podcast

录完声音后，把孩子喜欢的绘本一本本转成音频——每天 5-10 分钟一集，做成一个**「妈妈讲绘本」的家庭 podcast**。孩子睡前 / 出门 / 看不到屏幕的时候都能听。

3. 录英文也能用

讯飞星火「我的声音」支持中英文混读——用中文录的模型也能读英文（发音是你的发音习惯）。给孩子读双语绘本特别合适。

4. 配合讯飞绘文批量出有声内容

自媒体场景：用绘文写一篇 5000 字公众号 → 用「我的声音」转音频 → 一份内容两个渠道（公众号 + 喜马拉雅 / 小宇宙 podcast）。内容生产 ROI 翻倍。

5. 录工作汇报当备份

出差或请假时——用「我的声音」录一段给同事的工作交接。文字写好后用 AI 声音念出来，发语音给同事，比文字看着更亲切也省你的嗓子。

录制时的 6 个翻车细节

下面这些坑都是录完才发现，重头开始很费时间——录之前先看一遍。

1. 不要在浴室 / 客厅录

浴室回声大、客厅有家具反射——最佳是关门的卧室 + 床上铺好被子降低回声。专业一点的可以蹲衣柜里录（不开玩笑，这是 podcast 录音常用技巧）。

2. 关掉所有空调 / 风扇

录音环境里任何持续低频噪音都会被一起录进去——空调、风扇、电脑散热风扇、窗外路噪。先关掉再开始录。

3. 录之前喝口温水

干嗓录出来的声音又涩又干。录之前 5 分钟喝一杯温水，让嗓子放松。录到一半干了再喝一口。

4. 不要带情绪录

刚和家人吵完架、刚加完班特别累——这种状态录出来的声音 AI 会捕捉到——最终模型会有疲态感。等情绪平复了再录。

5. 麦克风固定距离

录到一半你把手机从腿上拿起来举到嘴边——距离变化会让模型不稳。从头到尾保持一个固定距离（推荐 15-20 厘米）。

6. 一次录完别隔天补

录 10 段休息一天再录 10 段——你今天和明天的嗓子状态会不一样，合成出来的模型会有”两种音色”的感觉。一次性 15-20 分钟连续录完最稳。

常见坑 + 解决办法

现象	原因	解决
合成出来不像我	录音环境噪音大	换安静环境重录全部
训练失败	部分录音音量过低	检查每段在 60-80 分贝之间
合成的声音僵硬	录的时候太刻意	重录时用平时和家人说话的语气
长句子停顿不自然	文本没有标点	在文本里多加逗号 / 句号断句
念到生僻字读错	TTS 模型字典限制	提前把生僻字标拼音或换说法
念绘本节奏太快	默认语速过快	设置里把语速调到 0.9x 或 0.85x

实战案例：给 4 岁孩子录一周睡前绘本

下面演示一个真实场景——出差一周，提前用「我的声音」录好 7 本绘本音频，让孩子每晚听爸爸讲故事入睡。

第 1 步：录声音模型（第一天晚上，30 分钟）

晚上 9 点孩子睡着后，关门、关空调、坐床上举手机距离嘴 15 厘米。打开讯飞星火 → 「我的声音」 → 开始录。

20 分钟读完 25 段标准文本，提交训练。

第 2 步：选 7 本绘本（第二天午休，10 分钟）

孩子最爱听的 7 本：

周一：《猜猜我有多爱你》
周二：《晚安，月亮》
周三：《大卫，不可以》
周四：《彩虹色的花》
周五：《小蓝和小黄》
周六：《活了 100 万次的猫》
周日：《让路给小鸭子》

第 3 步：把绘本文字录到对话框（第二天晚上，60 分钟）

讯飞星火新建对话，套用下面这个 prompt 模板：

📋 Prompt 模板

请用「我的声音」朗读下面这段绘本文字，参数要求：

语速：0.9x（孩子需要时间理解）语气：温柔亲切，像爸爸给孩子讲故事停顿：每段之间停顿 2 秒，每句之间自然停顿情感：句尾轻柔下扬，避免新闻播报式平直特殊处理：人物对话部分语气略有变化，旁白部分回到温柔陈述

绘本内容： [粘贴绘本全文]

输出：MP3 格式音频，方便发到微信和云盘。

每本绘本生成一段 5-8 分钟的音频——讯飞星火支持导出为 MP3。

第 4 步：传给妈妈或保姆（5 分钟）

7 个 MP3 文件存网盘 / 发微信传给妈妈或保姆。每天睡前给孩子放对应那一本。

妈妈反馈：“孩子听完第一本就问爸爸是不是在手机里”——情感连接没断，比看视频通话还沉浸。

整个流程一周准备时间不到 2 小时——出差一周但孩子每晚听到的都是爸爸的声音讲故事。

隐私和伦理小提醒

声音克隆是个容易被滥用的功能——录前一定确认：

录的是你自己的声音（不要拿别人的录音去训练）
给孩子用前告诉家人（让其他家人知道这是 AI 合成）
不要传未经同意的他人声音模型（这涉及人格权问题）
如果用于商业（有声书、podcast 商用），看清讯飞的授权条款

技术中性，伦理在人。这个功能用好了是温暖工具，用坏了可能伤人——心里有数。

进阶 / 下一步

学会声音克隆后可以继续探索：

讯飞星火完全使用指南 ——讯飞 AI 生态全功能总览
讯飞星火提示词万能公式 ——给 AI 写指令的核心结构
讯飞星火多模态对话 ——除了声音还有图像 / 视频通话
一句话创建讯飞智能体 ——把”用我的声音读故事”做成一个智能体
讯飞绘文 ——配合声音做有声内容的好搭档
AI 视频教程 ——声音 + 视频是数字人的基础

最后一句实话：「我的声音」最打动人的不是技术多牛——是它把一个简单功能用到了正确的场景。出差爸妈、忙碌父母、远在外地的儿女——这些人最缺的不是更聪明的 AI，是自己的声音还能陪在重要的人身边。这功能值得专门学一下。