🤖 AI 跟我学 新手入门

讯飞星火声音克隆怎么用?「我的声音」给孩子讲故事教程

讯飞星火「我的声音」声音克隆功能怎么用?这篇讲清录音条件、生成流程、给孩子讲故事的真实使用案例,附 5 个进阶玩法和录制时容易翻车的小细节

发布 2026/05/19 📎 参考官方文档

每晚孩子睡前要听一个故事——你工作累、嗓子哑、有时还出差不在家。能不能用自己的声音录一个 AI 模型,让 AI 替你给孩子讲故事?**讯飞星火「我的声音」**就是干这个的——录 20-30 段话训练一个属于你的声音模型,之后任何文字都能用你的声音念出来。

下面这篇手把手讲清讯飞星火声音克隆的录制条件、生成流程、给孩子讲绘本的真实使用案例、5 个进阶玩法,以及录制时容易翻车的关键细节。

30 秒了解:讯飞星火声音克隆能干啥

讯飞星火「我的声音」是「个性化设置」里的声音克隆功能——录制 20-30 句标准发音样本后,讯飞星火会训练出一个专属于你的 AI 发音人,之后任何文字内容都能用你的声音 TTS(文本转语音)合成播放。

使用场景一句话描述适合谁
给孩子讲故事用爸妈声音读绘本、童话、儿歌出差爸妈、教师、爷爷奶奶
录有声书 / 播客用自己声音批量产音频自媒体、播客主、知识付费
录课件 / 教学老师录一次模型,之后讲义自动配音老师、培训师
企业内训高管声音读公司公告企业内容团队
纪念用途录长辈声音保留给家人留念

这个功能在国内 C 端 AI 工具里比较独家——豆包、通义、文心等都没有同等门槛的 C 端声音克隆入口,讯飞星火算是开了个口子。

准备工作

开始之前确认下面这些前置:

  • 手机 App 用得最顺:网页也支持但录音通常用手机更方便
  • 安静环境:理想是关上门的卧室或书房,避开空调 / 风扇 / 户外车声
  • 耳机带麦更稳:手机自带麦也行,带麦耳机录出来杂音更少
  • 预留 15-20 分钟:完整录完 20-30 段需要这个时间
  • 声音状态好:不要感冒、不要哑嗓、不要刚醒时声音沙
  • 完全没用过讯飞星火?先看 讯飞星火是什么

详细操作步骤

第 1 步:找到「我的声音」入口

打开讯飞星火 App,点右上角头像进入「个人中心」,找「我的声音」或「声音克隆」(不同版本叫法略不同)。第一次进入会看到「立即创建我的声音」按钮。

[此处放截图:个人中心页面,红框标注「我的声音」入口]

看不到这个入口?换最新版本试试。声音克隆是讯飞星火近两年才下放给所有用户的功能,老版本可能没有。

第 2 步:朗读 20-30 段标准文本

点「开始录制」后会进入引导页——讯飞会逐句给出朗读文本,你按提示朗读。

录制时注意:

  • 每段读 1 次:读完点确认进入下一段
  • 录得不满意可以重录:每段右下角有重录按钮
  • 语速保持自然:不要刻意慢或快,正常说话节奏
  • 音量保持稳定:和手机距离 15-20 厘米最稳

[此处放截图:录制页面,红框标注朗读文本和录制按钮]

完整录完 20-30 段大概 15-20 分钟。中途累了可以暂停休息再回来——讯飞会保存进度。

第 3 步:等待模型训练

全部录完后点「提交训练」。讯飞星火会上传你的录音到服务端训练,整个训练通常 10 分钟到几小时不等——具体时长看排队情况。

训练完成后会推送通知(也可以在「我的声音」页面查状态)——「✅ 训练完成,可以使用」。

第 4 步:用自己的声音念任意文字

训练好后进入「我的声音」页面,找「试听」入口——输入任意文字,点播放,你的声音就会念出来

进一步用法:

  • 绘本 / 故事:把绘本文字粘贴进对话框,让讯飞星火用「我的声音」读
  • 新闻早报:让 AI 总结今日新闻,用你声音念给孩子上学路上听
  • 音频文章:把文章转音频,开车 / 跑步时听

第 5 步:给孩子讲故事的具体设置

最常用的「讲故事」场景,建议这样设:

  • 语速:慢一点(孩子需要时间理解),设为 0.9x
  • 情感:温柔 / 亲切(在 TTS 参数里选)
  • 停顿:自然停顿(不要节奏太快)
  • 配音乐:可以叠一层轻柔背景音乐(讯飞或第三方剪辑工具加)

[此处放截图:用「我的声音」读绘本的设置界面]

5 个高级玩法

1. 录爷爷奶奶的声音做纪念

让长辈录一次声音模型——之后任何文字都可以用他们的声音念出来。给孩子读绘本、给家人发语音、留作纪念。这是个让人会哭的用法——但确实值。

注意:录之前一定要让长辈本人同意,并讲清这个声音模型会怎么用。

2. 给绘本配音做亲子 podcast

录完声音后,把孩子喜欢的绘本一本本转成音频——每天 5-10 分钟一集,做成一个**「妈妈讲绘本」的家庭 podcast**。孩子睡前 / 出门 / 看不到屏幕的时候都能听。

3. 录英文也能用

讯飞星火「我的声音」支持中英文混读——用中文录的模型也能读英文(发音是你的发音习惯)。给孩子读双语绘本特别合适。

4. 配合 讯飞绘文 批量出有声内容

自媒体场景:用绘文写一篇 5000 字公众号 → 用「我的声音」转音频 → 一份内容两个渠道(公众号 + 喜马拉雅 / 小宇宙 podcast)。内容生产 ROI 翻倍

5. 录工作汇报当备份

出差或请假时——用「我的声音」录一段给同事的工作交接。文字写好后用 AI 声音念出来,发语音给同事,比文字看着更亲切也省你的嗓子。

录制时的 6 个翻车细节

下面这些坑都是录完才发现,重头开始很费时间——录之前先看一遍。

1. 不要在浴室 / 客厅录

浴室回声大、客厅有家具反射——最佳是关门的卧室 + 床上铺好被子降低回声。专业一点的可以蹲衣柜里录(不开玩笑,这是 podcast 录音常用技巧)。

2. 关掉所有空调 / 风扇

录音环境里任何持续低频噪音都会被一起录进去——空调、风扇、电脑散热风扇、窗外路噪。先关掉再开始录。

3. 录之前喝口温水

干嗓录出来的声音又涩又干。录之前 5 分钟喝一杯温水,让嗓子放松。录到一半干了再喝一口。

4. 不要带情绪录

刚和家人吵完架、刚加完班特别累——这种状态录出来的声音 AI 会捕捉到——最终模型会有疲态感。等情绪平复了再录。

5. 麦克风固定距离

录到一半你把手机从腿上拿起来举到嘴边——距离变化会让模型不稳。从头到尾保持一个固定距离(推荐 15-20 厘米)。

6. 一次录完别隔天补

录 10 段休息一天再录 10 段——你今天和明天的嗓子状态会不一样,合成出来的模型会有”两种音色”的感觉。一次性 15-20 分钟连续录完最稳。

常见坑 + 解决办法

现象原因解决
合成出来不像我录音环境噪音大换安静环境重录全部
训练失败部分录音音量过低检查每段在 60-80 分贝之间
合成的声音僵硬录的时候太刻意重录时用平时和家人说话的语气
长句子停顿不自然文本没有标点在文本里多加逗号 / 句号断句
念到生僻字读错TTS 模型字典限制提前把生僻字标拼音或换说法
念绘本节奏太快默认语速过快设置里把语速调到 0.9x 或 0.85x

实战案例:给 4 岁孩子录一周睡前绘本

下面演示一个真实场景——出差一周,提前用「我的声音」录好 7 本绘本音频,让孩子每晚听爸爸讲故事入睡。

第 1 步:录声音模型(第一天晚上,30 分钟)

晚上 9 点孩子睡着后,关门、关空调、坐床上举手机距离嘴 15 厘米。打开讯飞星火 → 「我的声音」 → 开始录。

20 分钟读完 25 段标准文本,提交训练。

第 2 步:选 7 本绘本(第二天午休,10 分钟)

孩子最爱听的 7 本:

  • 周一:《猜猜我有多爱你》
  • 周二:《晚安,月亮》
  • 周三:《大卫,不可以》
  • 周四:《彩虹色的花》
  • 周五:《小蓝和小黄》
  • 周六:《活了 100 万次的猫》
  • 周日:《让路给小鸭子》

第 3 步:把绘本文字录到对话框(第二天晚上,60 分钟)

讯飞星火新建对话,套用下面这个 prompt 模板:

📋 Prompt 模板

请用「我的声音」朗读下面这段绘本文字,参数要求:

语速:0.9x(孩子需要时间理解) 语气:温柔亲切,像爸爸给孩子讲故事 停顿:每段之间停顿 2 秒,每句之间自然停顿 情感:句尾轻柔下扬,避免新闻播报式平直 特殊处理:人物对话部分语气略有变化,旁白部分回到温柔陈述

绘本内容: [粘贴绘本全文]

输出:MP3 格式音频,方便发到微信和云盘。

每本绘本生成一段 5-8 分钟的音频——讯飞星火支持导出为 MP3

第 4 步:传给妈妈或保姆(5 分钟)

7 个 MP3 文件存网盘 / 发微信传给妈妈或保姆。每天睡前给孩子放对应那一本。

妈妈反馈:“孩子听完第一本就问爸爸是不是在手机里”——情感连接没断,比看视频通话还沉浸。

整个流程一周准备时间不到 2 小时——出差一周但孩子每晚听到的都是爸爸的声音讲故事。

隐私和伦理小提醒

声音克隆是个容易被滥用的功能——录前一定确认:

  • 录的是你自己的声音(不要拿别人的录音去训练)
  • 给孩子用前告诉家人(让其他家人知道这是 AI 合成)
  • 不要传未经同意的他人声音模型(这涉及人格权问题)
  • 如果用于商业(有声书、podcast 商用),看清讯飞的授权条款

技术中性,伦理在人。这个功能用好了是温暖工具,用坏了可能伤人——心里有数。

进阶 / 下一步

学会声音克隆后可以继续探索:

最后一句实话:「我的声音」最打动人的不是技术多牛——是它把一个简单功能用到了正确的场景。出差爸妈、忙碌父母、远在外地的儿女——这些人最缺的不是更聪明的 AI,是自己的声音还能陪在重要的人身边。这功能值得专门学一下。