基于电子发音词典的蒙古语多音字问题研究_敖敏.pdf
NCMMSC2015 中国 天津 2015 年 10 月 基于 电子 发音 词 典的 蒙古 语 多音 字问 题研 究 * 敖敏 1 , 白 音门德 2 , 熊子瑜 1 (12. 内 蒙古 大学 蒙 古学 学院 ,呼 和 浩特 010021 ;3. 社 科院 语 言所 北京 100732) 文 摘:本 文基 于 《 面向 语音 合 成的 蒙古 语电 子发 音词 典》 系 统考 察了 电子 词典 中出 现 的多 音字 、 语 流音 变、 一词 多 音等 三大 问题 , 主 要研 究结 果如 下 : (1 ) 蒙古 语的 传 统研 究和 言语 工程 上所 指 的多 音字 之间 存在 显著 差 异, 为 了加 以 区分 , 把 传统 研 究中 所指 的词 形相 同读 音 不同 的 “ 假” 性多 音 字叫 一词 多音 , 而字 形相 同、 书 面语 读音 相同 而口 语读 音 不同 的词 叫多 音字 。 (2 ) 在 连续 话语 中多 音字 和语 流 音变 的主 要区 别在 于不 同 读音 能否 区别 词义 功能 上。 非成 音节 元 音、 非词 首音 节 短元 音的 弱化 和脱 落以 及 带有 个别 式动 词词 缀的 动 词等 三个 活跃 因素 在超 音 段功 能作 用下 产生 的语 流 音变 是蒙 古语 语流 音变 的 主要 表现 。 (3 ) 在语 音 合成 中可 根据 声学 模型 、 韵 律边 界类 型等 信 息来 判断 目标 词在 具体 语 境中 的唯 一读 音。 关键词: 蒙古语;多音字; 分类;语音合成 中图分类号: H531 * 基金项 目 : 教 育部 青年 基金 项目 (ZDYJS201105)、 2014 年自 治区 高等 学 校学 科技 术研 究项 目 (NJSY14024)和 2015 年度 自治 区民 委语 言 文字 项目 (MW-YB -2015001) 作者 简介 :敖敏 (1983), 女 (蒙 古族), 内 蒙古 自治 区 通辽 市 , 副研 究员 ,aomin1983@126.com 在文 语转 换系 统 (Text to Speech ) 中, 字音 转写是一 项基础工 作,转 写的好 坏直接影 响合 成 语音的可 懂度。它 的任务 就是把 一系列文 字序 列 转换 为对 应的 音标 ( 拼音 ) 序列 。 在多 数情 况下 , 转写工作 是通过词 典检索 当前词 ,配以对 应的 口 语读音的 方式实现 。为了 搭建蒙 古语语音 合成 平 台, 我们 初 步建 立了 《 蒙古 语电 子发 音词 典》 , 目 前建 立的 电子 发音 词典 中 包含 3 万 个词 条。 对 筛 选出 的词 语, 用 我们 制定 的音 素集 ( 敖敏 , 2012), 根据 《蒙 汉 词典》 (增 订 本,2008 ) 转写 出了 每 个 词的 口语 和书 面语 读音 。 下表 1 是 本次 建立 的 电 子发 音词 典的 样本 。 表 1 电子发音词典样本 词条 出现次数 CV 结构 书面语读音 口语读 音 21191 VCVCCVCV - ; 9585 VCVCCVCVC u 9581 CVCCVCVC 9536 VCVCCVC 9517 CVCCVV 9180 CVCVC 9446 CVCV - 9405 CVCCV 9337 VCVCVC 建立好电子 发音词典 后,我 们利用一 套工具 进行音段 切音,最 后通过 人工校对 完成了 训练 句 的精 标。 根据 统计 显示 , 将近 10% 的词 典读 音 与 具体 读音 不一 致。 比如 , 在词 典中 ( ) 一词 的口 语读 音是[ ], 然而 训 练句 中该 词的 口语读 音除了上述读音外还有[ ]。根据我 们的观 察, 引起词典 读音和具体读音 不同的原因 主要有以 下两个方 面 : (1 )蒙古语 在自然 语流 中 的音变相 对复杂 ; (2) 特 殊读音问 题,包 括多 音 字、 外来 词、 专有 名词 的 特殊 读法 等。 利用本次建 立的电子 发音词 典我们合 成出了 蒙古语语 音,合成 声音基 本被母 语是蒙古 语者 接 受,但是 也存在诸 多待解 决的问 题,其中 多音 字 问题 是影 响合成语 音 可懂 度的重 要 因素之一 。 基 于以上考 虑 ,本文 将细致 考察蒙 古语多音 字。 这 项研究结 果为蒙古 语语音 合成中 如何解决 单词 读 音自 动切 音和 标注 提供 科 学的 解决 思路 和方 法。 1 多音字与一词多音 在 初 步 搭 建的 电 子 发音 词 典 中出 现 了 将近 900 个 多音 字, 占 总词 条的 4.83% 。 虽然 连续 语 流 中多音字 的出现频 率不高 ,但是 不正确处 理这些 为数不多 的多音字 会直接 影响蒙 古语合成 语音 的 准确率。 在传统语 言学上 对多音 字的定义 是在字 形上相同 、对应两 个或两 个以上 读音的词 ,也 叫 同形词或 同形异读 异义词 。学者 们用 传统 语言 学 方法研 究多音字的论著不 多。比如, 《蒙文同形 词》 (陈 乃雄 ,1982 ) 一书 对蒙 古语 同形 词的 来 源 做了详细 的研究并 归纳收 录一千 余组多音 字, 对 每个词进 行了读音 标注( 书面语 和口语读 音) 和 词义 解释 。例 如, 有[ ] (恶魔) 、[ ] (这 里) 和[ ] (骟 驼) 三个 读音 ; 有[ ](脚掌) 和[ ] (火绒) , (仓) 和[ ] (螺旋 桨) 等两 个口语 读音 。 《 关于同 形词》 (宝 音陶 格 涛,1989)、 《 关于同形词 和多义词的辨别 方法》 (白希 吉日 乐 特 , 1995 ) 和 《 同音 词 和同 形词》 ( 图 力古尔,1988 ) 等系统研 究了蒙 古语同形 词的 来 源、 分类 及作 用等 问题 。 总体而言, 在传统语 言学中 研究蒙古 语多音 字(同形 词)时主 要从字 母和口 语读音之 间对 应 的角度定 义了多音 字。在 这一定 义下的多 音字 中 既包括 (ula 、[ ] 、脚 掌) 和 (ula 、[ ] 、 火绒) , ( 、[ ] 、 现 在)和 ( 、[ ] 、 星星 ) 一 类书面语 读音相 同、口 语读音不 同的 多 音字 ,也 包括了书 面语读 音不同 、口语读 音也 不 同的 多音 字 。 比 如 , 当 一词 表示 “ 仓” 时口 语 读 音是[ ] 、 书面 语读 音是 sangsa, 当该 词表 示 “ 螺 旋桨 ” 时 口语 读音 是[ ] 、书面 语读 音 sengse 。 [ ] (拉)和[ ] (他 们,她 们) 等词的 情 况也 相同 。 为了避免 传统蒙古 文录入 中普遍 存在的“ 字 形正确、 读音错误 ”的问 题,以 便信息检 索、 语 法语义标 注 ,本次 合成用 的训练 句和电子 发音 词 典中 的每 个词 均选 自 《 现代 蒙 古语 100 万》 语料 , 该 语 料 库已 经用 拉 丁转 写 的方 式避 免 了字 形相 同 、 书 面语 读音 不同 的问 题 。 比如 , 一词 中 的 首字 母 “ ” 有[ ] 、[ ] ( [ ] 、[ ] ) 两种读 音 ,而在 电子发音 词典 中 根据 具 体语境 , 根据 不 同口 语读 音对 应的 书面 语 读音 和 。 因此 , 该词 在语 料库 中不 是多 音 字。 从上述分 析我们 得出两个 结论 : (1 )传统 研 究中指的 多音字并 不是真 正意义 上的多音 字, 其 中 包 含 了真 正的 多 音字 和 词形 相同 读 音不 同的 “假 ” 性多 音字 。 (2) 在言 语工 程上 蒙古 语多 音 字 是指字形 相同、书 面语读 音相同 而口语读 音不 同 的词。为 了加以区 分两种 多音字 ,本研究 把传 统 研究中所 指的词形 相同读 音不同 的 “ 假 ” 性多 音 字叫做一 词多音, 而把字 形相同 、书面语 读音 相 同而口语 读音不同 的词叫 多音 字 。这样命 名与 语 言学中的 多音字的 定义不 矛盾, 也能解决 蒙古 语 中存 在的 实际 问题 。 根据新定义 的多音字 的标准 ,我们的 电子发 音词典中 同样出现 了多音 字。这 些多音字 主要 与 蒙古语口 语中的长 元音化 有关。 众所周知 ,长元 音是蒙古 语口语的 最大语 音特点 之一。有 关长 元 音的来源 方面,学 者们认 为 “从 演变历史 来看 , 现代口语 中的长元 音一般 是从相 应的两个 音演 变 而来,这 样的两个 音节在 蒙语学 里称之为 长元 音 组合 ”[8] 。 蒙古 语 口 语中的 一些 长元 音是 从 “ 书 面语上的 元音 + 等音节 ”的长 元音组合 演变而来 。在字 形层面 上,词中 的这 类 长 元音与 按字 面发音 的 等组 合 相同,从 而构成 了多 音字。 当 ( _ ) 表 示 “ 塞 ” 的词 义时 ,书 面 语第 二音 节元 音 ( ) 和第 三音 节 (_ ) 在口 语中 变成 长元 音[ ] 。 因此, 该词 的口 语 读音 变成[ ] , 如 果表 示 “ 笔 挺 ” 时, 该词 的读 音为[ ] 。 的书面 语读 音 是 [ ] (马 嚼子 )和[ ] (歪的 ) 等 2 种读 音。 当该 词 表示 “马 嚼子 ”的 语义 时 , 书面语 中的 第二 音节 短元 音“ ”( ) 和 第二 音 节 ( )的 组合 在口 语中 变 成了 长元 音[ ] , 当词 义是 “ 歪的 ” 时, 组合 在口 语中 不会 演 变 成长 元音 。 这 类 多音 字还 有 ( 表 示 “ 羊拐 的 背 面” 的[ ] 与表示 “巫师 ” 的[ ] ) 、 (表示 “长颈 鹿” 的[ ] 与表 示 “ 可治 愈 的 ” 的[ ] ) 、 ( 表示“印章 ”的[ ] 与表示 “ 迂回 ” 的 [ ])、 ( 表示 “鲣 鸟 ” 的[ ] 与 表示 “ 搀 奶 ” 的[ ] ) 。 2 多音字与语流音变 从上述多 音字的分 析看出 ,言语 工程中的 多 音字和传 统语言学 上所指 的多音 字的定义 之间 存 在显著差 异。然而 在自然 语流中 ,从一词 对应 多 个读音的 角度,多 音字同 样有多 种表现形 式。 这 种不 同表 现主 要有 以下 三 种。 2.1 词末 出 现的 非成 音节 短元 音 蒙古 语中的 ( 套马 杆 ) 的 书面 语读 音只 有 一种 读音 , 显 然该 词 不是 多音 字。 但是 在 本 次合 成的 训练 句中 该词 的 口语 读音 有两 种形 式: 一 种是[ ] , 下图 1 是[ ] 读音 时 的 语图 1 , 下图 是读音 为[ ] 的语 图, 语 图 上的 “@_^ ” 代 表词 末出 现的 非成 音节 元 音[ ] 。 根据 统计 , 该 词 在语 料库 中出 现了 10 次, 其 中, 读音[ ] 出 现了 4 次, 读音[ ] 出现了 6 1 图 1 中对 一词做音段标注时我们用了蒙古语 SAMPA ,对应国际音标的[ ] 。 次。比 如,短 语 ( 马笼 头 ) 中该 词的 读 音是 [ ] ,短 语 中 该词 的读 音是 [ ] 。为 了 进一 步考 察, 我们 找了 10 名蒙 古 族 学生读该 词时,上 述两种 读音均 出现,并 且同 一 个发音人 先后读该 词时也 有上述 两 种 读音。 在 音 位层面 上,[ ] 、[ ] 两 种口 语读音 相同 , 不区分 词义, 即词 末出 现的[ ] 没有音 位功 能。 在 本次建立 的电子发 音词典 中这类 例子非常 普遍 , 据统 计, 词典 中出 现 了 200 多 例。 敖敏 (2013 ) 的研究 结果 显示, 连续 语流中 出现 的[ ] 的 主要 功 能体 现在 韵律 功层 面上[7] 。 图 1 [ ] 一词的语图 图 [ ] 一词的语图 2.2 个别 式动 词 式是蒙古语 动词的一 个很重 要的语法 范畴, 表示说话 者如何对 待行为 与客观 事物之间 的关 系 的一 种范 畴。 蒙古 语式 动 词的 式又 分为具有 人称范畴 的祈使 式和具 有时间范 畴 的陈述式 。式动词 是结束 式谓语 的主要形 式。 在 自然语流中, 有 “ ”等词缀的词 末 尾可出现 相应的长 元音。 比如, 表示动词 现在 将 来时的 (有)一词 的书面语读音只有一 种 bain_a , 在 连续 语流 中 出现 了两 种口 语读 音: [ ] 和[ ] , 表 示过 去时 的式 动词 (走了)的书面 语读 音是 , 而 口 语读 音有[ ] 和[ ] 两种。这 些词的两 种 读音 的主要 区别体现 在超 音 段功能上 。 具体来 讲,通 常情况 下当目标 词承 担 话语重音 时其口语 读音末 尾出现 相应的长 元音 , 这一现象 也是蒙古 语韵律 短语边 界处音段 延长 的 一种 表现 形式。 比 如, 当 句子 中 出现 ( ) 时 , 如 果该 词承 担 语句 重 音, 口语 读 音通 常为 [ ] ,如 果没 有承 担语 句重 音, 该词 的 读音 是 [ ] 。 在 我们 建 立的 电 子词 典中 这 类词 还有 ([ ] 和[ ])、 ([ ] 和[ ])、 ([ ] 和[ ])、 ([ ] 与[ ])、 ([ ] 与[ ])、 ([ ] 与[ ] ) 、 ([ ] 与[ ] ) 等。 的[ ] 与 表示 “ 可 治愈 的 ” 的[ ] ) 、 ( 表示 “印 章 ” 的[ ] 与表 示 “ 迂回 ” 的[ ])、 (表 示“ 鲣鸟 ”的[ ] 与 表示 “搀奶 ” 的[ ] ) 。 2.3 非词 首 音节 短元音 非词首音节 短元音的 央化或 脱落是蒙 古语口 语 的最大 语音特点 之一。 产生这 类语音现 象的 主 要原 因是 蒙古语非 词首音 节短元 音没有区 别词 义 功能 引起 的 。在连 续语流 中非词 首音节短 元音 非 常活跃, 不仅同一 个词不 同位置 出现时的 读音 不 同,而且 同一个发 音人先 后读相 同的词也 会出 现 两种读 音。比 如, (草) 一词 的书面 语读 音 是 , 词典 上该 词的 口语 读音 是[ ] , 而连续 语流 中该 词还 有[ ] 的读 音; (活的) 的 书 面 语 读 音 是 , 口 语 读 音 有 [ ] 、[ ] 两种 读音。 这类词 语料库中 还 ([ ] 与[ ] ) 、 ([ ] 与[ ] ) 、 ([ ] 与[ ] ) 等 。 上述三种 语音现象 在蒙古 语自然 语流中的 表现 非 常活跃, 从而导致 单音词 在具体 语中也对 应了 两 个(或多 个)口语 读音。 但是这 类词形相 同口 语 读音不同 的词与我 们所指 的多音 字有本质 区别 。 本 文 指 的多 音字 的 不同 口 语读 音对 应 不同 的词 义, 而以 上三种类 型的一 词的多 个读音之 间不 区 分词义 , 是音素层 面上的 语音变 化 。 即多 音字 定 义中提到的 “ 口语 读音 ” 是指音 位层面上 的读音 、 不同读音 表示不同 的语义 ,目标 词在具体 语境 中 出现的音 素层面上 的语音 变化不 包括在多 音字 范 围内,属 于语流音 变。蒙 古语自 然 语流中 的一 部 分音变是 一连串音 紧密连 接,发 音部位和 发音 方 法不断改 变,有时 难免相 互影响 ,产生明 显的 变 化; 另一 部分 是超 音段 层 面上 的特 殊音 变。 3 语音合成中处理多音字的构思 3.1 音段 时长 模型 通常情况下 , 多音字 的不同 读音 在音 段层面 上均存在 显著差异 。一种 读音中 没有长元 音、 一 种读音中 有长元音 ,并且 新增的 长元音通 常在 词 末位 置出 现。 比 如, ( [ ] 和[ ]) 。 总 所周知, 蒙古语中 音长有 区分词 义功能。 对蒙 古 语长短元 音的研究 显示, 长短元 音的时长 有显 著 差异,通 常情况下 ,长元 音比短 元音长一 倍。 由 于非词首 音节短元 音的央 化作用 ,词中音 节出 现 的短元音 与第一音 节出现 的短元 音相比 时 长更 短 (呼和,1999 ) ,即 长短元 音的声 学模型有 显著 差 异。因此 ,在音段 自动切 分时, 我们可根 据目 标 多音 字的 不同 音长 模型 来 初 ” (为 对 内蒙 古的 发展 非常 有信 心 ) 回 答 不同 问题 时 , 一 词 的 读 音 不 同 : 当 回 答 “ ” (谁 对内 蒙古的发 展有信心 ?)时 语句重 音落在句 子主 语 “ ” ( 我) 上, 句末 词 “ ” 通 常 读音 是[ ] 。 下图 是语 句重 音 落在 “ ” 时 的该 句的 语图 , 从 语图上我 们清晰地 看出语 句的音 高曲线的 最高 点 落在 “ ” 一词 上, 并且 “ ” 后出 现了 300ms 的 语音 停顿 。当 回答 “ ” ( 您对内 蒙古 的发展 有信 息吗 ?) 的 问题 时语 句重 音则 落在 “ ” 一词 上, 这时 该 词 的读 音是[ ] 。 下图 是语 句 重音 落在 “ ” 时的 语图 ,从 语图 上我 们可 以 看出, “ ”的 词 末出 现了 时长 大约 195ms 的长 元音[ ], 图上 用 红 色的方框 标出了该 元音。 因此, 目标多音 字末 尾 有无 出现 较长浊音 段是判 断这类 多音字读 音的 一 个语 音学 线索 。 图 3 “ 0 0 7 8 ” 实验句语图 图 4 “ 0 0 7 8 ” 实验句语图 3.2 韵律 边界 类型 在连续语 流中出现 的非成 音节元 音和韵律 信 边界息可 成为词典 读音自 动标注 的线索之 一。 相 关研究认 为连续语 流中出 现的非 成音节元 边界 与 话语的韵 律结构有 必然的 关系, 一般情况 下, 非 成音节元 音是韵律 短语边 界。除 此之外, 不同 韵 律边界处 的语音停 顿和音 高走势 有不同的 表现 形 式; 韵律 短语 边界 出现 200-300ms 的 显 著语 音 停 顿、 边 界 处也有 音 段延 长和 音高 重 置等 韵律 特点 , 韵律词边 界没有显 著语音 停顿和 音段延长 ,并 且 韵 律 词 的边 界与 语 法词 边 界基 本相 同 (敖 敏, 2012 ) 。 在 韵律 边 界的 自动 切分 中, 可根 据这 些 语 音 特 点 来实 现韵 律 词和 韵 律短 语边 界 的自 动标 注。 3 结论与展望 自蒙 古语 语音 合成 研究 启 动以 来, 我们 初步 实现 了句 子层 面的 语音 合 成, 合成 出的 声音 被母 语是 蒙古 语 者 接受 ,也 得 到了 业内 专家 的一 些肯 定。 但是 我们 的研 究仅 仅 处在 起始 阶段 ,待 解决 的问 题比 较多 ,只 有这 些 问题 解决 了才 能真 正提 高合 成声 音的 音质 。最 近 两年 我们 主要 从音 段和 超音 段方面 入 手探 索了 蒙 古语 合成 问题 取得 了一 些成 就。 比如 ,蒙 古语 韵 律层 级的 划分 、字 音转 写音 素集 的确 定、 合成 平 台建 立等 等。 其中 如何 实现 字到 音( 口语 读音 ) 的自 动转 写是 一直 以来 困扰 我们 的问 题。 本文 中 基于 电子 发音 词典 初步 考察 了 多 音字 问题 ,其 中 包含 不同 层面 上的 多音 字定 义与 区分 、 多 音字 与 语 流 音变 的区 别, 并简 单探 讨了 语音 合成 中如 何 处理 多音 字的 设想 。 但 是, 连续 语句 中的 停顿 、 节奏 、重 音等 表面 的韵 律表 现 是 句法 、词 性、 语 音、 语义 等众 多控 制要 素的 综合 体现 ,仅 从语 音 入手 无法 全面 揭示 影响 合成 语音 质量 的各 类原 因 。国 内外 其他 语言 的相 关研 究也 表明 ,连 续话 语 的停 顿与 句法 关系 、韵 律 层级与 词性 之间的 松紧程 度具 有一定 的关 系 [10] 。 在未 来几年内 ,我们将从 句法结构 与韵律 边界 位置 、停 顿分 布与 词 性、 语义 搭配 与多 音字 处理 、音 变与 声学 模型 等 多个 视角 来系 统研 究如 何提 高蒙 古语 合成 语音 质 量问 题, 以期 拓宽 蒙古 语语 音合 成研 究的 广度 和 深度 。 参 考 文 献 [1] 敖 敏. 基于韵 律的蒙 古语语 音合成 研究[D]. 呼和 浩特. 内 蒙古大 学.2012 年 7 月。 Aomin. Research on Mongolian Speech Synthesis Based on Prosody [D].Hohhot. Inner Mongolian University.2012. [2] 陈乃 雄. 蒙 文同 形词[M]. 呼 和浩 特 : 内 蒙古 教育 出版 社, 1982. Naixiong Chen.Study on the Mongolian Homograph.Inner Mongolia Education Publishing House1982. [3] 宝音 套格 套胡. 关于 同形 词[J]. 蒙 古语 文学. 1989,2:37-43 页. Baoyintaogetaohu. About Mongolian Homograph. [J].Mongolian Literature.1989,2: 37-43. [4] 图力古尔. 同音词和同形词[J]. 内蒙古民族师范学院学 报.1988,3:15-31. Tuliguer. Homontm and Homograph[J]. Journal of Inner Mongolia University for Nationalities.1988,3:15-31. [5] 白希吉日乐特关于同形词和多义 词的辨别方法. 蒙古语文 [J].1995,12:48-51. Xijiriletu Bai. Discrimination method between the homomorphism words and polyphone.Mongolian Language [J].1995, 12:48-51. [6] 呼和. 蒙古语 语音声学 分析[M]. 呼和浩 特: 内 蒙古大 学出 版 社,1999. Huhe.Acoustic Analysis of Mongolian words[M].Hohhot:Inner Mongolian University Press,1999. [7] 敖敏, 白音门德, 熊子瑜. 蒙古语非成音节元音的韵律价值研究 [C]//. 第九 届 中文 口语 语言 处理 国际 会 议论 文集. 香港:2013. Aomin,Bayarmend Borjigin,Ziyu Xiong.Research on the Prosodic V alue of Mongolian Non-Syllabic V owel. [C]// The 9th international conference on Chinese spoken language processing.HongKong:2003. [8] 清格尔泰. 蒙古 语语 法[M] ]. 呼和 浩特 : 内 蒙古 人 民出 版社,1991. Qinggeertai.Mongolian Grammar[M] ].Hohhot: Inner Mongolia people's publishing house,1991. [9] 高· 照日 格图. 不同词 类的词 汇用于 人名 时的音 变现 象[J]. 内蒙古 社会 科学.1991,2:76-86 页. Zhaorigetu Gao. Different parts of speech of words used to name the phenomenon of sound change [J].Inner Mongolia Social Science1991, 2:76-86. [10] 曹剑芬. 基于语法信息的汉语韵律结构 预测[J]. 中文信息处 理.2003,3:41-46 页. Jianfen Cao. Prediction of Prosodic Organization Based on Grammatical Information[J].Journal of Chinese Information Processing, .2003,3:41-46. [11] 内蒙古大学蒙古学学院语言所. 蒙汉词典[M]. 呼和浩特: 内蒙古 大学 出版 社,1999. Institute of Linguistics Inner Mongolian University. Mongolian Dictionary[M].Hohhot: Inner Mongolian University Press,1999. [12] 林焘. 王理 嘉. 语 音学 教程[M]. 北 京: 北 京大 学出 版社,2007. Tao Lin.Lijia Wang.Phonetics Tuturial[M].BeiJing:Peking University Press2007. Study on the Polyphone Based on the electronic dictionary of Mongolian Aomin,Baiyinmende 1, 2 ,Ziyu XIONG 3 12. School of Mongolian Language Inner Mongolian University, Hohhot 010021, China 3. Institute of Linguistics ,Chinese Academy of Social Sciences, Beijing, , 100732, China Abstract: Based on the electronic dictionary of Mongolian we have studied Polyphone, our studies show that:( 1) There are significant differences between traditional linguistics and language engineering about polyphone. In order to distinguish, the traditional research refers to the same form different pronunciations of “false“ of Chinese called polysemy, and the same font, written and spoken.(2) The main polyphone and phonetic changes in continuous speech is different pronunciation function can distinguish word meanings.(3) In Mongolian speech synthesis system ,we can be judged only the pronunciation of the target words in specific contexts according to the acoustic model, the prosodic boundary type information. Key words: speech communication; conference; Xi'an;