[ᠨᠠᠰᠤᠨ᠋ᠤ᠋ᠷᠲᠤ] - ᠦᠭᠦᠯᠡᠯ - (ᠬᠢᠲᠠᠳ) - 蒙古文词根、词干、词尾的自动切分系统
蒙 古 文 词 根 、 词 干 、 词 尾 的 自 动 切 分 系 统 X 那 顺 乌 日 图 (内 蒙 古 大 学 蒙 古 语 文 研 究 所 ) 内 容 提 要 : 在 蒙 文 信 息 处 理 工 作 的 词 处 理 阶 段 , 自 动 切 分 构 形 词 尾 和 词 根 、 词 干 是 多 项 后 续 工 作 的 基 础 。 如 , 词 汇 和 词 尾 的 统 计 , 各 种 词 典 的 编 制 , 进 行 句 处 理 , 篇 章 处 理 等 都 需 要 以 正 确 的 “ 切 分 ” 为 基 础 。 词 根 、 词 干 和 词 尾 的 切 分 迄 今 为 止 都 是 人 工 完 成 的 , 所 以 存 在 着 速 度 慢 、 人 力 投 入 大 以 及 出 现 因 人 而 异 , 前 后 不 一 致 等 问 题 。 本 系 统 从 计 算 机 自 动 切 分 的 角 度 对 蒙 古 语 构 形 词 尾 进 行 了 分 类 , 在 具 有 两 万 多 词 条 的 《 蒙 汉 辞 典 》 和 一 百 万 词 级 的 《 现 代 蒙 古 语 数 据 库 》 语 料 的 基 础 上 考 察 和 比 较 了 蒙 古 语 的 词 根 、 词 干 和 构 形 词 尾 , 在 传 统 语 法 的 研 究 成 果 和 计 算 语 言 学 方 法 相 结 合 的 基 础 上 把 蒙 古 文 近 200 种 词 尾 分 成 三 大 类 , 并 根 据 各 类 词 尾 的 不 同 特 点 编 制 了 几 种 词 典 , 设 计 , 提 出 了 二 十 多 组 语 法 条 件 和 若 干 个 生 成 规 则 , 在 计 算 机 上 实 现 了 自 动 切 分 。 据 测 试 , 使 用 该 系 统 可 以 覆 , 盖 现 代 蒙 古 语 各 类 文 本 的 95% 以 上 。 关 键 词 : 蒙 古 文 词 根 词 干 词 尾 自 动 切 分 系 统 一 在 语 文 信 息 处 理 工 作 中 对 自 然 语 言 词 的 处 理 是 非 常 关 键 的 一 个 环 节 。 因 为 词 是 语 言 中 表 示 词 汇 、 语 法 意 义 的 最 基 本 单 位 。 所 以 不 仅 在 传 统 语 言 学 中 词 法 学 研 究 占 着 重 要 地 位 , 而 且 在 计 算 语 言 学 研 究 中 词 处 理 的 研 究 同 样 很 重 要 。 因 为 词 处 理 是 句 处 理 和 篇 章 处 理 的 基 础 。 由 于 各 种 语 言 在 类 型 上 、 结 构 上 的 差 异 , 对 各 种 不 同 语 言 词 处 理 工 作 的 侧 重 点 也 有 所 不 同 。 譬 如 , 汉 语 是 孤 立 型 语 言 , 其 构 词 、 构 形 法 主 要 依 靠 词 序 来 表 现 , 这 样 , 在 中 文 信 息 处 理 工 作 中 怎 样 切 分 词 是 一 个 重 要 的 课 题 。 而 蒙 古 语 是 粘 着 性 语 言 , 它 的 构 词 和 构 形 都 是 以 词 根 、 词 干 上 连 接 不 同 词 尾 来 完 成 的 。 由 于 书 写 时 词 与 词 之 间 都 有 间 隔 , 所 以 切 词 并 不 成 问 题 , 而 词 根 、 词 干 与 词 尾 的 切 分 则 更 为 重 要 。 每 一 个 词 的 构 成 和 其 语 法 意 义 的 表 示 都 是 依 赖 于 不 同 词 尾 的 缀 接 , 所 以 只 有 正 确 切 分 词 根 、 词 干 和 词 尾 才 能 揭 示 其 词 类 属 性 和 语 法 关 系 。 另 一 方 面 , 蒙 古 语 中 存 在 大 量 的 构 词 、 构 形 词 尾 , 而 且 它 们 往 往 有 同 形 或 兼 类 现 象 , 这 使 蒙 古 语 词 根 、 词 干 的 和 词 尾 的 切 分 更 加 复 杂 化 。 80 年 代 我 们 在 内 蒙 古 大 学 建 立 《 现 代 蒙 古 语 文 数 据 库 》 (100 万 词 级 )时 就 注 意 到 了 并 ·35· X 此 项 研 究 得 到 国 家 自 然 科 学 基 金 资 助 , 批 准 号 69163301。 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 同 时 进 行 了 词 根 、 词 干 和 词 尾 的 切 分 工 作 。 但 是 当 时 采 取 了 人 工 切 分 的 前 加 工 处 理 方 法 。 譬 如 , 录 入 语 料 时 动 词 构 形 词 尾 与 词 根 、 词 干 之 间 用 “ ” 符 号 分 开 , 名 词 构 形 词 尾 与 词 根 、 词 干 之 间 用 “ 2” 符 号 分 开 。 这 样 , 虽 然 解 决 了 当 时 词 根 、 词 干 和 词 尾 的 切 分 任 务 , 但 同 时 发 现 这 样 做 一 方 面 增 加 了 录 入 、 校 对 人 员 的 负 担 , 也 制 约 了 语 料 库 扩 充 和 语 料 库 智 能 化 程 度 的 提 高 。 具 体 地 讲 , 人 工 进 行 前 加 工 时 要 求 录 入 员 和 校 对 人 员 必 须 熟 悉 哪 些 是 构 词 词 尾 、 哪 些 是 构 形 词 尾 , 哪 些 是 需 要 切 的 、 哪 些 是 不 许 切 的 。 对 工 作 人 员 的 这 种 要 求 , 虽 然 在 建 立 小 型 语 料 库 时 尚 且 过 得 去 , 但 要 建 立 大 容 量 的 开 放 性 语 料 库 就 无 法 解 决 这 么 大 的 人 力 投 入 了 。 再 说 , 既 使 解 决 了 人 力 投 入 问 题 , 但 由 于 蒙 古 语 词 尾 繁 多 , 功 能 、 形 式 、 意 义 又 复 杂 , 难 免 出 现 处 理 当 中 因 人 而 异 , 前 后 矛 盾 的 弊 端 。 这 样 , 我 们 在 完 成 100 万 词 级 语 料 库 的 基 础 上 提 出 了 研 制 “ 蒙 古 文 词 根 、 词 干 、 词 尾 的 自 动 切 分 系 统 ” 的 任 务 。 因 为 词 根 、 词 干 、 词 尾 自 动 切 分 是 蒙 文 信 息 处 理 工 作 中 一 系 列 后 续 工 作 的 基 础 。 如 , 统 计 各 类 词 及 其 词 根 、 词 干 、 词 尾 , 分 析 、 研 究 其 构 成 规 则 和 语 法 形 态 , 编 制 各 类 词 典 , 自 动 标 注 词 类 和 各 种 词 法 、 句 法 知 识 的 获 取 , 自 动 生 成 词 和 句 , 乃 至 编 制 电 子 词 典 和 进 行 机 器 翻 译 等 都 将 在 自 动 切 分 的 基 础 上 进 行 。 为 了 给 这 些 多 项 工 作 打 好 基 础 , 我 们 着 手 研 制 了 这 一 系 统 。 由 于 我 们 建 立 的 《 现 代 蒙 古 语 数 据 库 》 (100 万 词 级 ) 是 以 拉 丁 文 转 写 蒙 古 文 的 方 式 完 成 的 , 所 以 该 系 统 是 在 用 拉 丁 文 转 写 的 蒙 古 语 语 料 库 的 基 础 上 研 制 的 。 蒙 古 语 中 与 词 干 连 写 的 , 数 量 最 繁 多 、 形 式 最 复 杂 的 是 动 词 构 形 词 尾 , 为 此 在 本 项 目 中 我 们 着 重 解 决 了 动 词 词 尾 。 二 该 系 统 中 我 们 从 计 算 机 自 动 切 分 的 角 度 , 对 蒙 古 文 构 形 词 尾 进 行 了 分 类 。 以 具 有 20000 多 词 条 的 《 蒙 汉 辞 典 》 和 100 万 词 级 的 《 现 代 蒙 古 语 文 数 据 库 》 的 语 料 作 为 基 础 , 考 察 和 比 较 了 蒙 古 语 的 词 根 , 词 干 和 构 形 词 尾 , 共 选 出 164 个 动 词 词 尾 (包 括 一 个 词 尾 的 几 种 变 体 ) 和 与 词 根 连 写 的 11 个 名 词 格 附 加 成 分 以 及 与 词 干 连 写 的 14 个 语 气 词 的 切 分 为 主 要 对 象 。 其 中 需 要 说 明 的 是 , 上 述 14 个 语 气 词 , 虽 然 不 是 构 形 词 尾 , 但 它 们 已 与 词 干 连 写 , 在 读 音 上 或 书 写 形 式 上 与 它 原 有 的 形 式 发 生 了 变 化 , 有 些 音 或 音 节 由 于 与 词 干 的 连 结 需 要 而 脱 落 , 所 以 可 看 作 是 一 部 分 特 殊 的 词 尾 。 如 果 不 切 分 这 些 特 殊 的 词 尾 , 蒙 古 语 词 、 词 根 、 词 干 、 词 尾 的 自 动 识 别 、 统 计 就 受 到 影 响 。 例 如 B IS IU (不 是 … … 吗 ?)是 由 否 定 语 气 词 B IS I(不 是 ) 和 疑 问 语 气 词 UU (吗 ) 构 成 的 , UU 在 两 个 词 连 写 时 发 生 变 化 , 变 成 了 , — U , 如 果 我 们 不 把 它 们 切 开 , 自 动 识 别 、 统 计 否 定 语 气 词 时 这 部 分 B IS I 就 被 丢 掉 ; 识 别 、 统 计 疑 问 语 气 词 时 UU 的 这 一 变 体 也 被 丢 掉 。 研 制 自 动 切 分 系 统 时 , 我 们 主 要 采 用 了 (1)编 制 词 典 ; (2)设 计 各 种 语 法 条 件 ; (3)设 计 生 成 规 则 等 方 法 。 1.《 词 典 》 :《 词 典 》 是 由 《 词 根 词 典 》 和 《 词 尾 词 典 》 两 部 分 构 成 的 。 《 词 根 词 典 》 中 包 括 三 个 词 典 : (1)《 基 本 词 典 》 , 这 个 词 典 收 词 近 两 万 条 , 其 中 《 TOL I1 (词 典 1)》 是 动 词 词 根 词 典 , 收 词 5100 多 条 。 它 是 该 系 统 中 最 重 要 的 词 典 , 该 词 典 中 只 收 ·45· 内 蒙 古 大 学 学 报 (人 文 社 会 科 学 版 ) 1997 年 第 2 期 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 入 了 动 词 词 根 和 动 词 第 一 词 干 (即 从 非 动 词 类 词 派 生 的 动 词 ) , 而 未 收 入 由 动 词 的 态 , 体 形 《 AD T》 收 入 这 部 分 词 , 作 为 以 语 法 条 件 或 人 机 对 话 来 处 理 同 音 词 的 基 础 。 (3)《 H IT (人 工 切 分 词 典 )》 , 该 词 典 中 收 入 词 尾 形 式 上 与 动 词 同 形 的 非 动 词 类 词 。 如 : 连 接 词 BO GED 的 GED 在 形 式 上 与 形 动 词 IR E GED 的 GED 是 一 样 的 。 在 处 理 GED 时 我 们 通 过 访 问 《 H IT》 , 达 到 排 歧 目 的 。 该 词 典 在 内 部 排 序 上 采 用 与 当 前 词 相 关 词 尾 的 形 式 来 分 类 的 方 法 , 如 当 遇 到 SVNDA G (变 长 , 松 紧 带 )一 词 时 , 由 于 与 带 有 DA G 的 词 排 在 一 起 , 所 以 只 访 问 词 典 中 的 这 一 部 分 , 系 统 就 可 以 做 出 相 应 决 定 。 《 词 尾 词 典 》 , 该 词 典 收 入 系 统 中 要 自 动 切 分 的 168 个 动 词 词 尾 、 11 个 名 词 词 尾 、 14 个 语 气 词 和 与 词 干 分 开 书 写 的 2 个 形 容 词 构 词 词 尾 。 编 排 时 先 按 每 一 个 词 类 进 行 了 分 类 , 然 后 对 每 一 类 词 尾 以 其 频 率 的 高 低 进 行 了 排 序 。 2. 语 法 条 件 : 这 是 基 于 传 统 语 法 中 对 蒙 古 语 词 尾 的 描 写 研 究 的 成 果 , 并 以 计 算 语 言 学 的 角 度 对 每 一 类 词 尾 的 序 列 特 征 进 行 归 纳 的 一 系 列 条 件 。 例 如 , 切 分 GA SA I, GESE I, GTVN , GTUN … … 等 一 类 (28 个 )词 尾 的 条 件 为 : (1)在 a$ b$ a$ b$ … … GA SA I … … GTVN … … GESE I … … GTUN 这 种 字 符 串 中 先 看 b$ (词 尾 部 分 ) 的 前 一 个 字 符 是 不 是 A、 E、 I、 0、 V、 O、 U 字 符 : (A ) 如 果 非 这 些 字 符 则 放 弃 ; (B )如 果 是 这 些 字 符 , 就 从 《 T 0L I1》 中 查 a$ (词 干 部 分 ) ; (a) 如 果 查 到 了 , 就 在 b$ 前 加 “ ” 标 记 ; (b) 如 果 查 不 到 , 就 把 a$ 最 末 的 0、 V、 O、 U 去 掉 再 从 《 T 0L I1》 中 查 : Æ 如 果 查 到 , 就 在 0、 V、 O、 U 前 后 各 加 一 个 “ ” 标 记 (这 说 明 其 词 干 为 动 词 , 词 尾 为 动 词 构 形 词 尾 , 0、 V、 O、 U 为 以 蒙 古 文 正 字 法 规 则 增 加 的 元 音 - “ 连 结 元 音 ” ) ; 如 果 查 不 到 , 则 再 看 a$ 是 否 O GGO、 HOBBO、 J IBBU、 VDV R IDDV、 DV RADDV 字 符 串 (它 们 是 一 些 以 特 殊 规 则 连 结 的 词 ) : ① 如 果 是 , 就 在 末 位 两 个 字 符 - GO、 BO、 BU、 DV - 前 后 各 加 一 个 “ ” 标 记 ; ② 如 果 非 这 些 字 符 串 , 则 放 弃 。 我 们 的 语 法 条 件 中 包 括 这 类 20 多 组 条 件 , 且 每 一 组 条 件 由 单 层 到 六 层 不 同 层 次 嵌 套 而 成 。 以 这 些 语 法 条 件 能 够 解 决 80% 左 右 词 尾 的 自 动 切 分 。 3.《 生 成 规 则 》 : 这 是 一 部 生 成 动 词 词 干 的 规 则 集 。 如 前 所 述 , 我 们 的 《 T 0L I1》 只 收 入 了 动 词 词 根 和 由 非 动 词 类 词 派 生 的 动 词 , 但 蒙 古 语 中 相 当 多 的 动 词 是 由 动 词 派 生 的 , 动 词 的 态 、 体 范 畴 具 有 构 形 、 构 词 双 重 功 能 , 所 以 缀 加 体 、 态 词 尾 生 成 的 词 是 被 包 含 在 词 干 里 边 ·55· 那 顺 乌 日 图 蒙 古 文 根 、 词 干 、 词 尾 的 自 动 切 分 系 统 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 的 。 其 中 表 示 态 的 词 尾 至 少 有 14 个 , 表 示 体 的 词 尾 至 少 有 9 个 (不 包 括 以 重 叠 形 式 表 示 体 的 词 尾 )。 这 样 , 如 果 把 由 这 一 部 分 词 尾 派 生 的 动 词 词 干 也 收 入 到 词 典 中 , 那 么 , 我 们 的 动 词 词 典 至 少 要 收 入 61000 多 个 词 。 这 样 庞 大 的 词 典 无 论 从 节 约 机 器 内 存 , 提 高 运 行 速 度 方 面 考 虑 , 还 是 从 节 约 人 力 , 提 高 智 能 化 程 度 方 面 考 虑 都 是 不 合 理 的 。 为 了 解 决 这 一 问 题 我 们 研 制 了 这 个 词 干 生 成 规 则 集 。 按 照 这 一 规 则 , 系 统 从 一 个 动 词 的 尾 部 层 层 切 分 , 一 直 到 词 根 (或 第 一 词 干 ) , 确 定 这 一 词 的 词 性 及 其 所 有 词 尾 的 属 性 。 如 , TU GEM EL J IGU 2 LU GD EJE I(使 … 被 推 广 了 ) 一 词 中 我 们 需 要 自 动 切 分 的 是 末 位 词 尾 JE I, 在 识 别 这 一 词 尾 时 一 个 重 要 的 条 件 是 其 词 干 是 否 在 《 T 0L I1》 里 , 如 果 有 , 则 切 (当 然 还 需 要 进 一 步 判 断 ) , 如 果 没 有 则 放 弃 , 但 是 第 一 次 查 《 T 0L I1》 中 没 有 TU GEM EL J IGULU GD E 这 个 动 词 词 干 , 这 时 用 生 成 规 则 对 GD E 进 行 判 断 , 判 断 的 第 一 步 , 系 统 肯 定 有 GD E 这 个 动 词 词 尾 , 但 它 前 面 必 须 是 动 词 , 第 二 步 判 断 时 也 从 《 T 0L I1》 中 查 TU GEM EJ IGULU 这 个 动 词 词 干 , 在 《 T 0L I1》 中 没 有 这 个 词 干 , 它 就 去 掉 U (规 则 中 能 够 识 别 这 种 连 结 元 音 ) 再 去 看 词 尾 GUL , 判 断 到 第 三 步 , 系 统 肯 定 有 GUL 这 种 动 词 词 尾 , 而 且 其 前 面 的 词 干 必 须 是 动 词 , 查 词 典 《 T 0L I1》 的 结 果 肯 定 了 TU GEM EL J I 是 动 词 , 这 样 一 直 生 成 到 TU GEM EL J IGULU GD E, 并 确 定 其 为 动 词 词 干 , 系 统 自 动 识 别 JE I 为 动 词 构 形 词 尾 , 其 前 面 给 加 一 个 “ ” 符 号 。 自 动 切 分 的 具 体 步 逐 : 我 们 在 进 行 自 动 切 分 时 按 先 易 后 难 , 先 名 后 动 , 先 机 后 人 的 原 则 , 把 自 动 切 分 词 尾 大 致 分 为 三 类 : 第 一 类 是 不 需 要 复 杂 的 语 法 条 件 和 生 成 规 则 , 形 式 上 不 与 其 它 词 类 词 或 词 尾 混 淆 的 词 尾 , 其 中 首 先 要 解 决 与 词 干 或 附 加 成 分 连 写 的 一 部 分 语 气 词 (用 & 分 开 )、 与 词 根 连 写 的 格 附 加 成 分 (用 - - 分 开 )、 与 格 附 加 成 分 分 开 写 的 形 容 词 构 词 附 加 成 分 H I, H IN (用 = 连 结 )等 , 如 , 切 分 前 切 分 后 ·65· 内 蒙 古 大 学 学 报 (人 文 社 会 科 学 版 ) 1997 年 第 2 期 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 判 断 YABV 是 动 词 词 干 , 所 以 其 后 的 HV 是 动 词 词 尾 , 应 该 切 分 。 而 LON G 不 是 动 词 词 干 , 所 以 其 后 面 的 HV 并 非 动 词 词 尾 , 不 应 该 切 分 。 第 二 种 是 有 些 词 尾 在 大 多 数 情 况 下 可 以 从 词 尾 的 形 式 本 身 判 断 , 但 在 少 数 情 况 下 , 与 其 它 词 类 词 形 式 上 相 同 。 这 时 就 用 专 门 词 典 - 《 AD T 》 、 《 H IT 》 - 来 进 行 判 断 。 如 动 词 词 尾 - DA G 2, 在 YABVDA G (常 走 ) , V JED EG (常 看 ) 等 情 况 下 , 以 词 尾 本 身 的 形 式 就 可 以 识 别 (当 然 包 括 其 词 干 为 动 词 这 一 条 件 )。 但 在 SVNDA G (易 变 长 , 松 紧 带 )、 JA GVDA G (常 咬 , 钳 子 )等 少 量 词 中 只 从 形 式 上 不 能 区 别 相 对 的 名 词 和 动 词 。 判 断 这 类 词 尾 时 有 两 个 步 骤 , 首 先 从 带 DA G 的 《 H IT 》 中 查 找 , 如 果 没 有 , 可 识 别 为 动 词 词 尾 , 如 果 有 , 就 采 用 人 机 对 话 的 方 式 进 行 判 断 。 第 三 类 , 这 类 词 尾 在 大 部 分 情 况 下 无 法 用 词 干 、 词 尾 本 身 形 式 和 条 件 判 断 是 否 为 构 形 词 尾 , 只 能 根 据 其 前 后 词 的 搭 配 来 判 断 (这 类 并 不 多 ) 或 在 大 部 分 情 况 下 是 以 人 机 对 话 的 方 法 来 识 别 、 切 分 。 如 - GA C I2这 个 形 式 可 能 是 动 词 构 形 词 尾 , 也 可 能 是 名 词 构 词 词 尾 。 在 识 别 该 词 尾 时 首 先 看 其 后 有 无 格 附 加 成 分 (标 志 是 有 中 线 - ) , 如 果 有 , 就 是 名 词 。 如 果 没 有 , 可 能 是 动 词 词 构 形 词 尾 , 也 可 能 是 名 词 构 词 词 尾 。 如 : H 0LB 0GA C I 这 个 词 在 其 前 后 没 有 明 显 标 志 的 时 候 可 能 是 动 词 “ 连 结 ” 的 祈 使 式 , 也 可 能 是 名 词 “ 联 络 员 ” , 这 种 情 况 下 只 好 采 取 人 机 对 话 的 形 式 , 通 过 人 工 判 断 , 在 前 一 种 情 况 下 切 分 成 H 0LB 0 GA C I , 在 后 一 种 情 况 下 则 不 应 切 分 而 保 留 原 形 。 以 上 三 种 类 型 的 词 尾 在 我 们 进 行 自 动 切 分 的 词 尾 中 分 别 占 约 10%、 70%、 20% , 这 说 明 该 系 统 对 80% 的 蒙 古 语 构 形 词 尾 能 够 完 全 自 动 切 分 。 其 余 20% 通 过 人 机 对 话 也 可 实 现 半 自 动 切 分 。 据 测 试 , 使 用 这 个 自 动 切 分 系 统 可 以 覆 盖 现 代 蒙 古 语 各 类 文 本 的 95% 以 上 。 三 本 文 介 绍 的 蒙 古 文 词 根 、 词 干 、 词 尾 的 自 动 切 分 系 统 虽 然 取 得 了 一 定 的 效 果 , 但 还 需 要 进 一 步 改 进 : (1)进 一 步 对 各 种 词 类 的 大 多 数 构 词 词 尾 实 现 自 动 生 成 和 识 别 。 这 一 工 作 , 我 们 已 着 手 进 行 , 并 且 对 一 些 动 词 、 名 词 的 派 生 已 实 现 了 自 动 生 成 。 如 A J ILLA (工 作 , 名 ‘ 动 )、 A J IL C IN (工 人 , 名 ‘ 名 )、 BA Y IGVLVL TA (建 设 , 动 ‘ 名 ) 等 词 ,《 词 典 》 只 收 入 其 词 根 , 而 由 其 派 生 的 各 类 派 生 词 则 由 生 成 规 则 自 动 生 成 , 识 别 。 (2) 用 统 计 学 方 法 、 语 料 库 知 识 获 取 技 术 更 加 缩 小 以 人 机 对 话 方 式 切 分 的 范 围 , 这 项 工 作 我 们 将 作 为 日 后 研 究 的 重 点 。 研 制 本 系 统 的 工 作 , 是 在 内 蒙 古 大 学 确 精 扎 布 教 授 的 直 接 领 导 下 完 成 的 , 并 且 确 精 扎 布 教 授 负 责 设 计 了 大 部 分 语 法 条 件 。 系 统 的 程 序 由 内 蒙 古 大 学 蒙 古 语 文 研 究 所 华 沙 宝 副 教 授 编 写 。 该 研 究 所 计 算 语 言 学 研 究 室 的 同 志 们 不 同 程 度 地 参 加 了 这 项 工 作 。 (收 稿 日 期 : 1996 年 4 月 22 日 ) [责 任 编 辑 彩 娜 ] ·75· 那 顺 乌 日 图 蒙 古 文 根 、 词 干 、 词 尾 的 自 动 切 分 系 统 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net