总结起来就是中文词与词之间间隔不明确,而且词汇太多
比如你对着麦克风说了一句话:
WHAT HAPPENED TO DIMITRI?! Fire Emblem Three Houses Character Analysis
然后语音识别程序会将这段话中的音标识别出来
wɒt ˈhæpənd tuː diːˈmiːtri?! ˈfaɪər ˈɛmbləm θriː ˈhaʊzɪz ˈkærɪktər əˈnæləsɪs
然后程序开始判断某段音标最可能是什么。因为其他单词在词库里都有(常用的英文单词就几千个),于是程序很快就给出了答案
WHAT HAPPENED TO ??? Fire Emblem Three Houses Character Analysis
然而程序的词库里并没有Dimitri(帝弥托利)(其实是有的,就假装他没有),于是程序给出了一个模棱两可的回答
WHAT HAPPENED TO Dim Iteration Fire Emblem Three Houses Character Analysis
然而这并不会对理解有太大影响,因为整句话里只有红色部分是错误的
然后你又对着麦克风说了一句话
在帝弥托利身上发生了什么?让我们来分析火焰纹章风花雪月的角色
语音识别程序会将这段话中的拼音识别出来
zài dì mí tuō lì shēn shàng fā shēng liǎo shén me ? ràng wǒ mén lái fēn xī huǒ yàn wén zhāng fēng huā xuě yuè de jiǎo sè
首先,我们就遇到了一个很大的难题:分词。汉语中的文本是连着读出来的,不像英文有相对明确的界限。
然后程序开始判断某段拼音最可能是什么。但是由于常用的中文词组太多了(一般大学本科生,汉字4千。词汇合计2-3万左右),程序很难给出答案:
在 低迷 脱粒 身 上 发生 了 什么 让我们来分析火焰 文章 风华 血 月 的角色
甚至可能分词都分不对:
在地 醚 脱粒 身 上 发生了 什么 让我们来分析火焰 文 张锋 花 薛岳 的 角色
然后最后识别出来就只能看懂个锤子了
PS 这里其实还有一个问题,风花雪月的常用度比three和houses低得多
上一篇:
吐槽,大航海家4这系列游戏真难下一篇:
飞智出了个带屏幕的手柄