设置

关灯

第四六零章 圈子网=疯子网?

    智能语音拼写软件肯定需要一个大的词汇库。
    那样的词汇库,并不是单单指文字的词汇库,更重要的每一个字在各地的普通话中可能出现的地方口音。
    比如普通话大部分中国人会说,但是真正说得标准的人并不占得标准。另外有很多字是多音字,语音拼写又必须兼顾效率和准确。
    所以一个庞大的词汇库是肯定很需要的。而这个数据库因为涉及到音轨数据,数据量也比文字要大得多。
    那最好是利用一个云计算技术进行解决。将全国所有人针对各个词组的口音和错误方式都收集起来。甚至是可以用方言进行创作。
    所以这个智能语音拼写软件,唐浩泽真心不是很很急。其实也急不来。
    不过该做的,也应当提前做起来。
    他提议说:“我们可以邀请用户录制我们指定的文章音轨文件。参与的人,可以在网站上给予一定的奖励。”
    向子荣听他这话,也明白他话里所指。他皱眉说:“如果通过那样收集数据模板。我们的工作量会很大。”
    “反正我们也不急于求成。收集到足够的数据后,在综合分析并且建立模板。”
    向子荣想了想,说:“好,我回去让人选择几篇合适的
 <本章未完请点击"下一页"继续观看!>