上一次AI这么火,还是阿尔法狗的时候,六七年过去了,这次AI的热度更高了,不止反映在无休止的新闻讨论上,热度还进一步推高到股市炒作上。


做为7年的AI从业者,正好经历这两波AI话题,聊聊自己的想法。


我们说的AI,除了偏技术和2B的机器学习等领域,对于消费者可感知的,一般指的视觉+语音。


视觉比较成熟了,但是语音一直还是智障状态。


语音交互的听-想-说环节,听(ASR语音识别)、说(TTS语音合成) 都在几年前做到了图灵测试的程度,也就是超过人类的准确率,但“想”的环节(NLP)一直没得到突破.......


从体验上来说,耳朵再灵光、嘴巴再会巴巴、没有脑子一样歇菜,这是过去语音智障的原因。


相关内容

回顶部