上一次AI这么火,还是阿尔法狗的时候,六七年过去了,这次AI的热度更高了,不止反映在无休止的新闻讨论上,热度还进一步推高到股市炒作上。
做为7年的AI从业者,正好经历这两波AI话题,聊聊自己的想法。
我们说的AI,除了偏技术和2B的机器学习等领域,对于消费者可感知的,一般指的视觉+语音。
视觉比较成熟了,但是语音一直还是智障状态。
语音交互的听-想-说环节,听(ASR语音识别)、说(TTS语音合成) 都在几年前做到了图灵测试的程度,也就是超过人类的准确率,但“想”的环节(NLP)一直没得到突破.......
从体验上来说,耳朵再灵光、嘴巴再会巴巴、没有脑子一样歇菜,这是过去语音智障的原因。