章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
“什么不同之处?”
这次急着追问的人,
竟然是一向眼高于顶的徐晓瑞。
叶伟航看他一眼,继续说:
“大多数棋谱数据基本都有最重要的标注——棋谱的对弈双方,最后谁输谁赢。这样,Deepmind对任何一个棋谱数据中,哪一方的操作更好就天然拥有一个基本判断。”
“以这个判断作为基础,自然就可以对模型进行有监督训练,告诉他应该更倾向于向下棋两边的那一边学习。”
“而聊天机器人的研究对象是我们预处理后得到的海量文本数据,则完全没有这种标注,除非耗费大量的人工来一一识别打分,否则我们不可能知道哪一段文本更好,哪一段聊天质量更差。”
“在这种情况下,使用无监督学习进行深度神经网络训练,是明显更合理的。”
小会议室里沉默了好一会,所有人花了几秒钟理解叶伟航的这段解说。
很快。
【源点+0.005】
……
这种对深度学习和人工智能超越时代的认识,
让祝闲云眼睛放出光来,
他根本顾不得其他人能不能听懂:
“好!这个理解,太棒了。继续,你接着说。”
叶伟航环视一圈,发现吴云霞托着腮,一副似懂非懂的样子,
徐晓瑞皱着眉头,眼神都没聚焦;
李大路和徐晓瑞的另外一个室友则都张大了嘴,一副懵逼的表情,
看起来完全没听明白。
不过这两个货又提供不了源点。
倒不用着急这时候就向他们解释。
他在白板上画下第三个并列的方框,顺势拍起祝闲云的马屁来:
“接下来的步骤,以教授您对人工智能的理解,肯定已经想到了。没错,就是监督学习。”
“在海量的无标注文本数据之后,现在我们的机器人,差不多是一个背下了海量知识,却不能分辨好坏的小孩。”
“如果我们问他一个答不上来的问题,他会怎么样呢?”
李大路抢答:
“告诉我们他不能回答?”
他这话顿时让其他几个人全都笑了。
吴云霞向他解释:
“直接通过深度学习训练出来的人工智能绝对不可能这样回答问题的。人类甚至很难通过一些规则来限制他,把某些问题定义成他“不懂”的问题,一旦碰到就输出“我不懂”这样的回答。因为,深度神经网络模型对人类来说完全是个黑箱子,纠正了人类想让他回答“不懂”的问题,会让其他你根本想不到的地方出现更大的偏差。。”
叶伟航补充:
“而且,没有任何专家是全知全能的,这样做还会锁死人工智能的上限,最多就是达到请来的专家的水平。试想,如果Alphago是用这种方法训练的,那么它怎么可能吊打围棋世界冠军呢?”
“事实是,在面对不懂的问题,完成了第二步训练的机器人可能编造各种答案来糊弄我们,也可能爆出几句CTMD之类的经典国骂。”
“各位,想象一下,在NeurlPS大会上,面对各国的专家和领导,我们的机器人在被刁难的时候来一堆“Fxxk”“Shxx”“问你玛,我是你爸爸。”之类的回复。那场面,该有多酸爽。”